오늘의 TIL

여러 이미지 처리 신경망의 성공 이유

AlexNet

인셉션 모듈
다양한 특징을 추출하기 위해 NIN의 구조를 확장하여 복수의 병렬적인 컨볼루션 층을 가집니다.
NIN 구조
기존 컨볼루션 연산을 MLPConv 연산으로 대체 (커널 대신 MLP와 활성함수를 이용)
커널로 부분 정보를 가져오고 내적 대신 비선형 연산을 통해 feature를 추출하는 방식
완전 연결층 사용 지양
완전 연결층이 마지막 1개 밖에 없음
보조분류기 사용
중간중간 분류기를 추가해서 오류 역전파 결과를 결합 경사 소멸 문제를 완화시킵니다.

residual learning 입력을 연산된 결과와 연결시켜 연결망이 학습한 부분을 더 신경쓰도록 만드는 기법 $y = \tau(F(x) + x)$
깊은 신경망도 최적화가 가능 단순 구조의 변경으로 매개변수 수에 영향 X
전역 평균 풀링 사용
batch normalization 적용

모델	학습 단계가 할 일	예측 단계가 할 일	지도 여부
분별 모델	$P(y \mid x)$ 추정	$f: x -> y$	지도 학습
생성 모델	$P(x)$ 또는 $P(x \mid y)$, $P(x, y)$ 추정	$f: 씨앗 -> x$ 또는 $f: 씨앗, y -> x$, $f: 씨앗 -> x,y$	비지도학습

생성모델은 데이터를 추론하는데 집중합니다.

생성기 G(generator)와 분별기 D(discriminator)의 대립 구도