오늘의 TIL
Oject detection 기술 요소 분석
-
영상안에 있는 모든 물체들과 그것들의 위치를 함께 찾는 것이 과제입니다.
-
기존 classification layer에 더해서 마지막에 detection layer를 병렬적으로 넣어줄 수 있습니다. 이 레이어는 해당 물체가 있는지, 물체의 중심은 어디인지 박스의 가로세로 픽셀은 몇인지를 판별합니다.
-
박스가 여러개가 나올 수 있기에 하나의 벡터로는 표현할 수 없고, 오브젝트의 개수에 따라 벡터가 여러개여야 합니다.
때에 따라 감당하기 힘든 연산량이 발생할 수 있습니다.
이를 해결하기 위해 제시된 방법은 다음과 같습니다.
- Region Proposal:
Object가 있을 만한 영역을 다수 추천
- 1x1 conv 레이어 활용
- CNN을 통과한 이후의 각 픽셀은 사진에서의 패치 하나를 나타내기 때문에 영역을 매칭시킬 수 있습니다.
- 해당 패치가 실제 ground truth 영역과 겹치는 비율을 통해 후보패치들을 먼저 찾아둡니다.
- 후보패치는 anchor box의 크기로 정합니다.
- Non-max Suppresion: 겹치는 영역을 제거
- Classification: 영역안의 물체 분류
- Bounding Box Regression: 물체 영역을 미세조정
댓글남기기