오늘의 TIL

 

 

Oject detection 기술 요소 분석

  • 영상안에 있는 모든 물체들과 그것들의 위치를 함께 찾는 것이 과제입니다.

  • 기존 classification layer에 더해서 마지막에 detection layer를 병렬적으로 넣어줄 수 있습니다. 이 레이어는 해당 물체가 있는지, 물체의 중심은 어디인지 박스의 가로세로 픽셀은 몇인지를 판별합니다.

  • 박스가 여러개가 나올 수 있기에 하나의 벡터로는 표현할 수 없고, 오브젝트의 개수에 따라 벡터가 여러개여야 합니다.

때에 따라 감당하기 힘든 연산량이 발생할 수 있습니다.

이를 해결하기 위해 제시된 방법은 다음과 같습니다.

  • Region Proposal: Object가 있을 만한 영역을 다수 추천
    • 1x1 conv 레이어 활용
    • CNN을 통과한 이후의 각 픽셀은 사진에서의 패치 하나를 나타내기 때문에 영역을 매칭시킬 수 있습니다.
    • 해당 패치가 실제 ground truth 영역과 겹치는 비율을 통해 후보패치들을 먼저 찾아둡니다.
    • 후보패치는 anchor box의 크기로 정합니다.
  • Non-max Suppresion: 겹치는 영역을 제거
  • Classification: 영역안의 물체 분류
  • Bounding Box Regression: 물체 영역을 미세조정

태그:

카테고리:

업데이트:

댓글남기기