[TIL] 21/02/23

오늘의 TIL

최대 1 분 소요

Photo credit: Unsplash

Byeongheon Kang

개발하는 직장인입니다.

오늘의 TIL

Oject detection 기술 요소 분석

영상안에 있는 모든 물체들과 그것들의 위치를 함께 찾는 것이 과제입니다.
기존 classification layer에 더해서 마지막에 detection layer를 병렬적으로 넣어줄 수 있습니다. 이 레이어는 해당 물체가 있는지, 물체의 중심은 어디인지 박스의 가로세로 픽셀은 몇인지를 판별합니다.
박스가 여러개가 나올 수 있기에 하나의 벡터로는 표현할 수 없고, 오브젝트의 개수에 따라 벡터가 여러개여야 합니다.

때에 따라 감당하기 힘든 연산량이 발생할 수 있습니다.

이를 해결하기 위해 제시된 방법은 다음과 같습니다.

Region Proposal: Object가 있을 만한 영역을 다수 추천
- 1x1 conv 레이어 활용
- CNN을 통과한 이후의 각 픽셀은 사진에서의 패치 하나를 나타내기 때문에 영역을 매칭시킬 수 있습니다.
- 해당 패치가 실제 ground truth 영역과 겹치는 비율을 통해 후보패치들을 먼저 찾아둡니다.
- 후보패치는 anchor box의 크기로 정합니다.
Non-max Suppresion: 겹치는 영역을 제거
Classification: 영역안의 물체 분류
Bounding Box Regression: 물체 영역을 미세조정

공유하기

Twitter Facebook LinkedIn

댓글남기기

참고

RankZephyr: Effective and Robust Zero-Shot Listwise Reranking is a Breeze! 논문 요약

15 분 소요

1. 연구의 배경과 현대 정보 검색의 도전 과제 1.1 정보 검색의 진화와 현재 현대 사회에서 정보 검색은 우리 일상의 핵심적인 부분이 되었습니다. 매일 수십억 건의 검색이 이루어지고 있으며, 사용자들은 점점 더 정확하고 관련성 높은 결과를 기대하고 있습니다. 이러한 상황에서 정보...

대형 언어 모델(LLMs)은 왜 무관한 문서를 ‘관련 있음’으로 잘못 판단할까?

7 분 소요

안녕하세요! 오늘은 대형 언어 모델(LLM)이 문서의 관련성을 어떻게 판단하는지, 그리고 왜 때때로 무관한 문서를 ‘관련 있음’으로 잘못 분류하는지에 대한 흥미로운 연구를 소개해 드리겠습니다.

대형 언어 모델(LLMs)은 사용자의 검색 선호도를 얼마나 정확히 예측할 수 있을까?

3 분 소요

안녕하세요! 오늘은 대형 언어 모델(LLMs)이 검색 엔진에서의 검색 결과 평가에 어떻게 활용될 수 있는지를 다룬 연구를 소개합니다. Microsoft 연구팀이 발표한 논문 “Large Language Models Can Accurately Predict Searcher Prefe...

[TIL] 21/06/29 임베딩

1 분 소요

오늘은 벡터 정보에 의미를 부여하는 방법인 임베딩에 대해서 공부했습니다.