반응형
Abstract
- 이미지를 빠르고 정확하게 처리하는 객체 검출기. (주로 얼굴 감지)
- 머신러닝 방식.
- 세 가지 주요 특징.
- 통합 이미지(Integral Image) : 특징을 빠르게 계산
- AdaBoost 기반의 훈련 알고리즘 : 특징 가운데 객체 검출에 필요한 중요 특징만 선택.
- Cascade 구조 : 여러 분류기를 결합.
Features
- feature 기반 검출 시스템은 픽셀 기반 시스템보다 빠르다.
- Haar-like 필터를 사용하여 features를 추출한다.
- Haar feature = 흰색 영역에 있는 모든 픽셀 값의 합 - 검은색 영역에 있는 모든 픽셀 값의 합
- (a) 필터 : 좌우 방향으로 특징을 추출.
- (b) 필터 : 상하 방향으로 특징을 추출.
- (c), (d) : 각각 대각선, 가운데 영역의 특징을 추출.
- 다양한 필터를 사용해서 객체의 경계를 찾는다.
Integral Image
- 본 논문에서는 24x24 해상도인 이미지를 사용하는데 필터를 활용해 구한 feature가 180,000개 이상 나온다. 이는 상당한 개수.
- 통합 이미지(integral Image)는 이 연산 수를 확 줄여준다.
- 필터 크기가 n x m 인 feature 값을 구하려면 n x (m-1) 번의 덧셈이 필요하다.
- 통합 이미지는 n x m 크기의 필터 내부 값의 합을 n행 m열에 저장하여 만든다.(아래 그림 참고)
- 이런 식으로 통합 이미지를 만들어서 사용하면, Haar 필터로 feature 값을 구 할 때 여러 번 덧셈할 필요가 없다.
- D 영역에 해당하는 feature를 필터를 통해 구한다고 하면. location4 - location2 - location3 + location1을 하면 된다. (3번 연산)
- Image I의 feature 값을 구하기 위해 (124 + 111 + 123 + … + 122 + 130) 연산을 하지 않아도 미리 만든 integral Image II의 (IIp - IIq - IIs + IIr)만 연산하면 된다.
- Haar 필터를 사용한다고 했을 때 위 그림처럼 7번의 연산으로 feature 값을 구할 수 있다.
Learning Classification Functions
- Haar 필터를 활용해 추출한 feature는 180,000개 이상이다.
- 통합 이미지를 사용해 각 feature는 빠르게 계산할 수 있지만, 전체 feature를 모두 계산하기엔 오래 걸린다.
- 수많은 feature 중, 중요 feature를 찾는 것이 중요하다.
- feature 분산에 기초한 feature 선택 방법 제안.
- Winnow 지수 퍼셉트론 학습 규칙에 기초한 feature 선택 방법 제안.
- AdaBoost에 의해 2가지 필터가 선택된다.
- 눈과 볼의 경계를 검출하는데 첫 번째 필터 사용.
- 눈 사이를 검출하는데 두 번째 필터 사용.
The Attentional Cascade
- 여러 분류기를 직렬로 연결해 계산 시간을 줄이면서 검출 성능을 높이게 구성하는 방식.
- 앞 단에 있는 단순한 분류기는 Negative exaple 상당수를 버린다. 이렇게 초반 Negative example들을 버려줘 뒤이어 복잡한 분류기가 다시 처리할 필요가 없다.
- 각 분류기마다 feature가 많으면 성능이 좋지만, 시간이 오래 걸림. (Trade-off)
Results
반응형