DeViSE:A Deep Visual-Semantic Embedding Model
·
DeepLearning/Zero-Shot
Abstract비전 인식(vision recognition)은 카테고리 수가 증가함에 따라 라벨이 붙은 이미지 학습 데이트를 확보하기 매우 어려움이에 대한 해결 방안으로 본 논문에서는 주석이 없는 텍스트에서 추출된 의미적(semantic) 정보를 함께 활용하여 객체를 인식하도록 학습된 새로운 Deep Visual-Semantic Embedding 모델을 제안1000개 클래스를 구분하는 ImageNet 객체 인식 챌린지에서 당시 SOTA 모델과 동등한 성능을 달성또한 오답을 예측하더라도 좀 더 의미적으로 타당한 오답을 예측 Introdction기존 비전 인식 시스템의 한계기존 비전 인식은 N-Way 이산 분류로 이미지를 정해진 N개의 클래스로만 할당하여 문제를 해결이러한 방식은 N개의 범주를 넘어서 시스템..
Zero-Shot Learning Through Cross-Modal Transfer 리뷰
·
DeepLearning/Zero-Shot
Abstract본 논문에서는학습 데이터가 전혀 없는 객체라도 이미지에서 인식할 수 있는 Zero-Shot Learning(ZSL) 모델을 제안학습 데이터가 풍부한 클래스에 대해서는 SOTA 수준의 성능을 달성, 동시에 학습 데이터가 없는 클래스에 대해서도 합리적인 성능을 보임먼저 의미 공간(semantic space)에서의 이상치 탐지를 수행한 뒤, 두 개의 분리된 인식 모델을 사용하는 방식으로 달성또한 수작업으로 정의된 의미적 특징이 전혀 필요로 하지 않는다는 장점 1. Introduction현실 세계에는 라벨이 없는 데이터가 매우 풍부하며, 새로운 제품이나 기술의 등장으로 인해 기존에 학습되지 않은 시각적 범주가 지속적으로 생성된다. 이러한 환경에서 기존의 지도학습 기반 분류기는 학습된 클래스만 예측..
woongs_93
'zero-shot' 태그의 글 목록