컴퓨터 비전(Computer Vision)은 컴퓨터공학의 한 분야로, 쉽게 말하면 컴퓨터가 시각적 데이터를 보고 이해하고 분석할 수 있도록 하는 분야다. 컴퓨터 비전을 통해 컴퓨터로 이미지 분류(Image classification), 얼굴 인식(Facial recognition), 객체 탐지(Object detection) 등을 수행할 수 있다. 컴퓨터 비전(Computer Vision)의 분야는 크게 이미지를 대상으로 하는 content recognition 과제와 영상을 대상으로 하는 Video analysis 과제로 나눌 수 있다. 그럼 각 분야의 과제를 하나씩 살펴보자.
Content recognition
1) 이미지 분류(Image Classification)
이미지 분류(Image Classification)은 컴퓨터 비전 분야의 주요 과제 중 하나다. 2012년부터 큰 성과를 보인 AI 분야의 과제 중 하나라고 할 수 있다. 이미지 분류(Image Classification)은 이미지를 미리 정의된 클래스로 한다. 위 사진을 예로 들자면, 이미지를 보고 비행기, 자동차, 새, 고양이 등으로 분류하는 식이다. 이미지 분류(Image Classification)에서 모델은 이미지를 픽셀 단위로 분석한다. 이때 이미지에서 중요한 피처(Feature)를 가진 부분들로 분리하고 그 부분을 최종 분류기(Classifier)로 보내는 것이다.
이미지 분류(Image Classification)은 다양한 응용 분야를 가진다. 제품 검수 자동화와 불량 검수, 피부암 분류 등이 그 예시다.
2) 객체 인식(Object Identification)
객체 인식(Object identification)은 이미지에서 특정한 객체를 인식해내는 것이다. 이는 이미지에서 비슷한 객체를 묶는 일종의 클러스터링 알고리즘이라고도 할 수 있다.
3) 객체 탐지(Object Detection/Localization)
객체 탐지(Object detection)은 이미지에서 객체를 찾는 문제다. 이는 얼굴 인식과 같은 더 발전된 문제를 해결하는데 선행 과제가 된다. 객체 탐지(Object detection) 기술은 보안에서 위험 감지하는 기술, 의료 기술 탐지 등에서 사용된다.
4) Object and instance segmentation
Object Segmentation은 이미지를 누끼를 뜨듯이 픽셀 단위로 객체를 나누는 과제다. 위 이미지처럼 Object segmentation은 픽셀마다 라벨을 부여하는 과제라고도 할 수 있다. Object segmentation은 의료 이미지 분석, 자율주행, 얼굴 인식 등에 활용된다.
5) Pose Estimation
Pose Estimation은 고정된 물체인지 아닌지에 따라 과제가 달라진다. 만약 객체가 선물 상자와 같이 고정된 물체라면, 물체의 x, y(위치), z(방향)을 추정하는 과제고, 사람처럼 고정되지 않은 물체라면 위 사진처럼 물체의 세부 부위들의 위치를 찾는 과제가 된다.
Video analysis
이번에는 영상 데이터를 대상으로 하는 컴퓨터 비전의 과제들을 알아보자. 영상 데이터는 이미지의 순서를 고려해야 한다는 특성이 있다.
1) Object Tracking
Object Tracking은 이미지나 영상의 흐름에서 객체를 탐지하고 분류하며 이를 계속 추적하는 것이다. Object Tracking은 AI/ML 분야에서 널리 쓰이고 있다. Object Tracking의 활용 예시에는 Amazon go와 같은 소매점과 자율주행 기술이 있다.
2) Action Recognition
Action Recognition은 이미지/비디오에서 어떤 행동을 하고 있는지 알아내는 과제다.
3) Motion Estimation
Motion Estimation은 영상에서 객체가 어떻게 움직이는지 알아내는 과제다.
참고
Overview of Computer Vision Tasks & Applications | by Youssef Hosni | Towards AI
'Data Science > AI' 카테고리의 다른 글
논문 리뷰 | Deep Knowledge Tracing (0) | 2023.03.29 |
---|---|
인공지능 주제 탐색 #0 | AI 분야 알아보기 (0) | 2023.03.23 |
인공지능 #Fin | 인공지능 기초 용어 정리 (1) | 2023.03.14 |
인공지능 #9 | 텍스트를 위한 인공 신경망(NLP, IMDB, LSTM, GRU) (0) | 2023.03.14 |
인공지능 #8-2 | CNN - 텐서플로 Conv2D, MaxPooling2D, plot_model (0) | 2023.03.13 |