AI/Computer Vision 4

[Computer Vision] 시맨틱 분할 (Semantic Segmentation)

객체 탐지는 경계 박스를 이용해 객체의 목록을 예측하는 것이었습니다. 하지만 경계 박스에는 객체 이외의 다른 객체가 중복될 수 있습니다. 특정 작업에서 이것은 중요한 문제가 될 수 있습니다. 시맨틱 분할(Semantic Segmentation)은 객체 탐지와 다르게 픽셀 단위로 레이블을 예측하는 방법입니다. 객체 탐지와 다른점은 같은 객체는 같은 색으로 분류된다는 점입니다. (양은 모두 주황색) 이와 유사하게 인스턴스 분할(Instance segmentation)은 각 객체를 따로 표현한것으로, 객체 탐지와 시맨틱 분할이 결합된 것입니다. 여기서 실제 픽셀값은 class값으로 예측됩니다. 이러한 시맨틱 분할은 의학 사진이나 자율 주행, 위성 이미지 등에서 많이 사용됩니다. 시맨틱 분할, 인스턴스 분할 모..

AI/Computer Vision 2023.06.25

[Computer Vision] 객체 탐지 (Object Detection)

객체 탐지(object detection)는 분류(classification)와 로컬라이제이션(localization)을 합친 것이라고 볼 수 있습니다. 즉, 객체의 위치를 바운딩박스(bounding box)로 찾고 분류하는 것입니다. 여기서 객체의 위치는 4개의 좌표를 사용하며, 이것은 회귀 문제와 같습니다. 따라서 객체 탐지는 이미지 분류, 좌표 회귀 분석 두 가지 작업이 필요합니다. 객체 탐지를 위해 좌표를 찾는 방법은 여러가지가 있습니다. 앞서 언급한 것처럼 회귀 분석을 사용할 수도 있고, 슬라이딩 윈도우(sliding-window) 알고리즘을 사용할 수도 있습니다. 하지만 회귀 분석은 실효성이 떨어지며, 슬라이딩 윈도우는 계산 측면에서 비효율적입니다. 따라서 좌표를 찾기 위해 영역 제안 기법을 ..

AI/Computer Vision 2023.06.19

[Computer Vision] 이미지 검색

기존 이미지 검색 방법 중 CBIR(Content-based Image Retrieval)은 쿼리 이미지를 입력받아 대상 이미지 데이터베이스에 있는 이미지들의 순위를 정해 출력합니다. CBIR은 비슷한 느낌의 이미지보다는 비슷한 색상의 이미지를 검색하는 느낌이 더 강합니다. 그렇기 때문에 사람의 눈으로 봤을 때 쿼리 이미지와 완전히 다른 이미지더라도 색이 비슷하면 출력에 포함됩니다. 따라서 딥러닝 모델을 이용하여 더 나은 이미지 검색을 할 수 있습니다. 이전 포스팅에서 딥러닝 CNNs을 이용하여 이미지 분류를 했던것처럼, 이미지 검색에도 적용해보겠습니다. 데이터셋은 The Oxford-IIIT Pet Dataset에서 다운로드 후 사용하면 됩니다. 데이터셋은 37개의 클래스로, 총 7390개의 데이터로 ..

AI/Computer Vision 2023.06.16

[Computer Vision] 이미지 분류

딥러닝을 이용한 이미지 분류는 보통 CNNs을 사용합니다. CVPR(Computer Vision and Pattern Recognition)의 최신 연구 동향을 보면 CNNs 보다 Transformers, Radiance Fields, Diffusion 모델 등을 더 많이 사용하고 있으나, CNNs은 컴퓨터 비전의 가장한 중요한 요소이므로 반드시 숙지해야 합니다. CNNs을 이용한 이미지 분류는 단순히 컨볼루션 레이어를 사용하여 이미지의 feature를 추출하고 출력층을 분류 class 개수로 설정하면 됩니다. CNNs의 내부는 conv, maxpool, dropout, flatten 등을 사용할 수 있으며 conv과 flatten은 필수입니다. flatten을 사용하는 이유는 이미지의 다차원 데이터를 ..

AI/Computer Vision 2023.06.15