CNN(Convolutional Neural Network)은 이미지 분류를 위해 설계된 신경망으로, 여러 개의 컨볼루션 레이어를 통해 특징을 추출합니다.
이미지 분류는 주어진 이미지가 어떤 클래스에 속하는지를 판단하는 문제로, 미리 정의된 클래스 중 하나를 선택하는 과정을 포함합니다.
오브젝트 디텍션은 이미지 내에서 특정 객체를 식별하고 그 위치를 표시하는 기술로, 바운딩 박스를 사용하여 구현됩니다.
인스턴스 세그멘테이션은 이미지 내의 각 객체를 픽셀 단위로 구분하는 기술로, 더욱 정밀한 객체 인식을 가능하게 합니다.
이미지넷은 대규모 이미지 데이터셋으로, 이미지 분류 및 오브젝트 디텍션의 벤치마크로 널리 사용됩니다.
전통적 컴퓨터 비전 기술
시작 시간 07:10
전통적인 컴퓨터 비전 기술은 주로 수작업으로 특징을 추출하는 방식으로, 딥러닝 기법에 비해 성능이 떨어지는 경향이 있습니다.
알렉스넷은 2012년 ILSVRC에서 우승한 CNN 모델로, 깊이가 깊고 여러 개의 컨볼루션 레이어를 사용하여 이미지 분류 성능을 크게 향상시켰습니다.
딥러닝 모델의 성능을 개선하기 위해 다양한 학습 최적화 기법이 사용되며, 데이터 증강이나 정규화 기법이 포함됩니다.
VGG는 3x3 필터를 반복적으로 사용하는 구조로, 깊이를 증가시켜 더 많은 특징을 학습할 수 있도록 설계되었습니다.
구글넷은 인셉션 모듈을 도입하여 다양한 필터 크기를 동시에 적용함으로써 더 많은 정보를 효율적으로 처리할 수 있도록 한 CNN입니다.