배경
CNN 이전
CNN이란
Convolution 기법을 사용하여 이미지의 공간정보를 유지한채 학습을 하는 방법
convolution 기법: 특정한 패턴이 있는지 필터(박스)로 훑으며 마킹. 이러한 필터들이 쌓이며 복잡한 필터가 됨
이를 위해 CNN에서는 필터, 스트라이드, 패딩, 풀링의 개념을 활용
필터: 이미지를 순회하며 이미지의 특징을 추출(피처맵)함.
피처맵은 필터와 유사한 이미지의 영역을 강조(필터와 이미지의 내적)했다고 보면 됨
필터는 가중치가 공유되기 때문에 효율적인 계산을 할 수 있게 됨(파라미터는 적지만, 비슷한 특성을 한 번에 찾아낼 수 있음)
→ 예를 들어, 한 이미지에 여러 명이 같이 있을 때(코가 여러 개 있음), 코 영역을 강조한 필터가 지나갔다면, 모든 코 영역은 비슷하게 값이 높을 것임.
스트라이드: filter를 찍고 다음 위치로 옮길 때의 이동 거리
패딩 : 커널 크기에 따라 가장자리 정보가 버려지는 문제를 해결하기 위한 것(feature map의 크기를 조절할 수 있음)
풀링 : 이미지의 주요 특징만 뽑아 내고, 이미지 크기를 조절하는 것
질문