컴퓨터 비전 모델 구조

Study/컴퓨터비전 CV

김 도경 2024. 12. 23. 15:40

Backbone

모델의 구성

Decoder
- 모델의 쓰임새에 따라 다양한 비전 태스크가 존재
- 압축된 Feature를 목표하는 태스크의 출력 형태로 만드는 과정을 수행

- Backbone은 입력 이미지에서 유의미한 Feature를 추출한 뒤 압축하는 역할이므로, 태스크 종류가 다르더라도 동일한 Backbone을 사용
- Decoder의 경우에는 최종 결과를 출력해주는 역할이므로, 비전 태스크가 바뀐다면 올바른 형태로 결과를 산출할 수 있도록 디코더 구조를 변경

- Classification
- Fully Connected Layer (FC Layer): 한 layer가 다음 layer와 완전히 연결되어 있는 layer로, 이미지 분류 모델에서 Decoder의 역할로 사용
- Softmax: 입력 받은 값을 모두 [0,1] 사이로 정규화 시켜주는 함수를 말함. 이를 통해 Decoder의 출력물을 각 클래스에 해당할 확률로 나타낼 수 있게 됨

- Detection

- Segmentation
Encoder
- 일부 모델들의 경우 Backbone 이후에 Encoder를 도입하여 Feature와 Image Patch들 사이의 관계를 학습

Image Classification (1)	2025.01.03
CNN (1)	2025.01.03
Computer Vision-고전 컴퓨터 비전 (0)	2024.12.23
Computer Vision_Classification (5)	2024.12.23
Computer Vision (0)	2024.12.23

개발 성장 노트

Upstage AI Lab 5기와 코딩관련 공부에 대해서 기록을 하기 위한 블로그입니다.

부트캠프, 업스테이지패스트캠프, 패스트캠퍼스, 머신러닝, LLM, 국비지원취업, 국비지원, 경진대회, cv, ai 부트캠프, 패스트 캠퍼스, 패스트캠퍼스AI부트캠프, 패스트캠퍼스업스테이지부트캠프, 인공지능, 자연언어처리, 패스트캠프업스테이지에이아이랩, 패스트캠퍼스업스테이지에이아이랩, 딥러닝, UpstageAILab, 업스테이지패스트캠퍼스,

개발 성장 노트