2025/01/03 4

Semantic Segmentation

Semantic SegmentationSemantic segmentation- Pixel-wise로 각각의 Class를 예측하여 물체 Category 별로 분할- Category: 각 픽셀의 Label 예측 - Architecture: Backbone (Encoder) + DecoderObject Detection vs Semantic Segmentation사용 예시- 자율주행 - 의료 영상 진단Dataset - KITTI        - 차량 주행중 촬영된 자동차 및 사물 이미지 데이터        - Semantic Label이 있는 200개의 Train Set과 200개의 Test Set으로 구성- Cityscape       - 도시 거리 장면 이미지 데이터        - 50개의 도시의 다양..

Study/머신러닝 2025.01.03

Object Detection

Object DetectionObject Detection: 사물 각각의 Bounding Box (Bbox) 위치와 Category를 예측Bounding Box: {x0 , y0 , x1 , y1 } 예측, Category: 사물의 class label 예측Architecture: Backbone (CNN) + Decoder (Detection Head)Image Classification vs Object Detection - Image Classification: 이미지 내에 어떤 물체가 있는지 분류 - Object Detection: 이미지 내의 각 Bbox 마다 객체의 클래스 분류 및 Bbox의 위치 추론 Localization (Bbox Regression) - Localization: Boun..

Study/머신러닝 2025.01.03

Image Classification

Image ClassificationImage Classification: 컴퓨터 비전 분야에서 대중적인 taskArchitecture: Backbone (CNN) + Classification head (FC Layer)Logits & Softmax - Logits: 각 클래스에 대한 예측을 수치(실수값)로 나타내는 중간 단계 - Softmax 함수는 실수 전체의 범위를 가지는 logits을 지수 함수를 사용하여 클래스 간의 상대적 확률 (0 ~ 1 사이의 값) 계산 Data-driven 방식으로 큰 성공을 거둔 컴퓨터 비전 태스크 중 하나 Dataset - MNIST      - 0부터 9까지 10개의 클래스 이루어진 숫자 모음      - 28 x 28 grayscale 이미지      - 60k..

Study/머신러닝 2025.01.03

CNN

CNN (Convolutional Neural Network)Convolution Layer- 네트워크가 비전 태스크를 수행하는 데에 유용한 Feature들을 학습할 수 있도록 함- Filter(=Kernel): Input Image를 특정 크기의 Filter를 이용하여 탐색하면서 Convolution 연산을 시행하여 Filter 영역에 대한 특징을 추출 - Stride (S): Filter를 얼마만큼의 간격으로 움직이는 지를 나타냄 - Padding(P): Feature Map의 크기를 일정 수준으로 유지하기 위해서 임의의 값을 넣은 Pixel을 얼마나 추가했는지를 나타냄          - Zero Padding: 0으로 채운 Pixel을 주변에 채워 넣는 것Activation Function- 네트..

Study/머신러닝 2025.01.03