2025/01/09 8

적대적 생성 신경망(Generative Adversarial Networks)

적대적 생성 신경망 (Generative Adversarial Networks) 적대적 생성 신경망 (Generative Adversarial Networks, GANs) - Generative (생성) / Adversarial (적대적) / 신경망 (Networks) - 적대적으로 학습하는 신경망들로 구성되며, 생성 모델로써 활용함생성 모델 관점에서의 VAE와 GANs의 차이- VAE의 생성 방식: 입력 분포를 근사하는 과정에서 규제 (Regularization)을 주며 데이터를 생성 - GANs의 생성 방식: 생성된 데이터와 실제 데이터를 판별하고 속이는 과정을 거치며 생성 모델을 개선 GANs 구조- 데이터를 생성하는 생성 모델 (Generator)과 데이터의 진위를 구별하는 판별 모델 (Discr..

Study/머신러닝 2025.01.09

컴퓨터 비전 첫 도전기: 경진대회에서 배운 것들

CV가 도대체 무엇인지도 모르는 제가 CV 경진대회에 참여를 했고,첫 도전이 마무리 되었습니다. 마무리를 하고 나서도 생각을 하고 좀 남기고 가고 싶은 게 많아서,이렇게 경진대회 후기를 조금 늦게 작성을 하게 되었어요.강의도 조금 미뤄두고...CV경진대회 정리를 하였고, 아직 조금 더 남은 것 같지만 후기를 작성해볼까해요. CV가 도대체 무엇인지도 몰랐던 저의 CV 경진대회 후기입니다! CV 경진대회다양한 종류의 문서 이미지의 클래스를 예측 computer vision에 있어서 아무것도 몰랐던 제게는 정말 큰 산이었고,이번에 팀장이 되면서 더 무거웠던 경진대회입니다. 팀장이지만 앞서서 진행하지 못하고 오히려 팀원들에게 따라갔지만,저 스스로는 공부한 게 많았던 경진대회에요:)데이터 EDA메타 데이터 확인데..

Generation-오토 인코더

오토 인코더오토 인코더 (Autoencoder, 1987)- 입력 데이터의 패턴을 학습하여 데이터를 재건하는 모델    - 비선형 차원 축소 기법으로 활용 가능 오토 인코더의 구조- 인코더(Encoder): 데이터를 저차원 잠재 표현으로 요약 - 디코더(Decoder): 저차원 잠재 표현으로부터 데이터를 재구성(Reconstruction) - 손실 함수: 잠재 표현으로부터 복구한 데이터와 입력 데이터의 평균제곱오차(MSE) 디노이징 오토 인코더- 입력 데이터에 랜덤 노이즈를 주입하거나 Dropout 레이어를 적용- 노이즈가 없는 원래 데이터로 재구성- 디노이징 오토 인코더의 원리      - 안개 속에서 멀리 있는 물체를 구별하려면? 데이터의 특성들을 더욱 정확히 학습함      - 노이즈에 강건한 잠..

Study/머신러닝 2025.01.09

Generation-생성 모델 평가지표

판별모델의 평가 지표범주형 데이터를 활용하는 판별 모델의 평가 지표 - 분류 문제에서는 주어진 데이터에 대해 범주를 얼마나 잘 맞췄는지에 대해 평가 - 직관적인 개념인 정확도 (Accuracy)를 많이 활용 - 문제 상황: 각 클래스별 데이터가 불균형한 경우에 정확도만으로 평가할 수 없음 - 해결 방안: 정밀도 (Precision), 재현율 (Recall), F-점수 (F-score) 등 다른 지표를 통해 정확도의 단점을 보완연속형 데이터를 활용하는 판별 모델의 평가 지표 - 회귀 분석에서는 실제 값과 모델이 예측한 값의 차이를 기반으로 평가- 대표적으로 평균 제곱 오차 (Mean Square Error, MSE), 평균 절대 오차 (Mean Absolute Error, MAE)가 있음- 문제 상황: 주..

Study/머신러닝 2025.01.09

Generation-생성 모델

생성모델의 발전 과정고전 생성 모델- 생성 모델 (Generative models)    - 데이터는 저차원의 필수적인 정보로부터 생성 가능하다는 가정하에 분포를 학습, 새로운 데이터를 생성- 확률 분포 추정과 근사     - 가우시안 혼합 모델 (Gaussian Mixture Model, GMM, 1981) : 여러 개의 정규 분포      - 제한된 볼츠만 머신 (Restricted Boltzmann Machine, RBM, 1985) : 볼츠만 분포      - 심층 신뢰망 (Deep Belief Network, DBN, 2006) : 여러 층의 RBM      - 자기 회귀(Autoregressive Distribution Estimator, NADE, 2011) : 자기 회귀 기반의 생성 모델 ..

Study/머신러닝 2025.01.09

CV 모델 성능 높이기

데이터EDA (Exploratory Data Analysis)- EDA (탐색적 데이터 분석)는 데이터를 다양한 각도에서 살펴봄- 시각화 및 통계 분석을 통해 데이터 구조, 패턴, 이상치 등을 먼저 파악해보는 과정 - 이미지 및 object의 분포 파악- 이미지의 다양성 확인- 이상치 및 noise 종류 파악- 다양한 형태의 object가 등장하는지 - Occlusion이 많은 데이터인지- 각 이미지의 noise 정도가 대략 어느정도인지Augmentation - EDA를 기반으로 적절한 augmentation 기법 선정 및 학습 과정에 적용- 데이터 증가: 샘플 개수 및 다양성을 추가하여 overfitting을 방지하고 generalization 능력 향상 - Robustness 향상: 실제 세계에서의 ..

CV 트렌드

CV 주요 연구Generative Model & Stable Diffusion - 생성형 모델은 GAN에서부터 점차 발전하여, diffusion 방법의 생성형 모델이 우수한 성능을 보이고 있음 - Midjourney AI : Discord에서 사용가능한 AI 아트 생성기- DALL-E : OpenAI에서 개발하여 ChatGPT에서 사용 가능한 이미지 생성기Machine Unlearning - Right to be forgotten: EU에서 제정된 ‘잊혀질 권리'에 대한 규제 (General Data Protection Regulation;GDPR)    - 인터넷에서 고객 데이터를 지울 수 있어야 할 뿐 아니라 학습 데이터로도 사용되어서는 안됨   - Membership inference attack으..

Segmentation

Segmentation 이해를 위한 기본 개념들Semantic Segmentation - 이미지에서 각각의 픽셀마다 클래스 레이블을 예측 - 즉, 클래스 레이블만으로 이루어진 출력 이미지를 얻음Encoder-Decoder Architecture - Encoder는 이미지의 semantic을 이해하는 과정 - Encoder는 주로 convolution 연산으로 압축된 latent space를 가짐 - Semantic segmentation task를 수행하려면 압축된 latent space를 원래 이미지 수준으로 확장할 필요가 있음 - Transposed convolution의 등장Transposed Convolution - Decoding 과정에서 필요한 딥러닝 연산 - 해상도의 크기가 점점 작아지는 c..