데이터분할 2

머신러닝 Advanced_ 데이터 셋 분할

[2024.11.08] 필수 온라인 강의 Part16 Machine Learning Advanced CH07 데이터 셋 분할이론데이터 분할 - 모델을 학습하기 위해 전체 데이터를 Train, Valid, Test 총 3가지의 데이터로 나누는 과정 - 일반적으로 사용할 수 있는 데이터는 전체 데이터의 일부분 - 학습 데이터의 높은 성능이 실제 미래 데이터에 대한 보장이 되지 않는다 - 이러한 모델의 성능을 보장해 줄 데이터가 필요하며 평가 데이터가 이런 역할-> 데이터는 미래의 데이터나 그 후 단계의 성능은 확인할 수 없는데, 평가셋을 미리 구분하여, 모델이 얼마나 유의미한지 확인할 필요성이 있고, 배포때 확인을 하면 위험성이 많아서, 배포에는 최적의 모델을 보낼 수 있음구성요소- 학습(Train) 데이터..

Study/머신러닝 2024.11.08

머신러닝 BASIC _ 모델 평가와 개선

[2024.11.04] 필수 온라인 강의 Part15 Machine Learning Basic CH07 모델 평가와 개선모델 평가와 기초 강화학습(Reinforcement Learning)- 학습하는 ML의 한 분야 - 모델이 게임과 같은 환경에서 상호작용하도록 설정해두고 특정 행동을 했을 때 리워드를 부여해 목표를 달성하도록 유도모델 평가가 놓치는 부분 - 데이터셋은 사람의 판단을 모아놓은 것- 구성 과정에서 의도하지 않았더라도 사람이 가진 편견이나 선입견 등이 반영모델 평가의 구성 요소- 정성평가(Qualitative Evaluation)    - 모델에 들어가는 입력값과 그에 따른 모델의 출력값을 사람이 직접 확인해보면서, 모델의 성능이 어떤지 판단하는 것 - 정량평가(Quantitative Eva..

Study/머신러닝 2024.11.04