결측치 2

머신러닝 Advanced_ 전처리 기법

[2024.11.05] 필수 온라인 강의 Part16 Machine Learning Advanced CH02 전처리 기법데이터 전처리의 이론 데이터 전처리 - 데이터의 특성을 이해하고 수정하여 품질을 향상시키는 과정 - 머신러닝 모델의 성능을 향상시킴과 더불어, 모델의 해석 가능성을 높이는 역할 - 필요한 부분은 더 수집을 하고, 불필요한 부분은 제거하기도 하고 수정하기도 함 - 모델을 선택학습하는 관점에서 모델마다 요구하는 것이 다름 : 선형회귀- 정규분포/ kkn - 데이터 스케일을 맞춰야함 포멧을 수정데이터 전처리 프로세스 - 데이터 분석(EDA) - 결측치 처리, 이상치 처리 - 연속형 변수, 범주형 변수 처리 - 파생변수 생성 - 변수 선택데이터 전처리의 중요성 - 편향을 제거하며, 이를 통해 ..

Study/머신러닝 2024.11.05

머신러닝 BASIC _ 모델과 데이터

[2024.10.30] 필수 온라인 강의 Part15 Machine Learning Basic CH03 모델과 데이터ML 프로젝트의 구성요소  - y는 따로 쓰는 곳이 있음y = 정답라벨, 목표값, GTy^ = 모델의 출력값, 예측값(hat은 추측값이라는 의미) 데이터셋  함수의 입력값 x와, 그에 대응하는 라벨 y의 순서쌍을 1개 이상 모아둔 집합머신러닝에서 학습을 한다는것1. 정해진 parametric 함수, 즉 모델에서 2. 데이터의 인풋값에 대한 모델 예측값과 라벨의 차이로 계산되는 손실 함수를 최소화하는 3. 파라미터 θ를 찾아내는 것.다양한 머신러닝 방법론들은어떤 구조의, 어떤 파라미터를 가진 모델을 사용하는가?함수의 인풋/아웃풋은 어떤것인가?어떤 손실 함수를 사용하는가?데이터는 어떻게 주어지..

Study/머신러닝 2024.10.30