2024/11 28

[Baekjoon] 사칙연산 Python 문제 풀이

* 코딩에 대해서 정말 정말 초보기에....공부를 하는 기록을 남길 겸 작성을 하는 부분입니다.* 1000번, 1001번, 10998번, 1008번, 10869번 풀이 문제 인식 a와 b를 불러와야함...! -> a, b = 으로 시작출력은 a+b 이다 -> print(a+b)가 들어감 문제풀이#1000번a, b = map(int, input().split())print(a+b) a, b= : a와 b를 불러오겠다map() : 리스트나 이터러블(iterable)의 각 요소에 주어진 함수를 적용하여 새로운 이터레이터(iterator)를 반환- 리스트나 이터러블(iterable)의 요소에 같은 함수를 적용할 때 편리하게 사용하는 함-  반복 가능한 객체를 순차적으로 하나씩 처리하는 도구- 반복 가능한 객체 ..

[AI 부트캠프] 처음 도전한 경진대회에서 얻은 것들

AI Upstage 부트캠프에는 4번의 경진대회가 있습니다!경진대회를 한다는 것은 알았으나, 어떤 식으로 평가가 되는 지도 몰랐고, 어떻게 진행이 되는 지도 전혀 몰랐습니다. 이번에 부트캠프에서 진행한 경진대회를 막을 내려서, 회고를 하면서어떤식으로 진행이 되는지..!를 한번 정리를 해볼까 해요. 그리고 이 대회가 얼마나 장점이고, 도움이 되었는지에 대해서 말해볼까 해요. 경진대회 소개첫번째 대회는 서울 아파트 실거래가 예측 경진대회는 주어진 데이터를 활용해 아파트 가격을 예측하는 모델을 개발하는 대회였어요.아파트 위치, 크기, 건축 연도, 주변 교통 및 시설 정보 등 다양한 변수를 포함한 데이터를 바탕으로 모델을 학습하며, 선형 회귀, 랜덤 포레스트, 딥러닝 등 다양한 회귀 알고리즘을 활용할 수 있어요..

[2024.11.18] ML ops (머신러닝 운영)

* 강의를 듣고 필기한 내용일 이후에 따로 정리한 내용입니다.ML ops머신러닝 파이프라인 데이터 수집 : 다양한 소스에서 데이터를 수집하고 필요한 형식으로 변환.데이터 버전 관리 : 수집된 데이터를 버전 관리하여 재현성과 추적 가능성을 확보. (DVC)데이터 검증 : 데이터의 통계적 특성을 검토하고 이상치를 감지하여 데이터 품질을 확인데이터 전처리 : 데이터를 머신러닝 모델 훈련에 적합한 형태로 변환하고 정제feature engineeringdata engineer ⇒ 수학 X. 연구자 X. 내가 만든 것이 바로 적용이되고, 그로인해 재미를 느끼는 사람DE ⇒ 프리랜서 가능 - Researcher(박사급) - Software 관점이 거의 없음DS ⇒ 프리가 힘들어요. : 연구쪽에 가깝고, 논문/학술 이..

카테고리 없음 2024.11.18

백준으로 코딩 테스트 공부하기 + 깃허브에 자동 잔디 심기

매일 코딩테스트를 공부 하기 위해서, 백준을 시작하려 합니다.그리고 깃허브에 자동으로 잔디심기를 하여 남기려고 해요백준 백준 : https://www.acmicpc.net/회원가입백준 회원가입을 가장 먼저 진행을 합니다.가입 시 적은 이메일로 이메일 인증을 진행해야해요. 문제 풀기문제에서, 단계별로 풀어보기로 문제를 풀기 시작했어요.단계별로 문제 풀기에는 이렇게 나눠져있어서 풀기가 좋아보여요.진행중인 단계에는 이렇게 도전중이라고 뜹니다단계에 들어가면, 이렇게 문제가 나오는데 성공한 건 성공이라고 나오고 성공하지 못한 건, 실패라고 떠요 깃허브에 자동으로 잔디 심기 백준 허브 설치하기 백준허브(BaekjoonHub) - Chrome 웹 스토어Automatically integrate your BOJ sub..

처음 나선 경진대회, 도전과 성취의 여정

AI Upstage 부트캠프를 시작한 지 6주 차에 돌입하며 시작된 3주간의 경진대회가 드디어 끝을 맺었습니다.많은 것을 배운 값진 첫 경진대회였습니다. 함께한 팀원들은 그만큼 대단한 사람들이어서, “내가 이런 사람들과 함께해도 괜찮을까?”라는 생각이 들 정도였죠.노션, 깃, 인사이트 등 기본적인 부분조차 잘 몰랐던 저도 이번 대회에서 큰 성장을 경험했고,마침내 1등이라는 값진 결과까지 얻었습니다. 이번 경험을 조금 더 정확히 기록하고 싶은 마음에 패리포터 활동에서도 이 경진대회를 남길 예정이지만,먼저 간단히 회고를 작성해 보고자 합니다. AI Upstage에서의 첫번째 경진대회Upstage 부트캠프에서 팀으로 활동하는 4번의 경진대회가 있습니다.각각 주제가 머신러닝, 딥러닝, 그 외에 다양한 주제로 다..

머신러닝 Advanced_캐글 대회

[2024.11.08] 필수 온라인 강의 Part16 Machine Learning Advanced CH08 실전 프로젝트캐글 대회에서 사용하는 팁 (이론) 실험하기 전 고려할 사항들디버깅- 프로그래밍에서 오류를 찾아내고 수정하는 과정 - 머신러닝 프로세스의 경우 한번 실행시 오래 걸리는 경우가 많아서 돌린 후 에러를 확인해서 수정하면 시간 소요가 큼 디버깅모드  - 실험 환경이 잘 설정되었는지 체크하기 위한 과정  - 다양한 방식으로 프로세스를 축소하여 체크     - 방법 1. 샘플 데이터     - 방법 2. 작은 모델     - 방법 3. 하이퍼파라미터 축소시드 고정- 시드 : 난수 생성기의 초기값으로 사용되는 값  - 시드가 고정이 안된 경우 : 같은 코드에서 다른 점수가 발생 (재현에 실패) ..

Study/머신러닝 2024.11.09

머신러닝 Advanced_ 데이터 셋 분할

[2024.11.08] 필수 온라인 강의 Part16 Machine Learning Advanced CH07 데이터 셋 분할이론데이터 분할 - 모델을 학습하기 위해 전체 데이터를 Train, Valid, Test 총 3가지의 데이터로 나누는 과정 - 일반적으로 사용할 수 있는 데이터는 전체 데이터의 일부분 - 학습 데이터의 높은 성능이 실제 미래 데이터에 대한 보장이 되지 않는다 - 이러한 모델의 성능을 보장해 줄 데이터가 필요하며 평가 데이터가 이런 역할-> 데이터는 미래의 데이터나 그 후 단계의 성능은 확인할 수 없는데, 평가셋을 미리 구분하여, 모델이 얼마나 유의미한지 확인할 필요성이 있고, 배포때 확인을 하면 위험성이 많아서, 배포에는 최적의 모델을 보낼 수 있음구성요소- 학습(Train) 데이터..

Study/머신러닝 2024.11.08

머신러닝 Advanced_ 심화 ML 모델

[2024.11.06] 필수 온라인 강의 Part16 Machine Learning Advanced CH06 심화 ML 모델이론 Bagging vs Boosting- Bagging (Recap.)   - 부트스트랩을 통해 표본을 여러번 뽑아 모델을 학습시키고, 결과를 집계(Aggregation) 하는 앙상블 방법- Boosting  - Boosting은 성능이 약한 모델의 예측값에 대한 오차를 이용해 모델을 더욱 최적값으로 보완하며 성능을 높이는 방법  - 이전 모델이 잘 예측하지 못한 부분에 집중하여 찾아낸 오차를 최적화에 사용하는 점이 가장 큰 차이Boosting Algorithms- 이전 모델의 예측 결과를 다음 모델 구축에 어떻게 활용하는지에 따라 아래의 두방법이 존재 ○ AdaBoost (Ada..

Study/머신러닝 2024.11.06

Data Augmentation using Large Language Models:Data Perspectives, Learning Paradigms and Challenges

Ding, B., Qin, C., Zhao, R., Luo, T., Li, X., Chen, G., Xia, W., Hu, J., Luu, A. T., & Joty, S. (2024). Data Augmentation using Large Language Models: Data Perspectives, Learning Paradigms and Challenges. arXiv:2403.02990v4.- upstage 멘토링 2주-1일차 제공 아티클데이터 중심 접근- 최근 인공지능(AI) 연구의 중요한 패러다임 중 하나는 "데이터 중심 접근"- 모델의 성능을 높이기 위해 데이터를 다양하고 고품질로 확보하는 것이 필수적이라는 점을 강조- AI 시스템이 학습할 수 있는 유효한 정보를 확보하는 것이 중요하며, 이..

머신러닝 Advanced_ 기본 ML 모델

[2024.11.06] 필수 온라인 강의 Part16 Machine Learning Advanced CH05 기본 ML 모델 이론 머신러닝 모델의 목적 - 분류와 회귀 문제   - 분류(Classification) : 예측하고 싶은 종속변수(Y)가 범주형일 때    - 회귀(Regression) : 예측하고 싶은 종속변수(Y)가 연속형일 때      -> 대부분의 머신러닝 모델들은 두 문제 모두 해결 가능 e.g. DecisionTreeClassifier, DecisionTreeRegressor머신러닝 모델의 분류- 선형모델과 비선형모델    - 선형모델 : X와 Y의 관계를 선형으로 매핑 ➞ 선형 결정경계(Decision boundary) 생성 (e.g. 선형회귀모형)    - 비선형모델 : X와 Y의..

Study/머신러닝 2024.11.06