Upstage AI LAB 부트캠프 5기/실시간 공부내용 복습

[2024.10.16] [특강] 슬기로운 부캠 생활

김 도경 2024. 10. 16. 11:57

* 특강으로 진행된 부캠 활용방법에 대한 정리입니다.

Data Manager
  • 인공지능에 필요한 데이터 관련된 모든 업무를 수행
        - 학습 데이터 구축 ( 수집, 라벨링, 규칙, 품질 ... )
        - 평가 데이터 구축 ( 샘플링, 기준, 점수 ... )
        - 데이터 구축에 필요한 라이브러리 개발 ( 전처리, 후처리, 자동화 ... )
        - 데이터 구축에 필요한 툴 개발 (수집 툴, 라벨링 툴, 관리 툴 ...)
  • 데이터 매니저는 인공지능 + 개발 + 데이터(도메인)에 대한 지식을 골고루 갖추고 있어야 함
취업을 목표로 부트캠프 알차게 보내는 법
장점 단점
밀도 높은 수강 기간 (짧고 굵게!)
탄탄한 커리큘럼
네트워크의 확장 (동기, 강사 등)
이력서 한 줄 추가
다양한 포트폴리오 제작
커리어 전환의 기회
너무나도 높은 밀도 (거의 올인)
길다면 길지만, 짧다면 짧은 기간
수강생들 간의 실력 차이가 존재
모두가 동일한 커리큘럼을 배우기 때문에,
차별성을 갖기 어려움

 

  • 필요한 마음 가짐
    - 열정이 넘쳐야 한다. 
         -> 막상하다보면 안 되기 힘들다 : 기간이 생각보다 길고, 대학생활만하지 않다. 의지/초초함/불안감 등이 옴
             -> 너무 초반부터 스퍼트를 높이면 번아웃이 온다 : 용두사미를 중요하기
    - 중요한 내용은 중반부 이후에 오기 시작함 : 천천히 진행하여 힘을 쓸 때 필요한 힘 남겨두기
    - 기본 중의 기본은 커리큘럼을 잘 따라가는 것!
       - 완전 처음이면  : 가장 많은 시간 투자/ 기본기 쌓기
       - 기본기가 있다면 : 면접준비라 생각하며 기본기 점검

  • 커리큘럼
    - AI 입문 교육 (★★★★) - 입문교육도 따라가기 힘들 수도 있다.

    - AI 취업 교육 (입문자 ★★ or 경험자 ★★★★★)  - 취업에 필요한 부분들, 코딩테스트 등을 위한 부분들임
             -알고리즘/ 깃허브 사용방법등등

 

- AI 심화 교육(★★★★★) - AI Researcher / Engineer에게 필수적으로 요구되는역량 : 여기가 기본기 교육!
                    - AI 부분에서는 쉬운 전공기초라고 생각하면 됨. 가장 중요한 부분이라고 생각이 됨

 

- AI 심화 교육(★★★☆) - Computer Vision 테크트리 , 기술트랜드가 있구나(나중에 신기술이 나와도 이해할 수 있게)

 

- AI 심화 교육(★★★☆) -Natural Language Processing 테크트리

 

- AI 실전 대회(★★★) : 데이터를 개선하여 성능을 높이는 방법, 데이터 구축 방법에 대해서 배움


- AI 실전 대회 (★★★★☆) 
      - 심화 강의가 별도로 제공되며, 희망하는 주제를 선택하여 대회에 참가
      - 어떤 분야에 관심 있는지 혹은 잘할 수 있는지 고민해 보고, Phase 1과 3에서 공부를 해두면 더 좋은 결과를 낼 수 있음
           -> 관심분야 먼저 정하기

- OCR(Optical Character Recognition) : 이미지상 글자 인식 : 주민등록번호 인식
- Information Retrieval (NLP) : 사용자가 원하는 정보를 검색
- Recommender System (Recsys) : 사용자가 원하는 것을 추천
- Anomaly Detection (Tabular) : 이상치를 탐지

- 대회의 순위 보다는, 포트폴리오에 집중하는 것이 더 집중하는 것이 좋엄
 1. SOTA(State Of The Art) 모델을 구현
 2. 데모 페이지를 구축 

  • 너무 많고 어려운데, 어떻게 공부하면 좋을지
     - 2~3년 동안 공부할 내용 -> 6개월로 압축 : 양이 많고 어려운 것이 당연
     - 키워드를 중심으로 전체적인 흐름을 이해하는 것이 중요
     - 이해, 구현 그리고 응용할 수 있도록 기본기를 쌓는 것 또한 필요

  • AI Research Engineer 
    서류 전형(이력서, 자기소개서, 포트폴리오) -> 알고리즘 코딩 테스트 -> 딥러닝 코딩 테스크
            -> 기술 인터뷰(1,2차, CS 및 인공지능 관련 기술 검증) -> 컬처 인터뷰 -> 최종 인터뷰 -> 최종 결과 발표

  • 부트캠프를 병행하며 미리미리 준비를 해놔야지만, 수료와 함께 취직이 가능!

  • 코딩테스트 : 기술적인 역량을 시험하기 위해 실시하는 알고리즘이나 직무 연관성이 있는 기술에 대한 구현 테스트
     - 코드 문제를 두고, 어떤 식으로 코딩을 짜는지 보는 것
     - 교재 : 이것이 취업을 위한 코딩 테스트다 with 파이썬
     - 유튜브 강의 : https://www.youtube.com/playlist?list=PLRx0vPvlEmdAghTr5mXQxGpHjWqSz0dgC

    공부법
         - 최소 1일 1문제
         - 정답지 또는 ChatGPT의 도움 없이 가능한 스스로 풀기
         - GitHub 또는 기술 블로그에 코드 + 해설 정리
         - 백준 기준 실버 1 ~ 골드 5, 프로그래머스 기준 레벨 3을 편안하게 푸는 것을 목표로 설정
         - 스터디 하기

  • CS 기초 : 면접에서 나오는 질문 : 좋은 기업들에서는 잘 나오는 편
      - CS 5대 과목 : 자료구조, 알고리즘, 운영체제, 네트워크, 데이터베이스
      - AI만 연구하고 개발한다면 CS를 몰라도 괜찮을 수 있겠지만, AI를 제품화하기 위해서는 반드시 CS를 알고 있어야 함
      - 면접 단골 질문!!
    - 취직 준비시 CS 기초 : 유튜브에 취준을 위한 CS 기초등을 검색하면 나온다.
    - Front-End vs Back-End : 백엔드를 공부하는 것을 추천!

    공부 방법
     - 패스트 캠퍼스 강의 공부하기
     - 정보처리 기사 공부
     - 빅데이터 분석기사 공부

  • 스터디
    - 복습 스터디
    - 코딩 테스트 스터디
    - CS 기초 스터디
    - 논문 스터디 : AI에서 기본이 되는 논문들을 읽고 정리하고 토론하는 스터디
         - GitHub Repo의 Wiki나 기술 블로그에 정리해 두면 포트폴리오로 활용할 수 있음

  • 사이드 프로젝트
    - 차별화 된 프로젝트를 진행하기
        1. Competition - 특정 도메인의 문제와 데이터가 제시되고, 이를 바탕으로 모델의 성능을 경쟁하는 대회
            - Kaggle(국외), Dacon(국내)
            - 일반적으로 AI의 성능만을 평가하기 때문에, 순수하게 AI 실력으로 결과를 낼 수 있음
            - 정량적으로 깔끔하게 떨어지는 결과 (순위, 메달, 티어 등)
            - 대회에 따라서 매력적인 보상 (인턴 기회, 채용 연계, 상금 등)

            - 당연히 글로벌 플랫폼인 Kaggle에서 좋은 성과를 내는 것이 좋지만, 어렵다
               : Dacon에서 연습 겸 틈새시장을 노리는 전략

            - 결과와 관계없이 Competition에서 사용한 코드와 전략, 레슨런 등을 문서로 정리해 두는 것이 좋음
                      - 가능하면 GitHub Repo를 만들어서 깔끔하게 관리

        2. Demo Page : 특정 문제를 정의하고, 이를 위해 AI를 활용한 Demo Page를 구현하는 것
               - YOLO를 활용한 마스크 인식, ChatGPT를 활용한 언어 교육 등등
               - AI 이외에도 다양한 기술 스택이 필요하기 때문에, 전체적인 파이프라인에 대한 이해도가 필요
               - Demo Page를 통해서 시각화되기 때문에, 보는 사람으로 하여금 이펙트가 큼
               - 개발하는 과정에서 겪게 되는 이슈들이 현업과 밀접한 연관이 있기 때문에, 포트폴리오를 더욱 풍성하게 만들어 줌

               - Framework
                  - Streamlit 또는 Gradio ( 개발에 대한 배경지식이 부족해도, 쉽고 빠르게 AI 관련 Demo Page를 만들 수 있음)

  • 이력서는 미리 써두기
    - 워드를 통해 본인 만의 템플릿을 하나 만들어 주기적으로 업데이트
    - 1장으로 깔끔하게 정리되는 것이 좋으며 pdf 파일 형태로 관리

    - 링크드인 : 세계 최대의 비즈니스 전문 소셜 미디어 플랫폼
        - 재직 정보, 보유 특허, 학력, 학내 동아리 활동 등의 대외활동, 논문, 수상 실적, 장학내용, 평점, 구사 모국어/외국어 수준, 수강한 수업 내력, 자신있는 스킬, 직장상사 또는 교수들의 추천서
         - 생각보다 많은 사람들이 보기 때문에, 항상 관리가 필요

    - 개발자라면 GitHub Profile
        - GitHub에서 본인의 username으로 repo를 생성하면, 다음과 같이 Profile를 관리할 수 있음 
        - 본인의 username.github.io로 repo를 생성 -> username.github.io로 접근 가능한 웹 사이트를 만들 수 있음
        - Jekyll를 통해서 본인의 입맛에 맞게 웹 사이트를 꾸기도 가능
        - https://docs.github.com/ko/pages/quickstart : 깃허브 사용법
        - 1일 1Commit을 하는 것도 좋음.