2025/01/10 4

자연언어처리 - 언어학

언어학과 전산언어학언어학 - 언어학은 인간 고유의 정신적인 능력인 언어를 “과학적으로” 연구하는 학문 분야 - 인간의 언어에 대한 무의식적 지식 - 인간이 언어를 습득하는 방법 - 언어의 일반적인/구체적인 구조 - 언어의 다양성 - 언어가 인간이 세상에 대해생각하는 방식에 미치는 영향 전산언어학 - 전산언어학은 컴퓨터를 이용하여 언어를 자동으로 분석하며, 언어 자료를 자동 처리하는 데에서 나타나는 언어학적 문제를 연구하는 학문 언어학의 접근 방법 - 규칙기반 접근: 이론언어학적인 연구를 통해 얻어진 형식화된 문법을 이용 - 통계기반 접근: 실제 사용된 언어 자료에 기반을 둔 접근 방식으로 전자화된 텍스트(코퍼스)의 분석을 통해 얻어진 언어 단위의 분포와 빈도에 관한 정보를 이용 - 딥러닝 기반 접근: 인..

자연언어처리란?

자연언어처리자연언어(Natural Language) - 자연어(Natural Language)란 사람들이 일상생활에서 자연스럽게 사용하는 언어 - 인공언어의 반대말  자연언어처리(Natural Language Processing)- 자연언어처리는 컴퓨터가 자연언어의 의미를 분석하여 이해하고 생성할 수 있도록 만들어주는 기술NLG & NLU자연언어처리가 어려운 이유문맥에 따른 모호성 - 언어에는 문맥이 중요한 역할. 문장 내의 단어나 구문은 주변 문맥에 의해 의미가 변화 - 따라서 컴퓨터는 주변단어나 문구 등의 문맥을 기반으로 언어의 의미를 해석해야 함 표현의 중의성 - 언어는 최소한의 표현으로 최대한의 정보를 표현 - 이에 따라 문장에서는 일반적인 정보의 생략이 빈번하게 일어남 - 이러한 문장 내의 정보..

Generation-확산모델

확산 확률 모델( DPM)- 확산 모델은 정방향/역방향 과정으로 구성됨- 디노이징 확산 확률 모델(DDPM)은 현재 더해진 잡음을 추정하는 방식의 목적 함수를 취함 - 생성은 잡음을 점진적으로 제거하는 방식으로 진행되어 매우 느림확산 확률 모델 (Diffusion Probabilistic Model, DPM, 2015) - 최근 활발히 연구되고 있는 모델 DPM - 확산과 확률- 확산이란? → 물질(픽셀 값)이 섞이고 번져가다가 마지막에는 균일한 농도(노이즈)가 되는 현상 - 확산 현상을 시간에 따라 확률적 모델링 : 마르코프 체인 (Markov Chain) 미래는 과거가 아닌 현재에만 의존!DPM의 구조 - 정방향 확산 (Forward Diffusion Process): 데이터 → 노이즈 (고정)   ..

Study/머신러닝 2025.01.10

[AI 부트캠프] 수강생의 하루 : 번아웃을 극복하는 자세

부트캠프 일정이 절반을 지나면서, 수강생으로서 하루를 기록해 보고 싶었습니다.개인적인 일상과 함께, 번아웃을 겪게 되었을 때 이를 어떻게 이겨냈는지도 함께 담아볼까 합니다. AI 부트캠프는 공휴일과 주말을 제외하고 매일 오전 10시부터 오후 7시까지 진행되며,배움으로 가득한 하루를 보내며 대부분의 시간을 컴퓨터 앞에서 치열하게 노력하는 일정입니다. 글에서는 기상 직후부터 부트캠프를 시작하기 전 아침 시간,부트캠프 중의 시간,그리고 저녁 시간부터 잠들기 전까지의 하루를 담았습니다. 하루하루를 꽉 채워 보내며,가끔 찾아오는 번아웃을 극복하기 위해 제가 실천하는 방법도 함께 적어보았습니다. 부트캠프를 시작하기 전 아침 시간07:00~08:30 기상 및 일상 준비 저는 남자친구와 결혼 준비를 하며 함께 생활하고..