논문/논문 읽기 11

Data Augmentation using Large Language Models:Data Perspectives, Learning Paradigms and Challenges

Ding, B., Qin, C., Zhao, R., Luo, T., Li, X., Chen, G., Xia, W., Hu, J., Luu, A. T., & Joty, S. (2024). Data Augmentation using Large Language Models: Data Perspectives, Learning Paradigms and Challenges. arXiv:2403.02990v4.- upstage 멘토링 2주-1일차 제공 아티클데이터 중심 접근- 최근 인공지능(AI) 연구의 중요한 패러다임 중 하나는 "데이터 중심 접근"- 모델의 성능을 높이기 위해 데이터를 다양하고 고품질로 확보하는 것이 필수적이라는 점을 강조- AI 시스템이 학습할 수 있는 유효한 정보를 확보하는 것이 중요하며, 이..

추천시스템 최근 연구 동향 및 향후 연구 방향 소개

송경우, 문일철 (2021). 추천시스템 최근 연구 동향 및 향후 연구 방향 소개. 정보과학회지, 39(3), 16-23. - upstage 멘토링 1주-5일차 제공 아티클 - 추천 시스템의 발전 과정과 최신 연구 동향을 분석 - 데이터가 부족한 상황에서의 추천 시스템과 다양한 보조 정보를 활용한 모델링, 그리고 사용자와 아이템의 상호작용을 고려한 연구추천 시스템의 목적 - 추천 시스템은 사용자(user)와 아이템(item) 간의 상호작용(interaction)을 모델링하여 사용자에게 맞춤형 경험을 제공하는 것을 목표 - 주로 개인화된 경험을 제공하여 사용자 만족도를 높이고, 기업의 서비스 품질을 강화하는 데 활용적용 분야- 추천 시스템은 온라인 쇼핑, 음악 및 영화 스트리밍, 의료, 정치, 교통 등 다..

추천 시스템

오진호, 유환조 (2014). 추천 시스템. 정보과학회지, 32(1), 53-58.- upstage 멘토링 1주-5일차 제공 아티클 - 추천 시스템의 개념, 역사, 알고리즘 분류, 최신 연구 동향 - 추천 시스템의 발전과 핵심 기술에 대한 이해 - 사용자 맞춤형 서비스와 관련하여 추천 시스템이 어떻게 발전해 왔고, 다양한 영역에서 어떻게 적용되고 있는지에 대한 포괄적인 설명을 제공추천 시스템의 목적- 추천 시스템은 사용자가 선호할 만한 아이템을 노출하여 전반적인 만족도를 높이고, 서비스 제공자의 매출이나 사용 시간 등의 지표를 향상시키기 위한 시스템역사적 배경- 추천 시스템은 1990년대 후반에 뉴스, 웹 페이지 등에서 개인화 서비스를 제공하기 위한 필터링 기법으로 시작- 2006년에는 넷플릭스가 Net..

데이터로 여는 농업의 미래, 스마트농업

- 이수진, 장우석, & 이철. (2022). 데이터로 여는 농업의 미래, 스마트농업. 한국과학기술정보연구원(KISTI).- upstage 멘토링 1주-4일차 제공 아티클 - 데이터 기반 기술을 통해 농업의 미래를 혁신할 수 있는 스마트농업의 필요성과 방향성을 제시 스마트농업- 스마트농업 배경       - 4차 산업혁명과 함께 농작업의 무인화/지능화로 노동력, 지식, 경험 등을 데이터가 대신하는 스마트농업이 부상       - 스마트농업은 한정된 토지, 자원, 인력으로 식량 수요를 충족하고, 식량안보 위기, 기후 변화 등 리스크 대응을 위해 필수- 스마트농업 개념       - 종자개발, 생산, 관리, 가공 유통, 소비 등 농업 밸류체인 전반에 첨단기술을 접목시켜 농업의 스마트화를 도모스마트농업 환경분..

인공지능 윤리(AI Ethics):인간과 인공지능의 조화로운 공존 방안

- 유화선, 윤병성, & 최희석. (2024). 인공지능 윤리(AI Ethics): 인간과 인공지능의 조화로운 공존 방안. 한국과학기술정보연구원(KISTI). - upstage 멘토링 1주-4일차 제공 아티클 - 인공지능(AI)의 발전과 함께 등장하는 윤리적 문제들을 분석- AI와 인간이 상호 이익을 위해 조화롭게 공존할 수 있는 방안을 탐구- AI가 일상과 사회에 미치는 영향이 커짐에 따라 윤리적 문제의 중요성이 대두됨에 따라 이러한 문제들을 해결하기 위한 방안을 제시 인공지능 시대로의 전환- 지능을 가진 기계, 인공지능 - 인공지능의 일상화 :챗GPT 등장과 함께 생성형 AI 열풍으로 인해 각종 분야에서 AI 역할이 급속도로 확대되고 있으며, 정부는 모든 국민의 AI 일상화(AI Everywhere)..

Improving Language Understandingby Generative Pre-Training

Radford, A., Narasimhan, K., Salimans, T., & Sutskever, I. (2018). Improving language understanding by generative pre-training. OpenAI- upstage 멘토링 1주-3일차 제공 아티클 - OpenAI가 2018년에 발표한 연구- 비지도 학습을 통해 생성적 사전 학습(Generative Pre-Training, GPT)을 활용하여 언어 이해를 개선하는 방식을 제안- 언어 모델이 사전 학습과 미세 조정을 통해 더 많은 작업에서 높은 성능을 발휘할 수 있음을 입증- NLP 모델 학습 방법에 있어 중요한 발전을 제시 연구 배경 및 필요성- 기존의 NLP 모델들은 특정 작업에 특화된 데이터셋을 활용해 지도 학..

Language Models are Unsupervised Multitask Learners

Radford, A., Wu, J., Child, R., Luan, D., Amodei, D., & Sutskever, I. (2019). Language models are unsupervised multitask learners. OpenAI.- upstage 멘토링 1주-3일차 제공 아티클 - OpenAI의 GPT-2 모델에 관한 연구 - 언어 모델이 감독 학습 없이도 여러 작업에서 뛰어난 성능을 발휘할 수 있다는 점 - GPT-2가 훈련된 방식, 학습된 능력, 그리고 다양한 작업에서의 성과를 통해 언어 모델이 다중 작업을 수행하는 학습자(multitask learner)로 작동할 수 있음을 제시연구 목적 및 배경 - 기존 NLP 모델들은 특정 작업을 위해 지도 학습(Supervised Learni..

Highly accurate protein structure prediction with AlphaFold

Jumper, J., Evans, R., Pritzel, A. et al. Highly accurate protein structure prediction with AlphaFold. Nature 596, 583–589.- upstage 멘토링 1주-2일차 제공 아티클 - 혁신적인 단백질 구조 예측 성능을 소개 - 단백질 구조는 생물학적 기능과 밀접한 관계가 있기 때문에 구조 예측이 매우 중요함- 생명과학 및 의약 연구에 필수적 AlphaFold 모델의 구성 - Attention 메커니즘 : AlphaFold는 트랜스포머 모델의 주의 메커니즘(attention mechanism)을 활용   - 아미노산 서열에서 특정 정보의 중요성을 파악하고, 관련 정보를 강조하여 학습- 입력 데이터: AlphaFold는..

Data-Centric AI 관점으로 재해석하는 자연언어처리 기반 History of AI

Upstage (2023). Data-Centric AI 관점으로 재해석하는 자연언어처리 기반 History of AI. Upstage.- upstage 멘토링 1주-1일차 제공 아티클- NLP의 발전 과정을 Data-Centric AI 관점에서 재해석하는 논문자연언어처리(NLP)란?- NLP는 컴퓨터가 인간의 언어를 이해하고 처리하는 기술 - 텍스트 및 음성 데이터를 분석하여 컴퓨터가 언어적 의미를 파악하고 활용할 수 있도록 하는 것이 목표 - 규칙 기반 접근이 주를 이루었으나, 이후 통계적, 기계 학습, 딥러닝 기반 모델로 발전하며 그 가능성이 확장모두를 위한 “언어모델의 역사”- 언어모델의 발전은 NLP의 중심에 있으며, 데이터와 알고리즘의 발전에 따라 그 구조와 성능이 크게 향상 - 초기의 단순 ..

GPT 시리즈와 발전 과정

Upstage (2023). GPT 시리즈와 발전 과정. Upstage.- upstage 멘토링 1주-1일차 제공 아티클  GPT의 개념과 언어 모델의 발전 배경GPT는 언어 모델로서, 다음 단어를 예측하는 능력을 바탕으로 자연어 이해와 생성 작업을 수행이러한 언어 모델들은 인간의 언어 이해와 유사하게 작동하며, 이를 위해 방대한 양의 데이터를 학습하여 문맥을 파악초기의 언어 모델들은 순차적 데이터 처리를 위해 순환 신경망(RNN)과 LSTM 같은 구조를 사용했으나, 긴 텍스트에서 정보가 소실되거나 연산 속도가 느려지는 문제가 있음GPT 시리즈와 발전 과정Emergence (2017년 4월)- OpnAI에서는 언어 모델을 RNN(Rcrrnt Nrl Ntwork) 으로 만들고 있었음- 뉴런이 감성 분석을 ..