Upstage AI LAB 부트캠프 5기/성장 기록

컴퓨터 비전 첫 도전기: 경진대회에서 배운 것들

김 도경 2025. 1. 9. 19:02

CV가 도대체 무엇인지도 모르는 제가 CV 경진대회에 참여를 했고,

첫 도전이 마무리 되었습니다.

 

마무리를 하고 나서도 생각을 하고 좀 남기고 가고 싶은 게 많아서,

이렇게 경진대회 후기를 조금 늦게 작성을 하게 되었어요.

강의도 조금 미뤄두고...CV경진대회 정리를 하였고, 아직 조금 더 남은 것 같지만 후기를 작성해볼까해요.

 

CV가 도대체 무엇인지도 몰랐던 저의 CV 경진대회 후기입니다!

 

CV 경진대회

다양한 종류의 문서 이미지의 클래스를 예측

 

computer vision에 있어서 아무것도 몰랐던 제게는 정말 큰 산이었고,

이번에 팀장이 되면서 더 무거웠던 경진대회입니다.

 

팀장이지만 앞서서 진행하지 못하고 오히려 팀원들에게 따라갔지만,

저 스스로는 공부한 게 많았던 경진대회에요:)

데이터 EDA
  • 메타 데이터 확인

데이터 컬럼이 어떤 것이 있는지 확인하고 영어로 되어있는 클래스 네임을 클래스 정보로 확인을 했어요.

 

데이터들의 평균 크기와 클래스간의 불균형이 있다는 사실을 확인하였고, 이에 대한 처리가 필요하다 생각을 했습니다.

 

클래스간의 크기를 보면, 확실한 불균형이 있어서 이를 어떻게 처리하지?라는 고민이 심했어요.

하지만 이보다 더 중요했던 것이 클래스오분류가 있었다는 사실이랍니다....

 

그리고 아무래도 처음 이미지 데이터를 EDA하는 것이라서 고민이 많이 되었답니다...

 

 

강의에서 본 내용을 바탕으로 EDA를 진행하고자 했고, 각각의 이미지 크기 파일, RGB 채널 비율, 픽셀 값, 밝기까지 보려고 하였어요.

EDA를 진행하면서 이번에 가장 힘들었던 것은 아무래도 비정형데이터인데 정말 글자로 나타내기 힘든 데이터를 다루는 것이었어요. 이미지 분류가 정말 이미지를 공부하는데 가자아 중요한 점이라고 했지만, 너무 어렵다고 생각이 되었답니다...

 

EDA부터 약간 꼬인 느낌도 들고 이걸 할 수 있을까?라는 생각이 많이 들었어요.

 

제대로 하는 협업 - wandb 사용

협업에 있어서 저번 팀과 비슷하게 진행을 했지만, 달라진 점이 조금 있었어요.

 

slackbot을 이용한다는 것, 그리고 노션을 제가 관리하게 되었다는 것...!

팀장이 되면서 노션을 관리하게 되었고 노션에 대해서 잘 배울 수 있다는 점이 있었어요.

그리고 github도 branch기능을 사용하여 코드를 업로드하는 과정도 배울 수 있었답니다.

또한 가장 큰 것은 wandb를 사용하게 되었다는 점이에요.

팀원 중 wandb를 구축하신 분이 계셔서....정말 많이 배울 수 있었답니다.

머신러닝 및 딥러닝 실험을 추적하고 시각화할 수 있도록 돕는 도구로 강의에서 내용만 들었을 때는 이런게 있구나,였지만 사용을 해보면서 협업에 어떻게 적용을 할 지 어떤 식으로 사용을 해야할지 잘 이해할 수 있었어요.

이렇게 로그기록도 되고, 정리가 쉬워서 좋았답니다.

하지만 제대로 구축을 제가한 것도 아니었고, 정확하게 hydra기술을 공부하지 못하여 이 점도 많이 아쉬움으로 남고,

이에 대한 공부가 더 필요하여 시간이 더 걸렸습니다.

 

wandb 사용시 코드 예제를 조금 적어보고, 그에 대해서 혼자 해보기도 했는데 아직 여전히 어려움이 많이 있었어요.

이에 대한 공부는 스스로 채워야겠다고 생각을 했습니다.

 

설정키 관련 스터디

wandb에 대한 구축은 팀원분께서 해주셔서 되었지만, 실험을 진행하려면 그에 대한 설정키와 코드에 대한 이해가 필요하다고 생각이 되었어요. 하지만 이를 정리를 한번 해봐야겠다고 생각이 되었고, 스스로 정리를 하게 되었습니다.

 

ppt로 모든 설정키에 대해서 정리를 하였고, 이에 대한 공유를 하였습니다.

 

 

 

설정키를 정리하면서 정말 좀 어려움이 많았어요ㅠㅠ어떤 설정키를 어떻게 바꾸어야할까?라는 고민도 많았고 그에 대한 실험도 진행을 하였지만 잘 이루어지지 않은 부분이 많았습니다. 코드를 전체를 바꾸어야 고칠 수 있는 부분도 있었고, 제가 이해를 부족하게 하고 설정키를 바꾸었을 때는 오류가 나는 부분도 많았기에 조금 더 공부를 해야겠다 생각을 했어요.

 

하지만 설정키에 대한 공부를 하면서 아, 이게 어떻게 작동이 되는 거구나-라는 생각을 제대로 할 수 있었고, 공부가 제대로 되었다고생각이 되어요. 이를 바탕으로 이 뒤에 이루어질 NLP 경진대회에 충분히 잘 사용할 수 잇겟다라는 생각을 하였습니다.

 

ppt 제작과 발표

 

팀장으로 이번엔 발표를 진행하게 되었어요...! 이전 프로젝트와 경진대회에서의 경험을 바탕으로 절대 하루만에 ppt를 다 제작하지 못한다는 생각이 들었고, ppt 초안을 만들었고 그 위에 팀원분들이 붙여주시는 방식으로 ppt를 제작하였어요.

 

대학원에서 하루에도 몇번씩의 발표를 해본 경험자로 ppt 발표는...사실 조금 익숙한 편이랍니다. 제가 이번에 많이 기여를 못하여 발표를 제대로 하지 못할까 걱정이 되었는데, 팀원분들께서 질문에 답변도 잘 해주시고 각각 어떻게 이루어졌는지 잘 녹여내어주셔서 발표를 잘 진행할 수 있었어요..!

스스로는 조금 아쉬운 발표였지만, 그래도 나름 잘 했다고 생각이 되었습니다.

 

경진대회를 진행하면서 스스로 생각한 점

 

이번 경진대회를 겪으면서 cv가 무엇인지 정확하게 이해를 할 수 있었고, wandb에 대한 사용과 새로운 방향에 대한 생각을 만들 수 있었어요. 그렇기에 정말 유용한 경진대회가 되었고, 단순히 강의를 듣고 실습만 하는 것보다 이렇게 경진대회를 통해 배우는 점이 정말 많다고 느꼈습니다.

팀에 피해가 안가도록 더욱 공부하고 열심히 해야할 것 같아요.