AI논문 읽기 가이드

This entry is part 2 of 2 in the series 딥러닝 논문 가이드

1. 들어가며

많은 분들이 딥러닝 논문을 어떻게 읽고, 어떻게 정리하면 좋을지에 대해 자주 질문을 주세요. 그래서 이번 포스팅에서는 이 질문에 대한 내용을 정리해봤습니다.

저는 딥러닝을 독학으로 공부했습니다. AI와는 전혀 관련 없는 전공으로 학부를 졸업한 후, AI와는 관련 없는 직무로 커리어를 시작했지만, 이후 운 좋게 AI를 연구할 기회를 얻게 되었어요. 그때부터 말 그대로 맨땅에 헤딩하는 느낌으로 AI 공부를 시작했습니다. 다양한 시행착오를 겪었고, 지금은 어느 정도 저만의 방법과 노하우가 생긴 것 같아요. 하지만 많은 연구자, 개발자 분들과 얘기해보면 오늘 공유드릴 내용이 특별히 저만의 노하우는 아닌 것 같더라고요. 그래서 이 방법들을 종합해 정리해봤습니다.

이번 글은 크게 세 가지 주제로 나누어 구성해봤는데요.

먼저 ‘어떻게 읽을까?’입니다. 논문 읽기는 어렵습니다. 저도 처음 논문을 읽었을 땐 며칠씩 걸렸던 것 같아요. 논문이 무엇이고, 왜 쓰는지를 이해해야 어떻게 읽어야 할지도 알 수 있습니다.

그리고 나서 중요한 건 ‘어떻게 정리할까?’예요. 논문을 읽고 그냥 넘어가면, 안 읽은 것과 다름없습니다. 하루만 지나도 무슨 내용이었는지 기억이 안 날 거예요. 그래서 정리가 꼭 필요한데요, 어떻게 정리하면 좋을지 알아볼게요.

마지막은 ‘무엇을 읽을까?’입니다. 논문은 정말 많습니다. 특히 딥러닝 분야에서는, 그리고 LLM이나 Agent처럼 핫한 키워드라면 말 그대로 논문이 쏟아져 나옵니다. 천천히 여유 있게 읽어볼 수 있으면 좋겠지만, 대부분의 경우 읽어야 할 논문 양에 비해 주어진 시간은 아주 적죠. 따라서 어떤 논문을 읽고, 어떤 논문을 정리할지를 고르는 기준도 매우 중요합니다.

하나씩 살펴보겠습니다!

2. AI논문, 어떻게 읽을까?

먼저 논문은 어떻게 읽어야 할지 알아볼게요. 딥러닝뿐만 아니라 대부분의 학술 논문은 비슷한 포맷으로 작성됩니다. 즉, 글의 논리 전개 순서가 비슷해요. 그 이유는 주제가 다르더라도 모든 학술 논문의 목적은 같기 때문입니다. 학술 논문은 내 주장을 다른 사람에게 납득시키기 위해 작성하죠. 그리고 그에 대한 근거(보통은 실험 결과)가 필요하고요. 그래서 다음과 같은 순서로 구성되는 경우가 많습니다.

2-1. Abstract

이번 논문의 전체 내용을 요약한 부분입니다. 보통은 이 abstract만 읽고 이 논문을 읽을지 말지를 결정하게 됩니다. abstract를 여러 번 반복해서 읽어봤는데도 이 논문이 무엇을 했는지 대략적으로 감이 오지 않는다면, 저는 아직 이 논문을 읽을 준비가 안 됐다고 판단합니다.

보통 논문에는 ‘부모님’이 있어요. 새로운 개념이 갑자기 툭 튀어나오는 게 아니라, 기존 연구들을 바탕으로 조금씩 확장해 나가는 방식이기 때문이죠. 따라서 이번 논문에서 제안하는 방법은 기존 방법에 새로운 내용을 추가한 경우가 많습니다. abstract를 읽고도 대략적으로 이해가 안 되는 이유는, 이 ‘기존 방법들’을 제대로 모르기 때문인 경우가 많아요. 생소한 용어들이 계속 등장하다 보니 글자는 읽었지만 내용은 이해되지 않는 거죠. 그래서 abstract를 여러 번 읽어도 이해가 안 된다면, 이전 논문부터 읽는 걸 추천드려요!

2-2. Introduction

이제부터는 본격적인 도입부입니다. 이번 논문에서 다룰 전체 내용이 집약된 챕터예요. abstract를 조금 더 확장한 느낌이라고 보시면 됩니다. 대부분의 introduction은 다음과 같은 흐름으로 전개됩니다.

먼저 해당 분야를 간략히 소개합니다. 예를 들어, 이번 논문에서 LLM Agent의 새로운 방법을 제안한다고 가정해볼게요. 그럼 LLM Agent가 무엇인지, 왜 중요한지를 설명하며 시작하겠죠. 즉, “내가 풀고자 하는 문제는 이거야”라고 소개하는 부분입니다.

그러면 자연스럽게 “그동안 이 문제를 어떻게 풀어왔는지”에 대한 설명이 이어지겠죠. 처음에는 누가 어떤 방법으로 시작했고, 그다음에는 어떤 방법들이 나왔고, 그 방법에는 어떤 한계가 있었는지를 설명합니다. 그리고 “나는 이게 문제라고 생각했고, 그래서 새로운 방법을 제안했어”라고 흐름을 이어갑니다.

그다음엔 “그래서 나는 이렇게 풀어봤어”라는 내용이 나옵니다. 어떤 아이디어를 사용했고, 어떤 모델 구조를 썼으며, 어떻게 학습했는지 등 제안 방법에 대한 설명이 이어져요.

마지막으로는 지금까지의 주장이 진짜라는 걸 보여주기 위한 근거가 필요하죠. 보통은 실험 결과를 통해 이를 증명합니다. 어떤 실험을 했고, 그 결과가 어땠는지를 간략히 요약합니다.

2-3. Related Work

제안 방법을 본격적으로 설명하기 전에, 이번 논문과 관련된 기존 연구들을 정리하는 파트입니다. 해당 분야 논문을 많이 읽고 있는 중이라면 이 챕터를 건너뛰기도 하지만, 아직 이 분야가 익숙하지 않다면 전체 흐름을 파악하는 데 큰 도움이 됩니다. 이 논문을 이해하는 데 필요한 배경 지식과, 연구 흐름이 어떻게 발전해왔는지를 살펴볼 수 있어요.

2-4. Method

이제 본격적으로 이번 논문에서 제안하는 방법을 설명하는 챕터입니다. 가장 핵심적인 부분이라고 볼 수 있어요. 딥러닝 논문이라면 보통 모델 구조(architecture), 손실 함수(loss function), 학습 방식 등에 대한 설명이 포함됩니다. 이 논문의 핵심이 담긴 부분이므로 반드시 꼼꼼하게 읽고 이해해야 합니다!

2-5. Results

제안한 방법이 정말 효과적인지를 실험을 통해 검증한 결과를 보여주는 챕터입니다. 보통은 실험 세팅, 사용한 데이터셋, 실험 결과를 순서대로 설명해요. 메인 실험은 일반적으로 기존 방법들과의 성능 비교로 구성되며, 이후에는 다양한 추가 실험이 이어집니다. 메인 실험이 “내 방법이 더 좋아!”를 보여주는 것이라면, 추가 실험은 “혹시 이런 반론이 있을 줄 알고 이런 실험도 해봤어”라는 식의 ‘디펜스’ 실험이라고 볼 수 있어요. 예를 들어, “내가 제안한 구성 요소만 빼면 성능이 떨어지지?”, “시각화해보면 내가 말한 대로 분포하지?”, “학습 속도는 느릴 것 같지만 실제론 거의 비슷하지?” 같은 예상 질문에 대한 답변을 실험으로 보여주는 흐름입니다.

2-6. Conclusion

introduction이 도입부였다면, conclusion은 마무리입니다. 전체 내용을 정리하면서, 제안 방법의 의의, 한계, 그리고 향후 연구 방향(future work) 등을 간략히 정리해주는 파트입니다.

대부분의 학술 논문은 위와 같은 순서와 구성으로 작성됩니다. 그리고 각 챕터에는 꼭 들어가야 할 내용이 정해져 있어요. 이런 흐름을 염두에 두고 읽으면 논문에 끌려가기보단 주도적으로 읽을 수 있습니다. 지금 이 챕터에서 내가 무엇을 파악해야 하는지를 미리 정하고 집중해서 읽으면 훨씬 도움이 됩니다.

3. AI논문, 어떻게 정리할까?

이제 하나의 논문을 다 읽었는데요. 바로 다음 논문으로 넘어가면 될까요? 이 부분은 개인의 성향에 따라 차이가 있는 것 같지만, 저는 그렇게 넘어가면 안 된다고 생각합니다. 저 같은 경우, 그냥 읽고 넘어가면 며칠만 지나도 아무것도 기억이 나지 않더라고요. 심지어 꽤 공들여 읽은 논문이었는데, 나중에 다시 보니 몇 달 전에 읽었던 논문인 경우도 있었습니다…

그래서 저는 논문을 읽고 나면 반드시 ‘정리’ 작업을 합니다. 얼마나 자세히 정리할지는 주관적으로 판단한, 그 논문의 중요도에 따라 달라져요. 저는 대체로 세 가지 정도 수준으로 구분해서 정리합니다.

우선, 정리만 하고 넘어가도 되겠다고 판단되는 경우에는 핵심 내용을 3줄 정도로 요약합니다. 며칠 뒤의 내가 이 3줄만 읽고도 “아, 이 논문이 이런 내용이었지” 하고 떠올릴 수 있다면 그걸로 충분하다고 생각해요.

다음으로, “이건 정말 중요하다”, “이 주제를 파악하려면 이 논문은 꼭 기억해야 한다”는 판단이 드는 경우에는 제안 방법을 ‘그려서’ 정리합니다. 저는 이 부분이 특히 중요하다고 생각하는데요. 제안 방법을 백지에 손으로 직접 그릴 수 있다면, 핵심 내용을 잘 파악한 거라고 봅니다. 특히 딥러닝 논문이라면 각 단계별 텐서 shape을 따라가며 그릴 수 있다면 아주 좋습니다.

Anomaly Detection 연구 당시에 정리했던 예시
Anomaly Detection 연구 당시에 정리했던 예시
Multimodal Model 예시
Multimodal Model 예시

그리고 마지막으로, “이건 진짜 너무 중요하다. 오랫동안 기억에 남았으면 좋겠다” 싶은 경우에는 글을 씁니다. 사실 제가 테크 블로그를 시작하게 된 계기도 이 정리 방식 때문이었어요. 예전에 처음 연구하던 조직에서는 매주 돌아가며 논문 세미나를 했는데요, 그때 다른 사람들에게 설명하다 보면 이해가 더 잘 되고, 기억도 오래 남더라고요. 그래서 ‘자체 논문 세미나’를 하자는 취지로 테크 블로그를 운영하며 논문 리뷰 글을 쓰기 시작했습니다. 그리고 지금도 여전히 ‘나를 위해’ 중요한 논문이나 개념을 설명하는 글을 꾸준히 작성하려고 하고 있습니다.

4. AI논문, 무엇을 읽을까?

이제 논문을 어떻게 읽고, 어떻게 정리해야 하는지는 알게 되었어요. 그럼 이제 남은 질문은 “무엇을 읽어야 할까?”입니다. 읽어야 할 논문은 정말 많습니다. 특히 주제가 요즘 뜨는 트렌드라면, 말 그대로 논문이 쏟아져 나옵니다. 이 모든 논문을 앞에서 말한 방식으로 다 읽을 수는 없어요. 읽는 속도보다 새로운 논문이 나오는 속도가 더 빠르니까요. 그래서 선택과 집중이 필요합니다.

저는 보통 다음 세 가지 기준으로 읽을 논문을 골라요.

첫 번째 기준은 Top-tier 저널이나 학회에 게재된 논문입니다. 이런 논문들은 그만큼 엄격한 검증을 통과했다는 뜻이고, 제안 방법도 깔끔하고 완성도가 높을 확률이 높습니다. 그리고 이후 다른 논문에서도 반복적으로 인용될 가능성이 높아서, 읽어두면 여러모로 도움이 됩니다.

두 번째 기준은 비교 실험에서 반복적으로 등장하는 논문입니다. 꼭 학회나 저널에 게재되지 않았더라도, 실험에서 자주 baseline으로 등장한다면 그것만으로도 충분히 중요한 논문이라고 판단해요. 어떠한 이유로 학술 게재가 되지 않았을 뿐, 해당 분야에서는 충분히 의미 있는 연구일 수 있으니까요.

세 번째는 서베이 논문입니다. 이건 필수는 아니지만, 전체 맥락을 이해하는 데에 많은 도움이 됩니다. 저는 보통 개별 논문과 서베이 논문을 번갈아가며 읽는 편이에요. 서베이 논문의 장점은, 해당 분야의 전반적인 내용을 폭넓게 다뤄준다는 거예요. 문제가 어떤 배경에서 시작됐는지, 왜 중요한지, 어떤 데이터셋이 사용되는지, 응용 분야는 무엇인지, 기존 연구들은 어떤 방식으로 분류할 수 있는지 등 거의 모든 내용을 요약해주죠. 다만 한 논문 한 논문에 대한 깊이는 부족할 수 있으니, 서베이와 개별 논문을 함께 읽는 걸 추천드립니다.

그리고 마지막으로 정말 중요한 점은, 이렇게 읽은 논문들을 본인만의 기준으로 정리하는 것입니다. 서베이 논문을 보면 보통 연구 흐름을 어떤 기준으로 나눠서 정리하잖아요? 이걸 나만의 방식으로, 내 기준에 따라 정리해보는 게 정말 중요해요. 카테고리를 나누는 기준은 다양할 수 있습니다. 시간 순서대로 정리할 수도 있고, 방법론별로 분류할 수도 있고, 사용하는 데이터셋 기준으로 나눌 수도 있어요. 요즘은 옵시디언을 활용해서 정리하시는 분들도 많은데요, 저는 오히려 그런 툴 없이 직접 논문들 간의 관계도를 만들어보는 걸 추천드립니다. 중요한 건, 그림을 예쁘게 잘 그리는 것 자체가 아니라, 그 그림을 만들기 위해 스스로 고민하고 판단해보는 그 과정이에요. 시간이 오래 걸릴 수 있지만, 이걸 AI 툴에 맡기는 건 시간을 아끼려다 정작 가장 중요한 과정을 건너뛰게 되는 셈이에요.

최근까지 정리하던 Physics-Drvien Surrogate 논문들 예시. 요즘은 노션으로 정리합니다.
최근까지 정리하던 Physics-Drvien Surrogate 논문들 예시. 요즘은 노션으로 정리합니다.

5. 마치며

이번 포스팅에서는 논문을 읽는 방법, 정리하는 방법, 그리고 읽을 논문을 고르는 기준에 대해 정리해봤습니다. 물론 이 내용에 대해 이견이 있을 수도 있고, 다른 방식이 더 잘 맞는 분들도 계실 거예요. 이 글은 “이게 정답입니다”라는 마음으로 쓴 건 아니고, 어디까지나 개인적인 경험과 생각을 담은 내용이에요. 실제로 많은 연구자, 개발자 분들과 이야기를 나눠보면, 각자만의 방식과 루틴이 조금씩 다르더라고요. 그 다양한 방법들을 참고해서, 결국 나에게 잘 맞는 ‘나만의 정답’을 찾아가는 과정이 가장 중요하지 않을까 싶습니다.

딥러닝 논문 가이드

[딥러닝 논문 가이드] 딥러닝 전체
5 3 votes
Article Rating
Subscribe
Notify of
guest

5 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
Youngchan
Youngchan
4 months ago

내가 생각하고, 실천하고 있는 것들을 글로 표현하고 전달하는 것에는 정말 정말 어려운 일입니다.
이곳에는 정말 2번, 3번 보고 싶은 내용들이 많이 있습니다. 볼 때마다 늘 감사한 마음으로 보고 있습니다.
스스로 오늘은 대충 해볼까 싶을 때, 함께 일했던 기억들을 떠올리며 다시 마음을 붙잡습니다.
오늘도 이 글을 읽으며, 저만의 정답을 다시 한번 찾아 가봅니다.

항상 건강하고, 행복하시고,감사합니다. ffighting!!!!

david
david
3 months ago

정말 너무도 훌륭한 가이드입니다. 잘 따라가겠습니다

kiseok
kiseok
6 days ago

너무 좋은 글입니다!
아직 제 방식을 찾지 못해, 먼저 써주신 내용을 토대로 해보려고 합니다.

혹시 추천해주실 Top-tier 저널이나 학회가 있을까요?
그 부분부터 보면서 이 정도의 글을 쓸 수 있을 때까지 노력해보고 싶습니다.

좋은 글 감사합니다. 행복한 하루 되세요!

5
0
Would love your thoughts, please comment.x
()
x
Scroll to Top