Vision Model

딥러닝의 큰 두개의 축중 하나인 Vision Model 논문 리뷰 시리즈입니다.
Vision Model이란 이미지를 입력으로 받아 처리하는 딥러닝 모델을 말합니다.

시작은 AlexNet인데요.
물론 그 전에 CNN은 최초로 제안한 ReNet도 있지만, 딥러닝의 부활을 알린 AlexNet부터 논문 리뷰를 시작합니다.
AlexNet을 시작으로 Inception, ResNet, EfficientNet 등 다양한 CNN 논문을 리뷰합니다.
또한 SENet, BAM, CBAM등 다양한 Attention을 적용한 모델들도 포함했습니다.
최근의 트렌드는 Transformer라고 할 수 있는데요.
이러한 흐름에 맞춰 Vision Transformer, MLP Mixer등의 논문 리뷰도 포함했습니다.

최근의 메가 트렌드는 초거대 언어모델과 비전 모델의 결합이라고 할 수 있는데요.
이러한 메가 트렌드로 이어지기까지의 Vision Model 논문 리뷰를 지속적으로 업데이트할 예정입니다.
이 Vision Model 논문 리뷰 시리즈가 딥러닝을 공부하는 모든 분들께 많은 도움이 되기를 바랍니다.

찾으시는 것을 발견할 수 없는 것 같습니다. 검색이 도움이 될지도 모릅니다.

Scroll to Top