[논문리뷰] Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
0. Swin Transformer: Hierarchical Vision Transformer using Shifted Windows [Liu et al., 2021][원문 링크]https://arxiv.org/pdf/2103.14030 [참고 영상]https://www.youtube.com/watch?v=SndHALawoag1. 기존 ViT의 한계 : Computational boundViT에서 큰 patch를 사용하면 이미지 주요 정보를 classification하는 작업에는 적절함예. 이미지 전체를 하나의 label로 예측하는 경우하지만, 일부 task에서 image를 pixel단위의 세밀한 정보로 처리해야 할 필요가 있음예로, 이미지 내부에 있는 작은 사람이런 task를 Semantic Segm..
AI
2025. 2. 19. 18:00