작은 연구노트

  • HW
  • AI
  • Vivado

고정 헤더 영역

글 제목

메뉴 레이어

작은 연구노트

메뉴 리스트

  • 홈
  • 태그
  • 방명록
  • 분류 전체보기 (9)
    • HW (1)
    • AI (7)
    • Tool (1)
      • Vivado (1)

검색 레이어

작은 연구노트

검색 영역

컨텐츠 검색

visioni transformer

  • [논문리뷰] An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

    2025.02.17 by 마농농

[논문리뷰] An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

1. An Image is Worth 16x16 Words : Transformers for Image Recognition at Scalehttps://arxiv.org/pdf/2010.11929ICLR 2021배경 및 목적 : Transformer 는 NLP에서 표준이지만, 컴퓨터 비전에서는 응용이 제한적, 전통적으로 Vi는 CNN과 함께 attention을 사용주요 발견 : CNN에 의존하는 것은 필요하지 않으며, 이미지 Patch를 직접 사용하는 순수 Transformer가 이미지 분류 작업에서 더 잘 작동할 수 있음충분한 데이터를 pre-training한 후 여러 중소 규모 이미지 인식 밴치마크에서 ViT는 뛰어난 성능을 최신 CNN과 비교하면 보임성과 : ViT는 큰 데이터 셋 (14M ~ 3..

AI 2025. 2. 17. 12:24

추가 정보

인기글

최신글

페이징

이전
1
다음
TISTORY
작은 연구노트 © Magazine Lab
페이스북 트위터 인스타그램 유투브 메일

티스토리툴바