-
Conditional DETR for Fast Training ConvergenceContribution 세미나 2024. 4. 5. 10:24

기존 DETR은 수렴하기까지 학습 시간이 오래 걸린다.. 이를 해결하기 위한 방법을 제시

실제 수렴이 빨리 되는것을 확인

여기서 집중한점은 cross attention에서 spatial query 부분이 learnable query인데 이부분에 가이드를 주면 좀 더 수렴이 잘되지 않을까?
여기서는 anchor point(reference point)를 spatial query에 활용, 이전 decoder layer결과도 spatial query에 영향을 주도록 설정

실제 box regression 하도록 학습을 시키니까 특정 spatial query attention map에서는 box의 끝부분이 활성화 되는것을 확인
'Contribution 세미나' 카테고리의 다른 글
DINO: DETR with Improved DeNoising Anchor Boxes for End-to-End Object Detection (0) 2024.04.05 DN-DETR: Accelerate DETR Training by Introducing Query DeNoising (0) 2024.04.05 DEFORMABLE DETR: DEFORMABLE TRANSFORMERS FOR END-TO-END OBJECT DETECTION (0) 2024.04.05 DAB-DETR: DYNAMIC ANCHOR BOXES ARE BETTER QUERIES FOR DETR (0) 2024.04.05 시작하기에 앞서.. (2) 2023.12.10