Depth estimation1 논문 번역 및 요약) Vision Transformers for Dense Prediction 논문 원문 링크 : Vision Transformers for Dense PredictionVision Transformers for Dense PredictionAbstract 밀집 예측(dense prediction) 작업을 위한 모델 백본을 컨볼루션 신경망 대신에 ViT(Vision Transformer)를 사용하는 dense vision transformer를 소개한다.참고) 여기서 "밀집 예측"이라는 용어로 소개한 dense prediction은 이미지 전체에 대한 하나 또는 소수의 대표값을 예측하는 대신에 더 세밀한 위치마다 값을 예측하는 작업이다.여기서 더 세밀한 위치는 픽셀(화소, pixel) 또는 세분화된 공간 위치를 의미하여, 이러한 위치에 대하여 깊이, 클래스, 움직임, 표면의 방.. 2026. 5. 15. 이전 1 다음