이 연구에서는 단일 RGB 이미지에서 깊이 추정 정확도를 높이기 위해 가중치 손실 함수와 전이 학습을 활용하는 방법을 제안했다.
먼저 평균 절대 오차(MAE), 에지 손실, 구조적 유사성 지수(SSIM)로 구성된 최적화된 손실 함수를 사용했다. 이 손실 함수의 가중치를 그리드 검색과 랜덤 검색을 통해 최적화했다.
다음으로 다양한 인코더-디코더 기반 모델(DenseNet121, DenseNet169, DenseNet201, EfficientNet)을 탐색했다. 그 결과 ImageNet에 사전 학습된 EfficientNet 모델이 가장 좋은 성능을 보였다.
정량적 평가 결과, 제안 모델이 기존 연구들에 비해 RMSE, REL, log10 등의 지표에서 우수한 성능을 보였다. 또한 정성적 분석을 통해 제안 모델이 그라운드 트루스의 오류를 보완하고 더 정확한 깊이 맵을 생성할 수 있음을 확인했다.
이 연구는 단일 RGB 이미지에서 깊이 추정 정확도를 높이는 데 기여했으며, 향후 안전 중요 애플리케이션을 위한 신뢰성 있는 깊이 추정 방법 개발에 활용될 수 있을 것으로 기대된다.
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Muhammad Ade... às arxiv.org 04-12-2024
https://arxiv.org/pdf/2404.07686.pdfPerguntas Mais Profundas