Główne pojęcia
내시경 영상에서 카메라에서 가까운 표면일수록 더 많은 조명을 반사하는 특성을 활용하여 단안 깊이 추정 성능을 향상시킬 수 있다.
Streszczenie
이 논문은 내시경 영상에서의 단안 깊이 추정 문제를 다룹니다. 기존의 단안 깊이 추정 기법들은 내시경 영상에서 강한 기하학적 특징과 질감 단서가 부족하고 복잡한 조명 효과로 인해 성능이 저하되는 문제가 있었습니다.
저자들은 내시경에서 방출되는 조명이 표면에 반사되는 광도학적 단서를 활용하여 단안 깊이 추정 성능을 향상시키는 방법을 제안합니다. 구체적으로:
- 픽셀 단위의 조명 표현(Per-Pixel Shading, PPS)을 활용한 감독 학습 및 자기 지도 학습 손실 함수를 제안합니다.
- PPS 표현을 활용하여 초기 깊이 추정을 개선하는 깊이 정제 네트워크(PPSNet)를 제안합니다.
- 합성 데이터와 실제 임상 데이터를 활용하는 교사-학생 전이 학습 방식을 제안합니다.
제안 방법은 합성 데이터 C3VD 데이터셋에서 최신 기술 대비 우수한 성능을 보였으며, 실제 임상 데이터에서도 높은 품질의 깊이 맵을 추정할 수 있음을 보였습니다.
Statystyki
2022년 전 세계적으로 약 2.253억 건의 내시경 시술이 수행되었으며, 연간 성장률은 1.3%입니다.
내시경 시술은 좁고 구불구불한 신체 통로를 통해 이루어지므로 숙련된 의료진이 필요하며, 환자에게 불편감을 줄 수 있습니다.
내시경 영상에서 3D 기하 정보를 추정하면 자율 탐색 및 기하학적 특성 측정 등에 활용할 수 있습니다.
Cytaty
"내시경 영상에서 강한 기하학적 특징과 질감 단서가 부족하고 복잡한 조명 효과로 인해 기존 단안 깊이 추정 기법의 성능이 저하됩니다."
"내시경에서 방출되는 조명이 표면에 반사되는 광도학적 단서를 활용하여 단안 깊이 추정 성능을 향상시킬 수 있습니다."