核心概念
内視鏡ビデオの単眼深度推定では、表面の光学的特性を活用することで、より正確な深度推定が可能になる。
摘要
本論文では、内視鏡ビデオからの単眼深度推定の精度向上を目的として、以下の取り組みを行っている。
- 表面の光学的特性を表す「ピクセル単位の陰影(PPS)」表現を導入し、これを活用した教師あり損失関数と自己教師あり損失関数を提案した。
- PPSを入力とする深度推定の精緻化ネットワーク(PPSNet)を提案した。
- 合成データと実臨床データを組み合わせたティーチャー-スチューデントの転移学習手法を開発した。
これらの取り組みにより、合成データのC3VDデータセットおよび実臨床データで、従来手法を大きく上回る単眼深度推定精度を達成した。
统计
2022年に世界で推定225.3百万件の内視鏡検査が行われ、年間成長率は1.3%である。
内視鏡検査では、狭く曲がった体腔を熟練した医療従事者が操作する必要があり、患者の不快感や一部の領域の未検査が課題となっている。
内視鏡ビデオからの3D理解は、自律的な手術ナビゲーションや幾何学的特性の自動計測などに役立つが、従来手法は実臨床データでの精度が低い。
引用
"内視鏡ビデオの単眼深度推定では、表面の光学的特性を活用することで、より正確な深度推定が可能になる。"
"本論文では、合成データのC3VDデータセットおよび実臨床データで、従来手法を大きく上回る単眼深度推定精度を達成した。"