核心概念
RGB画像のみを使って、効率的かつ自動的に文化遺産の3Dモデルを生成し、個々のオブジェクトを抽出することができる。
要約
本研究では、文化遺産のデジタル化を簡単かつ低コストで行うことができる新しいパイプラインを提案している。
- 標準的なスマートフォンで撮影したRGB画像を入力として使用し、ニューラルネットワークを用いて3Dモデルを生成する。
- 生成された3Dモデルには、オブジェクトの外観や3Dセグメンテーション情報が埋め込まれている。
- オープンボキャブラリーのオブジェクト検出器を使って、任意のオブジェクトを3Dモデルから抽出することができる。
- 提案手法は、専門家や高価な機器を必要とせず、文化遺産のデジタル化を容易に行えるようにする。
- 実験では、既存手法と比較して高精度なセグメンテーション結果を示している。
- 今後は、3Dセグメンテーションタスクでの評価、博物館での現場テスト、他の応用分野への展開などに取り組む予定である。
統計
提案手法は、既存手法と比較して、LERF-MaskデータセットでmIoU 80.3%、mBIoU 76.9%、3D-OVSデータセットでmIoU 87.5%、mBIoU 81.1%の高精度なセグメンテーション結果を達成した。
引用
"Creating virtual replicas enables designing virtual museum tours; creating catalogs for archival purposes; or aiding art restoration by reassembling digital copies before handling the potentially delicate remains."
"This approach is a significant step towards making CH digitization also accessible to institutions with limited resources."