Kernekoncepter
T3Benchは、テキストから3Dコンテンツを生成する手法の性能を包括的に評価するためのベンチマークである。多様なテキストプロンプトと2つの自動評価指標を提供し、10種類の代表的な手法の性能を明らかにする。
Resumé
T3Benchは、テキストから3Dコンテンツ生成の現状を包括的に評価するためのベンチマークである。
- 3つの複雑度レベルの多様なテキストプロンプトを用意した
- 生成された3Dコンテンツの主観的な品質と、テキストとの整合性を評価する2つの自動指標を提案した
- 10種類の代表的なテキストから3D生成手法を評価し、それぞれの長所と課題を明らかにした
- 単一オブジェクトの生成では多くの手法が良好な性能を示すが、周辺環境や複数オブジェクトを含む場合は性能が大幅に低下することが分かった
- 2Dガイダンスから3D構造を学習し、多視点での整合性を確保することが、現在の主要な課題であることが示された
Statistik
現在の手法では、単一オブジェクトの生成では平均スコア49.4点を達成するが、周辺環境や複数オブジェクトを含む場合は平均スコアが35.8点まで低下する
品質指標と整合性指標の相関係数は0.78以上で、人間の評価と高い相関がある
Citater
"現在のテキストから3D生成手法は、単一オブジェクトの生成では良好な性能を示すが、周辺環境や複数オブジェクトを含む場合は大幅に性能が低下する"
"2Dガイダンスから3D構造を学習し、多視点での整合性を確保することが、現在の主要な課題である"