本論文では、AI生成画像内のテキストの正確性と美的統合を定量的に評価するための新しい評価指標ABHINAW を提案している。従来の評価指標には以下のような課題があった:
そこで本論文では、以下の手法を組み合わせてABHINAW指標を開発した:
実験の結果、ABHINAWは人手による評価と高い相関を示し、AI生成画像内のテキストの正確性を適切に評価できることが確認された。
今後の展望として、2つのプロンプトを使う手法や、背景の動的な再生成などが考えられる。また、視覚的なコサイン類似度の導入など、評価指標のさらなる改善の余地がある。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Abhinaw Jagt... lúc arxiv.org 09-19-2024
https://arxiv.org/pdf/2409.11874.pdfYêu cầu sâu hơn