Core Concepts
画像品質の記述と比較を言語で行うDepictQAは、従来のスコアベース手法と異なり、人間の評価プロセスに合致している。
Abstract
DepictQAは、画像品質を言語で記述し比較する新しい手法。
Hierarchical task frameworkとmulti-modal IQA training datasetが開発された。
DepictQAは複数のIQ評価ベンチマークでスコアベース手法を上回り、一般的なMLLMよりも正確な記述と推論結果を出力。
言語ベースのIQ評価方法が個々の好みに適応可能であることが示された。
Stats
DepictQAは、多くのベンチマークでスコアベース方法を上回っています。
Quotes
"DepictQAは、従来のスコアベース方法と異なり、画像の歪みやテクスチャ損傷を言語で記述し比較します。"