Core Concepts
テキストによる正則化を用いることで、逆問題の曖昧さを軽減し、より正確な再構成を実現する。
Abstract
本研究では、テキストによる正則化を用いた新しい潜在拡散逆問題ソルバー「TReg」を提案している。逆問題は本質的に ill-posed であり、同じ測定値に対して複数の解が存在する。従来の拡散モデルベースの逆問題ソルバーは、画像統計のみに基づいているため、この曖昧さを完全に解消できない。一方、人間の視覚システムは、経験に基づく知覚バイアスを活用して曖昧さを解消することができる。
TRegでは、逆拡散サンプリング時にテキストによる事前概念を活用することで、曖昧さを軽減する。具体的には、テキストの意味表現を動的に最適化することで、逆拡散サンプリングを適応的に制御する。実験結果から、TRegは位相復元、超解像、ぼかし除去などの逆問題において、曖昧さを効果的に軽減し、正確な再構成を実現できることが示された。
Stats
逆問題の測定値は、元の画像に比べて大量の情報が失われている。
位相復元問題では、シフト、回転、反転などの固有の対称性が存在し、同じ測定値に対して複数の解が存在する。
従来の拡散モデルベースの逆問題ソルバーは、画像統計のみに基づいているため、この対称性を完全に破ることができない。
Quotes
"人間の視覚システムは、経験に基づく知覚バイアスを活用して曖昧さを解消することができる。"
"TRegでは、逆拡散サンプリング時にテキストによる事前概念を活用することで、曖昧さを軽減する。"