本研究は、無監督画像変換の分野における重要な課題に取り組んでいる。従来の手法では、ペアデータが必要であったり、生成画像にアーティファクトが発生するといった問題があった。
提案手法は、CUTモデルをベースとし、HOG特徴量を損失関数に組み込むことで、これらの問題を解決している。HOG特徴量は、画像の構造的特徴を捉えるのに優れており、セマンティックラベルを必要とせずに入力画像の構造を保持した変換画像を生成することができる。
実験では、GTA5データセットから現実の都市シーンであるCityscapesデータセットへの変換タスクを行い、従来手法と比較して生成画像の品質が大幅に向上していることを示した。アーティファクトの低減と写実性の向上が確認できる。
本手法は、無監督画像変換の分野において重要な前進を示しており、セマンティックラベルを必要としない実用的なソリューションを提供している。今後は、さらに広範な画像変換タスクへの適用が期待される。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Wanchen Zhao في arxiv.org 09-25-2024
https://arxiv.org/pdf/2409.16042.pdfاستفسارات أعمق