本研究では、エッジ情報を活用したディフュージョンモデルを用いた新しい画像圧縮手法を提案している。
具体的には以下の3つの特徴がある。
エッジ推定ネットワーク(EEN)を導入し、潜在空間からエッジ情報を抽出する。この情報を活用することで、再構築画像の鮮明さを大幅に向上させることができる。
事前学習済みのディフュージョンモデル(Stable Diffusion)をベースとし、条件付きディフュージョンモデルを用いることで、潜在空間の雑音除去を行う。これにより、圧縮時の情報損失を効果的に補完できる。
送信時の部分的な情報欠損に対して、エッジ情報とディフュージョンモデルを活用したインペイティング手法を提案している。これにより、再送信の必要性を大幅に削減できる。
実験の結果、提案手法は既存の画像圧縮手法と比較して、高い圧縮効率と画質を実現できることが示された。特に、前景領域の再構築精度が優れており、エッジ情報の活用が有効であることが確認された。また、部分的な情報欠損に対する頑健性も高く、実用的な画像圧縮手法として期待できる。
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Ryugo Morita... klo arxiv.org 09-18-2024
https://arxiv.org/pdf/2409.10978.pdfSyvällisempiä Kysymyksiä