オートエンコーダーの圧縮表現を学習する際に、ディフュージョンベースのデコーダーを使うことで、GAN ベースのデコーダーよりも高品質な再構成と生成が可能になる。
潜在ディフュージョンモデルの逆拡散プロセスにAdaptive Instance Normalization (AdaIN)を反復的に適用することで、追加の訓練なしに画像のスタイル転写を実現する。
デーモン登録アルゴリズムを用いて、数値的に堅牢な経験的ウェーブレット変換を実現する。走査型トンネル顕微鏡画像のテクスチャ分割への応用を示す。
畳み込みオートエンコーダを用いて、天文学画像のポイントスプレッド関数の影響を除去し、元の画像の形状を回復する。
本研究では、ドット付きアラビア語有効期限日の画像を入力として受け取り、塗りつぶされた有効期限日の画像を出力するLCBVAEアーキテクチャを提案する。
センチネル2号衛星の低解像度画像を、畳み込みニューラルネットワークおよび生成的対抗ネットワークを用いて高解像度化する手法を評価し、生成的対抗ネットワークが優れた性能を示すことを明らかにした。
後見人平均予測と最適輸送を組み合わせることで、完全な知覚指標の下で最小MSEを達成する。
本研究では、差分可微分量子化関数STanHを提案し、事前学習済みの固定レート学習型画像圧縮モデルに組み込むことで、容易に可変レート圧縮を実現する。STanHは学習可能なパラメータを持ち、量子化間隔と再構成レベルを適応的に調整できるため、同一モデルで異なるビットレートを実現できる。
提案するMixNetは、長距離依存性をモデル化する効率的な手法を導入することで、超高解像度画像の高品質な復元を実現する。
提案手法MOC-RVQは、デジタル変調方式との整合性を高めつつ、チャネルノイズに対する頑健性を向上させることで、従来手法を上回る高画質な画像再構成を実現する。