本稿では、従来のCNNやTransformerベースの手法では困難であった、空間的な長距離依存関係を効果的に捉えることができる、新たな画像修復モデルSEM-Netを提案する。
本稿では、Vision Transformer(ViT)を用いてマスクされた画像領域を、入力画像内の自己注意によって選択された領域で置き換えることで、画像修復における事前処理手法を提案する。
人間の美的基準に合わせた、より自然で視覚的に優れた画像修復を拡散モデルと強化学習を用いて実現する手法を提案する。
本稿では、従来の行列補完手法の欠点を克服するため、非凸ロバスト四元数行列補完(NRQMC)モデルを提案し、カラー画像や動画のノイズ除去と欠損補完における有効性を示す。
逐次的に前処理された誘導を用いることで、観測ノイズに対してより頑健な画像修復を実現する。
Latent Neural Cellular Automata(LNCA)モデルは、ニューラルセルラーオートマトンのリソース制約を解決するために設計された新しいアーキテクチャであり、高い再構成忠実度を維持しながら計算要件を大幅に削減します。