본 논문에서는 다중 뷰 렌즈리스 캡처에서 3D 장면을 재구성하고 새로운 뷰를 렌더링할 수 있는 새로운 프레임워크인 GANESH를 제안합니다. GANESH는 장면별 학습 없이 새로운 장면에 일반화할 수 있으며, 기존 방법보다 재구성 정확도와 렌더링 품질이 우수합니다.
本稿では、複数視点のレンズレス画像から3Dシーンを再構成する汎用可能なフレームワークGANESHを提案する。GANESHは、従来手法のようにシーンごとに学習する必要がなく、合成データで学習したモデルを実世界のレンズレス画像に適用できる。
GANESH, a novel generalizable neural radiance field framework, effectively reconstructs 3D scenes and synthesizes novel views from multi-view lensless images, outperforming traditional methods by jointly optimizing refinement and rendering processes.
本文提出了一種名為 RF-Solver 的新型採樣器,用於解決校正流模型中反演不準確的問題,並進一步設計了 RF-Edit 模組,實現了高品質的圖像和視頻編輯。
본 논문에서는 정류 흐름 ODE의 솔루션 오류를 줄여 역변환 및 재구성 정확도를 향상시키는 새로운 샘플러인 RF-Solver를 제안하고, 이를 활용하여 고품질 이미지 및 비디오 편집을 가능하게 하는 RF-Edit을 소개합니다.
調整済みフローベースの生成モデルにおける反転の不正確さを、調整済みフローODEの解決におけるエラーを減らす新しいトレーニングフリーサンプラーであるRF-Solverを提案することで対処します。さらに、画像とビデオの編集タスクにRF-Solverを活用するRF-Editを提案します。
This paper introduces RF-Solver, a novel sampler for rectified-flow-based generative models that enhances image and video editing by improving inversion accuracy and introducing a feature-sharing mechanism for preserving structural information.
本文提出了一種基於 ControlNet 的方法,透過在合成數據集上進行訓練,實現對文字到圖像擴散模型中人體形狀和姿勢的精確控制,並透過引導組成技術解決了合成數據與真實數據之間的領域差異問題,在保持圖像品質的同時,實現了對人體形狀和姿勢的精確控制。
합성 데이터를 사용하여 사전 훈련된 텍스트-이미지 변환 모델에서 인체 형태 및 포즈를 제어하는 새로운 방법을 제시하며, 특히 도메인 적응 기술을 통해 합성 데이터와 실제 데이터 간의 차이를 줄여 시각적 사실성을 유지하면서 정확한 제어를 가능하게 한다.
本稿では、事前学習済みテキスト画像変換拡散モデルにおいて、3D人体パラメトリックモデル(SMPL)を用いて人間の体型とポーズを制御する手法を提案する。この手法は、合成データセットで訓練された制御情報を分類器不要ガイダンスベクトルに分離し、別の制御ネットワークと組み合わせることで、生成画像を入力ドメインに適応させることで、画像品質を維持しながらドメイン適応を実現する。