コピュラを使用して画像のピクセル値の依存関係を捉え、局所的な変化に敏感な新しい画像類似性指標CSIMを提案する。
本研究では、深層学習を用いて3次元密度勾配場を表現するニューラルデフレクションフィールド(NeDF)を提案し、従来の3次元トモグラフィックBOSよりも優れた再構築性能を示した。特に、位置エンコーディングと階層的サンプリング戦略を導入することで、希薄ビューと限定視野角の条件下でも高精度な密度場再構築が可能となった。
顕微鏡データの特性に合わせて改良されたSSIM指標であるMicroSSIMを提案する。MicroSSIMは、顕微鏡データの高SNR画像と低SNR画像の間の強度差や検出器オフセットの影響を適切に処理し、より適切な評価を行うことができる。
高い信頼度の検出結果を利用して、低い信頼度の検出結果を改善することで、組織学画像における物体検出精度を向上させる。
STEM-HAAADFナノ粒子の深層学習認識モデルを開発し、ガウシアンノイズの影響を定量的に評価した。ノイズ除去アルゴリズムを適用することで、認識精度を大幅に向上させることができた。
本研究は、対比学習とHOG特徴を組み合わせた新しい無監督画像変換手法を提案する。この手法は、セマンティックラベルを必要とせずに、入力画像の構造を保持しながら高品質な変換画像を生成することができる。
本研究では、画像拡散モデルと動画拡散モデルを統合することで、高品質で時間的に一貫性のある動画を生成する新しい手法を提案する。
電子顕微鏡画像の領域分割と臨界寸法抽出を深層学習を用いて高速化・自動化することで、AR/VRデバイスの設計と製造プロセスを最適化する。
車の画像を用いて絶滅危惧種の動物の画像をモザイク状に合成し、環境保護の意識を高めるとともに、車の部品情報に関する質問に多モーダルLLMが効率的に回答する。
fMRIデータから視覚刺激を再構築する際に、テキストガイダンス、視覚ガイダンス、レイアウトガイダンスの3つのレベルのマルチモーダルガイダンスを活用することで、より正確な再構築が可能になる。