人間の視覚探索パフォーマンスは、単純で固定的なヒューリスティック意思決定ルールを使うことで、ベイズ最適な意思決定ルールを使うよりも少し優れている。これは、相関ノイズの存在と中心視野の感度低下によって説明できる。
NCT-CRC-HE データセットには色彩バイアス、JPEG圧縮アーチファクト、画像品質の問題があり、深層学習モデルの性能を大きく左右する。
Vista3Dは、単一の入力画像から効率的かつ高品質な3Dオブジェクトを生成する。コース段階では3Dガウシアンスプラッティングを使用して迅速な初期ジオメトリを生成し、リファインメント段階では符号付き距離関数と差分等価表面表現を使用して詳細なジオメトリとテクスチャを生成する。さらに、角度に基づく拡散プライオルの合成により、3D一貫性を維持しつつ、見えない側面の多様性を引き出す。
LifeGPTは、トーラス状のグリッド上でコンウェイのライフゲームのルールを高精度に学習し、再現することができる。
提案のNSSR-DILモデルは、画像データに依存せずに、劣化カーネルとその逆カーネルの関係を学習することで、効率的かつ高性能なスーパーレゾリューションを実現する。
雲の動きを正確に予測することで、太陽光発電の長期的な発電量を予測することができる。
単眼カメラ画像から未来のパノラマ分割と深度を同時に予測することで、ロボットが安全に行動し、計画を立てることができる。
MitoSegは、電子顕微鏡トモグラフィー画像からミトコンドリアの境界を自動的に検出し、3Dメッシュを生成するツールである。
独立機能モジュール評価フレームワーク(BEV-IFME)は、特徴マップとグラウンドトゥルースを統一的な意味表現空間に投影し、その類似度を定量的に評価することで、個別の機能モジュールの学習状況を把握する。
画像フレームの低周波情報とイベントデータの高時間分解能を融合することで、様々な高速シナリオでの安定した任意点追跡を実現する。