小規模データでも転移学習を用いることで、高性能なAIモデルを開発できることを示した。特に小型モデルは大型モデルと同等の性能を発揮し、エッジデバイスでの活用が期待できる。
低照度環境でのビデオアナリティクスの精度は、使用する画像エンハンスメントアルゴリズムによって大きく変化する。この差異はCAMの違いに起因しており、CAMの差異と精度の相関が高いことを発見した。そこで、CAMに基づく新しいエンハンスメント品質評価手法を提案し、限られたエッジリソースの中で最適なオフロードとエンハンスメントを行う適応型システムを設計した。
深層ニューラルネットワークにおけるスキップ接続は、訓練段階での最適化を容易にし、テスト時の精度を向上させるために重要な役割を果たしている。
提案手法PMCMは、可視光と赤外線の画像を部分的に混合することで、両モーダル間の意味的対応を学習し、モーダル間のギャップを軽減する。さらに、部分的な混合により、モーダル間の不均衡問題も緩和できる。
ユーザーのフィードバックに基づいて、視覚言語モデルを用いてクエリを段階的に改善することで、対話型画像検索の性能を向上させる。さらに、大規模言語モデルを用いてクエリの冗長な情報を除去することで、クエリの質を高める。
提案手法は、事前に用意された物体インスタンスに依存せずに、ポイントクラウドと言語指示を直接処理することで、相対位置情報を活用しながら効率的に位置推定を行う。
コンピュータビジョンを用いて道路表面の摩擦特性を推定する深層学習回帰モデルSIWNetを提案する。SIWNetは予測区間を推定する機能を備えており、推定の不確実性を定量化できる。
属性指導型マルチレベル注意ネットワーク(AG-MAN)は、事前学習CNNバックボーンの特徴抽出能力を向上させ、属性特異的な表現を抽出することで、高精細ファッション検索の精度を大幅に改善する。
テキストから3Dオブジェクトの材質を生成する手法を提案する。
本手法は、ピラミッド表現を用いた3D-aware GANsジェネレータと拡散モデルを組み合わせることで、高品質で整合性の取れた3Dポートレートを生成する。