物体までの距離は、光学パラメータの変化に対する画像の微分値の比から厳密に決定できる。この手法は、従来の深度推定手法に比べて大幅に計算コストが低く、作業範囲も広い。
オフザシェルフの物体検出モデルを、わずかなラベル付きデータを使ってオンラインで新しいドメインに適応させる革新的な手法を提案する。メモリバンクと検索拡張分類モジュールを組み合わせることで、既存の検出器に新しい概念を学習させることができる。
一般的なデータセットで事前に訓練された深層ネットワークを、少数のサンプルで新しいタスクに適応させるためのプロンプティングモジュールを設計する。
本研究では、自己教師あり学習の手法を用いて、発話に同期したジェスチャーの表現を学習する。特に、発話情報を活用することで、ジェスチャーの形態的特徴を効果的に表現できることを示す。
コンピュータービジョンシステムの開発と利用において、プライバシーの保護と偏りの軽減は重要な倫理的課題である。
本手法は、テキスト、人体ポーズ、衣服テクスチャ画像などの複数のモーダルを統合し、高品質な衣服画像の生成と編集を実現する。特に、正確な編集領域の特定と、衣服テクスチャの詳細な保持に焦点を当てている。
提案手法IVGFは、赤外線と可視光の相補的な情報を効果的に融合し、セマンティックセグメンテーションやオブジェクト検出などの高レベルビジョンタスクの性能を大幅に向上させることができる。
伝統的なスタイル転送手法は複雑なスタイルパターンを効果的に捉えることができず、深層学習ベースの手法は色彩の転送と全体的な美的品質において優れている。
画像マッチング手法の包括的な評価を行い、手法と既存ベンチマークの限界を明らかにした。特に、透明物体シーンなどの課題に対する現行手法の不足を示した。
楽譜認識におけるインスタンスセグメンテーションの活用により、楽譜内の楽譜記号の正確な検出と分離が可能となり、より詳細な情報抽出が実現できる。