黒箱型ビジョン言語モデルの出力の一貫性を測定することで、モデルの好ましい画像分布を特定する新しい手法を提案する。
3Dモデルの知的財産を保護し、悪用を防ぐために、自動的に可視ウォーターマークを埋め込む新しい手法を提案する。
衛星データに基づく地上属性予測器をベースモデルと組み合わせることで、訓練データに含まれていない地域での画像地理位置推定の精度を向上させることができる。
動画内の顔のクラスタリングを自己教師学習と適応的なアルゴリズムを用いて解決する。
本論文は、点群ベースの新しい表現である正則化双極子和を提案し、これを用いて高品質な3D再構築を実現する。この表現は、ノイズや外れ値のある点群に対して頑健であり、効率的な逆レンダリングを可能にする。
限られた4つの視点からでも、ガウシアンスプラッティングと構造的プライオリティを組み合わせることで、高品質な3D物体の再構築が可能である。
自動運転システムの物体認識は、安全な運用前に品質とロバスト性のテストを通過する必要がある。そのようなテストでは通常、真陽性(TP)、偽陽性(FP)、偽陰性(FN)検出を識別し、それらを指標に集計する。しかし、TPsやFPs/FNsの識別方法について包括的な定義が欠けているため、本論文ではこれらの識別に関連する機能的側面と実装の詳細をチェックリストとして提供する。
提案手法は、手書き署名の全体的な情報と局所的な詳細情報を統合的に学習することで、真正署名と巧妙な偽造署名を効果的に識別する。また、新しい距離学習損失関数「co-tuplet loss」を提案し、真正署名と偽造署名の距離を最適化することで、高精度な署名検証を実現する。
人間の視覚探索パフォーマンスは、単純で固定的なヒューリスティック意思決定ルールを使うことで、ベイズ最適な意思決定ルールを使うよりも少し優れている。これは、相関ノイズの存在と中心視野の感度低下によって説明できる。
NCT-CRC-HE データセットには色彩バイアス、JPEG圧縮アーチファクト、画像品質の問題があり、深層学習モデルの性能を大きく左右する。