過去10年間で、深層畳み込みニューラルネットワークはコンピュータビジョン問題において急速な進歩と重要な成果をもたらしてきた。しかし、最先端の画像分類手法は以前に見たことのない視覚的文脈でうまく汎化できず、これは実世界のアプリケーションで必要とされる。本論文では、このドメイン一般化(DG)問題に焦点を当て、深層畳み込みニューラルネットワークの汎化能力を改善する方法を提案しています。我々は、画像分類器のドメイン一般化を改善するフレームワークを導入しました。このフレームワークは、低レベルと高レベルの特徴を複数スケールで組み合わせることにより、画像分類器がその潜在空間内で表現を暗黙的に分離し、描かれたオブジェクトのドメイン不変属性を学習することが可能です。さらに、堅牢な表現学習を促進するために、対比学習から着想した新しい目的関数も提案しています。この目的関数は抽出された表現が分布シフト下でも不変であるよう制約します。我々はPACS、VLCS、Office-HomeおよびNICOのドメイン一般化データセットで評価しました。豊富な実験により、我々の手法が以前のDG手法の性能を上回り競争力があり、すべてのデータセットで競争力があり最先端の結果を安定して生み出すことが示されました。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Aristotelis ... at arxiv.org 03-11-2024
https://arxiv.org/pdf/2308.14418.pdfDeeper Inquiries