本研究は、SimCLR という対照学習手法の有効性を、ギリシャ文字認識の文脈で調査し、様々な拡張手法の影響を検討する。
事前学習済みの基盤モデルを特定のタスクに適応させる際に、タスク特化の性能と一般化能力のバランスを取るための新しい"類似性損失"アプローチを提案する。
事前学習済みCNNモデルにヒストグラム勾配特徴量(HOG)を統合することで、米作物病害の識別精度を大幅に向上させることができる。特に、EfficientNet-B7モデルにHOGを組み合わせることで97%の高精度を達成した。
CNNの平行移動不変性を向上させるために、最大サンプリングバイアスを抑制し、平行移動不変な表現を学習する新しいプーリング演算子であるTranslation Invariant Polyphase Sampling (TIPS)を提案する。
大規模モデルの知識を蒸留することで、小規模モデルは事前学習を行わずに同等以上の性能を達成できる。
地理的バイアスを軽減し、地域に依存しない公平な画像認識モデルを構築する。
ImageNetモデルの偏りと一般化の関係を包括的に分析した結果、個々の偏りでは一般化を十分に説明できないことが明らかになった。
本研究では、量子原理を活用した2つの量子機械学習モデルを提案し、画像分類の性能を向上させている。
密結合畳み込みネットワークは、ResNetスタイルのアーキテクチャに取って代わる可能性があり、その潜在的な有効性が過小評価されていた。本研究では、concatenationを活用したDenseNetの設計を改善し、最新のモデルを上回る性能を達成した。
量子アニーリングを活用することで、多数物体追跡の処理速度を向上させつつ、追跡精度も高めることができる。さらに、逆アニーリングを組み合わせることで、追跡処理の効率をさらに高めることができる。