Core Concepts
複雑なタスクに対応するため、クロスドメインおよびクロスディメンションの学習を可能にする方法を提案。
Abstract
画像からグラフへの直接変換は困難なタスクであり、大規模なトレーニングデータが不足している多くの領域でネットワークのトレーニングが困難です。
本研究では、画像からグラフへの変換におけるクロスドメインおよびクロスディメンション転移学習を可能にする一連の手法を紹介しています。
メソッドは、異なる2Dおよび3Dドメイン間で知識転送を実現し、ベンチマークテストで優れた結果を示しています。
導入
物理的関係をグラフ表現で表すことは機械学習において効率的かつ表現豊かなコンセプトであることが証明されています。
画像からグラフ抽出は従来、セグメンテーション、骨格化、グラフ剪定といった複数段階のプロセスが必要でしたが、これらは精度や情報損失に影響します。
方法論
正則化されたエッジサンプリング損失を導入し、異なるドメイン間で最適なオブジェクト関係(エッジ)数をサンプリングします。
画像からグラフ変換用のドメイン適応フレームワークを提案し、異なるドメインから特徴量を整列させます。
2D入力データ上で3Dトランスフォーマーを事前トレーニングするための単純な射影関数を提案します。
結果
提案手法は6つの公開イメージデータセットで優れた結果を示しました。既存手法と比較して性能向上が確認されました。
グラフ類似性とオブジェクト検出タスクにおいて強力な成果が得られました。
Stats
大規模な訓練データセットが多くの領域では稀少です(引用)
我々は異なる2Dおよび3Dドメイン間で知識転送可能(引用)
Quotes
"物理的ネットワークの基礎となるグラフ表現が異なる領域間でも本質的に高い類似性を持っているという仮説に基づき" - 引用