Core Concepts
ポイントトランスフォーマーは3次元点群データの分類、セグメンテーション、検出タスクにおいて高精度なモデルである。本研究では、ポイントトランスフォーマーをModelNet10データセットで事前学習し、その後3D MNISTデータセットでの分類タスクに転移学習を行う。また、3D MNISTデータセットから頭出しで学習したモデルとの性能比較を行う。
Abstract
本研究では、3次元点群データの分類タスクにおいて高精度なポイントトランスフォーマーモデルを用いた転移学習について検討している。
まず、ポイントトランスフォーマーモデルをModelNet10データセットで事前学習し、87.7%の精度を達成した。その後、この事前学習モデルを3D MNISTデータセットに転移学習させた。一方で、3D MNISTデータセットから頭出しで学習したモデルとも比較を行った。
転移学習の結果、3D MNISTデータセットに対する分類精度は頭出し学習と同程度であった。これは、ModelNet10とMNISTの分布が大きく異なるため、事前学習で得られた知識が3D MNISTデータセットに適用できなかったためと考えられる。
ただし、転移学習モデルは頭出し学習モデルに比べて収束が速かった。これは、事前学習で得られた低レベルの特徴(エッジ、コーナーなど)が有効に活用できたためと考えられる。
最後に、3D MNISTデータセットに対してはMLPベースのシンプルなモデルのほうが、ポイントトランスフォーマーよりも良い性能を示すことが分かった。ポイントトランスフォーマーは3D MNISTデータセットの特徴を十分に捉えられていないことが示唆される。今後の課題として、ポイントトランスフォーマーの適用範囲や限界について、さらなる検討が必要である。
Stats
3D MNISTデータセットにおける分類精度は24.6%であった。
転移学習モデルの分類精度は26.0%であり、頭出し学習モデルとほぼ同等の性能であった。