מושגי ליבה
3D医療画像セグメンテーションにおいて、適切に設定されたU-Netアーキテクチャでも最先端の結果を達成できることが示されたにもかかわらず、新しいアーキテクチャの追求と、U-Netベースラインを上回る性能の主張が続いている。しかし、多くの最近の主張は、不適切なベースラインの使用、不十分なデータセット、無視された計算リソースなどの一般的な検証の欠陥に直面すると成り立たないことが明らかになった。
תקציר
本研究では、これらの検証の欠陥を避けるために、入念な検証プロトコルに基づいて、現在の主要なセグメンテーション手法を徹底的にベンチマークしている。
検証の欠陥には以下のようなものがある:
- ベースラインとの比較が公平ではない(新手法と性能向上要因が結合されている)
- 適切に設定されたベースラインが使用されていない
- 使用されるデータセットが不十分(量や多様性、ベンチマーキングに適していない)
- 報告方法が一貫性がない(クロスバリデーション、特定クラスのみの報告など)
これらの欠陥を避けるために、本研究では以下のことを行った:
- 6つの主要データセットを使用した大規模なベンチマーク
- CNN系、Transformer系、Mamba系の手法を網羅的に比較
- nnU-Netの標準化されたベースラインの更新と公開
その結果、以下のことが明らかになった:
- CNN系U-Netモデル(ResNetやConvNeXtなどのバリアント)が最高性能を発揮
- nnU-Netフレームワークの使用が重要
- 大規模なハードウェアリソースへのスケーリングが重要
これらの結果は、医療画像セグメンテーション分野における新しいアーキテクチャへの偏重傾向を示しており、より厳格な検証基準の必要性を強調している。
סטטיסטיקה
最新の手法の多くは、nnU-Netベースラインを上回る性能を示せていない。
CNN系U-Netモデルが最高性能を発揮し、nnU-Netフレームワークの使用と大規模ハードウェアリソースへのスケーリングが重要である。
データセットの特性(統計的ノイズ、性能の飽和度)によってはベンチマーキングの適切性が大きく異なる。
ציטוטים
"3D医療画像セグメンテーションにおいて、適切に設定されたU-Netアーキテクチャでも最先端の結果を達成できることが示された"
"多くの最近の主張は、不適切なベースラインの使用、不十分なデータセット、無視された計算リソースなどの一般的な検証の欠陥に直面すると成り立たないことが明らかになった"
"CNN系U-Netモデル(ResNetやConvNeXtなどのバリアント)が最高性能を発揮し、nnU-Netフレームワークの使用と大規模ハードウェアリソースへのスケーリングが重要である"