Xu, D., Yang, Y., Liu, H., Lyu, Q., Descovich, M., Ruan, D., & Sheng, K. (n.d.). TomoGRAF: A Robust and Generalizable Reconstruction Network for Single-View Computed Tomography.
本研究は、超疎ビュー投影、具体的には1〜2枚のX線画像から、高品質な3次元CTボリュームを再構成する、堅牢で汎用性の高い深層学習フレームワークであるTomoGRAFを開発することを目的としています。
TomoGRAFは、X線輸送物理学を組み込んだ新しいGANベースのNeRF(Neural Radiance Field)ジェネレーターを採用しています。ジェネレーターは、CT画像の取得ジオメトリをキャプチャし、X線投影プロセスをシミュレートし、シミュレートされた投影とグランドトゥルースCTサブボリューム間の差異を最小限に抑えるようにトレーニングされます。TomoGRAFは、トレーニングデータとは異なる画像特性を持つ非公開のデータセットで評価され、最先端の深層学習およびNeRFメソッドと比較されました。
TomoGRAFは、2D投影レンダリングと3Dボリューム再構成の両方において、MedNeRFやX2CT-GANなどの最先端技術よりも大幅に優れたパフォーマンスを示しました。特に、1ビューボリューム再構成において顕著な利点が示されました。TomoGRAFは、1ビューベースのボリュームレンダリングにおいて、SSIM 0.79±0.03、PSNR 33.45±0.13を達成し、MedNeRF(SSIM 0.37±0.05、PSNR 7.68±0.10)やX2CT-GAN(SSIM 0.31±0.12、PSNR 14.39±0.19)を大きく上回りました。RMSEも同様に減少しました。さらに、TomoGRAFのSSIM分布は、1ビューおよび2ビューベースのボリュームレンダリングの両方において、高度に左に歪んでおり、尖度が高く、大部分が上位に集中しているのに対し、MedNeRFおよびX2CT-GANのSSIM分布は、正規分布に近く、中程度に右に歪んでいる(値が下位に偏っている)ことがわかりました。
TomoGRAFは、超疎ビューX線投影から3次元CTボリュームをレンダリングするための、有望かつ汎用性の高いフレームワークです。TomoGRAFは、X線輸送物理学をNeRFトレーニングに組み込み、ペアとなる3D CT教師データを使用することで、優れたパフォーマンスを実現しています。この技術は、完全なガントリー回転が機械的な制限によって妨げられる場合や、対象となる動的プロセスがCTの取得速度よりもはるかに速い場合など、限られた数のビューしか利用できないアプリケーションで特に役立ちます。
TomoGRAFは、画像誘導放射線療法、インターベンショナルラジオロジー、血管造影など、1〜2枚のX線画像しか利用できないが、3次元ボリューム情報が望ましいアプリケーションに独自のソリューションを提供します。TomoGRAFは、リアルタイムの患者追跡と周囲組織の形状への放射線療法の適応に不可欠な、患者の完全な3次元構造を記述する情報を提供する可能性があります。さらに、TomoGRAFは、従来の4D-DSAと比較して、画像線量を大幅に削減し、複雑な血管構造の時間分解能を向上させた、リアルタイムの時間分解3D DSAの推論に利用できる可能性があります。
TomoGRAFは有望な結果を示していますが、さらなる改善が必要です。第一に、TomoGRAFは推論段階でさらなる微調整が必要であり、再構成時間が長くなります(1ビューで344.25±10.32秒、2ビューで719.46±26.78秒)。この時間は、より多くのビューを使用した推論ではさらに長くなります。モーションアダプティブ放射線療法などのオンライン手順では、大幅な高速化が望まれます。より多様な分布を持つ大規模なデータセットを使用することで、微調整の負担を軽減または排除し、TomoGRAFの推論をサブ秒レベルにすることができます。これは、インターベンショナル手順に不可欠です。第二に、TomoGRAFはCTで合成されたDRRで開発およびテストされていますが、これは、実際の検出器を使用して取得されたkV X線とは、物理的投影モデルの簡略化、検出器のダイナミックレンジ、ノイズ、前処理、後処理が異なるため、画像特性が異なります。現在のモデルは、実際のX線投影に基づいて適応させる必要がある場合があります。第三に、1ビューでのTomoGRAF再構成結果は、形状的には正しいものの、細部とCT値の精度が低下します。これは、最大10ビューまでビュー数を増やすことで部分的に軽減されます。したがって、TomoGRAFは、現在の形では、物体検出や位置特定タスクには適していますが、放射線量計算などの定量的タスクへの適合性については、さらなる研究が必要です。さらに、詳細の再現性は、再構成の解像度によっても向上するはずです。現在のところ、GPUメモリの制約により、最大128×128×128の解像度しかレンダリングできません。しかし、この制限は、急速に増大するGPUメモリ容量によって、近い将来克服されることが期待されます。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問