本論文では、高ビット深度ボリュームメディカル画像のロスレス圧縮のための新しいフレームワークであるBD-LVIC (Bit-Division Based Lossless Volumetric Image Compression) を提案しています。医療画像のロスレス圧縮は、診断の完全性を維持するために不可欠ですが、従来の手法では、高ビット深度ボリュームデータの複雑な構造変化や、手動で設計されたモジュールによるエンドツーエンドの最適化の難しさなどの課題がありました。
BD-LVICは、これらの課題に対処するために、高ビット深度ボリュームを、重要な構造情報を保持するMSBV (Most Significant Bit-Volume) と、複雑なテクスチャ情報を保持するLSBV (Least Significant Bit-Volume) の2つの低ビット深度サブボリュームに分割します。MSBVは従来のコーデックを用いて圧縮し、LSBVは、スライス内とスライス間の冗長性を活用した新しい学習ベースの圧縮モデルを用いて圧縮します。
高ビット深度画像は、画素値の範囲が広いため、従来の学習ベースの圧縮手法では、確率分布表が大きくなり、計算量とメモリ使用量が増加するという課題がありました。BD-LVICは、ビット深度分割を用いることで、この課題を効果的に解決します。
MSBVは、医療画像の構造情報を含む重要な部分ですが、そのデータはスパースであるという特徴があります。BD-LVICでは、この特性を利用し、計算量の少ない従来型のコーデックであるJPEG-XLを用いてMSBVを圧縮します。
LSBVは、テクスチャ情報を含むため、MSBVよりも複雑なデータ構造を持ちます。BD-LVICでは、LSBVの圧縮に、スライス内とスライス間の冗長性を活用した新しい学習ベースの圧縮モデルを採用しています。
TFAMは、現在のLSBSと、前後のMSBSおよびLSBSから情報を統合し、アラインメントされた特徴量を生成します。これにより、スライス内とスライス間の冗長性を効果的に活用することができます。
PACMは、TFAMで生成されたアラインメントされた特徴量と、マスク畳み込みによって得られたローカルな空間コンテキストを融合し、現在のLSBSの確率分布を推定します。これにより、効率的なエントロピー符号化が可能になります。
BD-LVICは、さまざまな医療画像データセットを用いた実験において、従来のロスレス圧縮手法と比較して、優れた圧縮性能と高速な符号化速度を達成しました。
BD-LVICは、高ビット深度ボリュームメディカル画像のロスレス圧縮において、高効率な圧縮と高速な処理を実現するフレームワークです。本手法は、医療画像の保存や転送における課題解決に貢献する可能性があります。
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Kai Wang, Yu... klokken arxiv.org 10-24-2024
https://arxiv.org/pdf/2410.17814.pdfDypere Spørsmål