本研究では、TransRUPNetと呼ばれる新しいエンコーダ・デコーダアーキテクチャを提案した。TransRUPNetは、正確で実時間のポリープ分割を実現するために設計されており、特に多様な外部データセットに対する高い汎化性能に焦点を当てている。
提案手法の主な特徴は以下の通りである:
TransRUPNetは、ピラミッドビジョントランスフォーマー(PVT)をエンコーダとして使用し、追加のアップサンプリングブロックを備えたエンコーダ・デコーダアーキテクチャで構成されている。これにより、高精度でリアルタイムのポリープ分割が可能となる。
4つの異なるポリープデータセット(1つの訓練分布内データセットと3つの分布外データセット)での評価を通じて、TransRUPNetの優位性を示した。
TransRUPNetは10種類の最先端手法を上回る分割性能と適応性を示し、優れた汎化能力を実証した。
実験の結果、TransRUPNetは、Kvasir-SEGデータセットにおいて平均Dice係数0.9005、平均IoU 0.8445、リコール0.9195、精度0.9170、F2スコア0.9048を達成し、毎秒47.07フレームの高速処理を実現した。さらに、分布外データセットでも優れた性能を示し、既存の最先端手法を大幅に上回る結果を得た。これにより、TransRUPNetが内視鏡検査における高度な支援システムの開発に貢献できることが示された。
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania