核心概念
Arctique 是一個合成組織病理學數據集,它通過結合真實感和可控性,為圖像分割中的不確定性量化(UQ)方法提供了一個有價值的基準測試和開發平台。
摘要
論文概述
本論文介紹了一個名為 Arctique 的合成組織病理學數據集,旨在解決圖像分割中不確定性量化(UQ)方法評估和比較方面的挑戰。該數據集基於對真實組織病理學圖像的仔細建模,並提供對圖像和標籤中不確定性因素的精確控制,從而能夠對不同 UQ 方法進行系統和全面的評估。
研究背景
準確的圖像分割對於各種應用至關重要,特別是在醫療保健領域,其中準確的細胞和其他生物結構的識別對於診斷和治療決策至關重要。然而,由於圖像偽影、標籤噪聲和數據集中固有的模糊性,量化圖像分割算法的不確定性仍然是一個重大挑戰。
Arctique 數據集
Arctique 是一個程序生成的數據集,旨在模擬結腸組織活檢的組織病理學圖像的複雜性。該數據集包含 50,000 張渲染圖像,以及精確的遮罩和模擬的噪聲標籤。通過利用基於 Blender 的框架,Arctique 允許對細胞形狀、分佈、組織參數和染色特性進行精確控制。這種可控性使用戶能夠生成具有不同級別的不確定性的圖像,從而可以對 UQ 方法進行系統評估。
不確定性量化基準測試
為了證明 Arctique 的實用性,作者對四種常用的 UQ 方法進行了基準測試:最大 Softmax 響應 (MSR)、測試時間增強 (TTA)、蒙特卡洛 Dropout (MCD) 和深度集成 (DE)。通過將標籤噪聲引入細胞類別和形狀,以及通過操縱圖像特徵(如細胞核強度和血液染色)來系統地引入不確定性。結果表明,Arctique 能夠有效地評估和比較不同 UQ 方法的性能,突出了其作為開發和驗證更可靠的不確定性量化技術的寶貴資源的潛力。
結論
Arctique 數據集為推進圖像分割中的不確定性量化提供了一個有價值的基準測試平台。通過提供一個受控的環境來生成具有不同級別的不確定性的真實合成圖像,Arctique 允許對 UQ 方法進行系統和全面的評估。這種標準化評估對於促進更強大和可靠的圖像分割算法的開發至關重要,特別是在醫療保健等安全關鍵型應用中。
統計資料
Arctique 數據集包含 50,000 張渲染圖像。
這些圖像的尺寸為 512x512 像素。
數據集包括精確的遮罩和模擬的噪聲標籤。
作者使用 Arctique 訓練了一個 HoVer-NeXt (HN) 模型,並在真實的 H&E 圖像上進行了零樣本推斷。
他們評估了四種 UQ 方法:最大 Softmax 響應 (MSR)、測試時間增強 (TTA)、蒙特卡洛 Dropout (MCD) 和深度集成 (DE)。
引述
"To unify both controllability and complexity, we introduce Arctique, a procedurally generated dataset modeled after histopathological colon images."
"Arctique provides 50,000 pre-rendered 512x512-sized images for training and evaluation of segmentation tasks, shipped with exact masks (2D and 3D), metadata storing characteristics of cellular objects, and rendering parameters to re-generate scenes."
"To showcase how Arctique can be used for insightful benchmarking of UQ methods, we assess foreground-background segmentation and semantic segmentation and measure the effect of uncertainty in the images and the labels separately."