Grunnleggende konsepter
単一細胞シーケンスデータを用いた高精細な異常細胞検出と分類のための新しい枠組みACSleuthを提案する。ACSleuthは、異常細胞の検出、領域適応、高精細な注釈付けを統合的に行うことができる。
Sammendrag
単一細胞シーケンスデータは、疾患の病理学的な異質性を調査するための重要な機会を提供する。しかし、現在の異常検出手法は、複数のサンプルや領域間の違いに対処するのが困難で、高精細な注釈付けも不十分である。
本研究では、ACSleuthと呼ばれる新しい枠組みを提案する。ACSleuthは以下の3つのフェーズから構成される:
異常細胞検出フェーズ:
参照データセットに基づいて訓練されたGANモデルを使用して、標的データセットの異常細胞を検出する。
再構成誤差に基づく新しい最大平均二乗偏差(MMD)スコアを開発し、領域シフトに対するロバスト性を理論的に証明する。
領域適応フェーズ:
参照データセットと標的データセットの間の「近縁」な正常細胞ペアを見つけ、それらから領域シフトを学習する。
学習した領域シフトを使用して、標的データセットの細胞を参照領域に適応させる。
高精細な異常細胞注釈付けフェーズ:
領域適応された異常細胞の埋め込みと再構成誤差を融合し、自己ペースの深層クラスタリングを行う。
これにより、より表現力のある異常細胞表現が得られ、高精細な注釈付けが可能になる。
ACSleuthは、様々な単一細胞データセットや他のタイプのデータに対して、状態の技術を大きく上回る性能を示す。特に、複数のサンプルや領域間の違いが存在する場合や、サンプル固有の異常細胞タイプが存在する場合に優れた結果を得ている。
Statistikk
単一細胞データセットには、生物学的な変動と技術的な違いによる領域シフトが存在する。
領域シフトと内容シフトが混在すると、以下のような3つのタイプの誤りが生じる:
正常細胞が異常として誤検出される
同一タイプの異常細胞が異なるタイプとして分類される
異なるタイプの異常細胞が誤って1つのタイプにまとめられる
Sitater
"単一細胞シーケンスデータは、疾患の病理学的な異質性を調査するための重要な機会を提供する。"
"現在の異常検出手法は、複数のサンプルや領域間の違いに対処するのが困難で、高精細な注釈付けも不十分である。"
"ACSleuthは、様々な単一細胞データセットや他のタイプのデータに対して、状態の技術を大きく上回る性能を示す。"