이 연구는 단일 세포 전사체 프로파일을 자동으로 주석 달기 위한 새로운 클래스 발견 문제를 다룬다. 단일 세포 전사체 데이터는 고차원이고 크기가 크기 때문에 자동화된 주석 방법이 필요하다. 이 연구에서는 발달생물학 실험 상황에서 자주 발생하는 특정한 설정을 다룬다. 즉, 레이블된 데이터와 레이블되지 않은 데이터가 모두 있지만, 레이블된 데이터와 레이블되지 않은 데이터의 레이블 집합이 겹치지 않는 경우이다.
이를 해결하기 위해 계층적 구조를 활용하는 새로운 클러스터링 방법인 h-k-Means와 h-GMM을 제안한다. 이 방법들은 데이터의 계층적 구조에 대한 사전 지식을 활용하여 클러스터링 성능을 향상시킨다. 인공 데이터와 실험 데이터에 대한 실험 결과, 제안 방법들이 기존 방법들에 비해 우수한 성능을 보였다. 특히 인공 데이터에서 좋은 성능을 보였는데, 이는 데이터의 계층적 구조가 명확할 때 제안 방법들의 장점이 잘 드러나기 때문이다. 실험 데이터에서는 계층적 구조가 명확하지 않아 성능 향상이 제한적이었다.
Ke Bahasa Lain
dari konten sumber
arxiv.org
Pertanyaan yang Lebih Dalam