의료 컴퓨터 비전에서의 추적 및 매핑의 중요성과 알고리즘 개발의 필요성
본 논문에서는 다양한 의료 영상 데이터셋에 적용 가능하고, 도메인 변화에 강하며, 실제 값 및 쿼터니언 값 모델 모두에서 성능을 향상시키는 일반화 가능한 의료 영상 분석 프레임워크인 QUAVE를 제안합니다.
뇌척수액 조영제 주입 후 24시간 후의 분포를 예측하는 데 딥러닝 기반 U-net 모델이 효과적이며, 특히 주입 후 1-2시간 내의 영상만으로도 높은 예측 정확도를 보여줌으로써 기존의 뇌척수액 검사 방식을 개선할 가능성을 제시했습니다.
의료 영상 분석 분야에서 기반 모델의 잠재력을 최대로 활용하려면 개인정보 보호, 견고성, 안정성, 설명 가능성 및 공정성을 포함한 신뢰성을 보장하는 것이 중요합니다.
MedImageInsight는 다양한 의료 영상 분야에서 최첨단 성능을 달성하는 가볍고 확장 가능한 오픈 소스 딥러닝 모델로, 의료 영상 AI 연구 개발의 진보를 위한 투명하고 접근 가능한 도구를 제공합니다.
대규모 데이터셋을 사용한 사전 훈련과 훈련 중 클래스 불균형을 해결하면 인간 전문가의 판단과 유사한 해석 가능성을 갖춘 정확한 결핵 감지 모델을 개발할 수 있습니다.
X-RGen이라는 새로운 방사선 보고서 생성 프레임워크는 여러 해부학적 영역에서 의료 영상을 분석하고 방사선 전문의의 사고 과정을 모방하여 정확하고 일관된 보고서를 생성합니다.
VoxelPrompt는 자연어 프롬프트를 통해 다양한 의료 영상 분석 작업을 수행할 수 있는 새로운 비전-언어 에이전트 기반 프레임워크입니다.
본 논문에서는 대규모 레이블링되지 않은 흉부 X선 이미지 데이터셋을 사용하여 자기 지도 학습을 통해 훈련된 새로운 기반 모델인 CXRBase를 소개합니다. CXRBase는 다양한 흉부 질환 선별 및 진단 작업에 효과적으로 적용될 수 있으며, 기존 모델보다 우수한 성능과 레이블 효율성을 보여줍니다.
자체 구축한 대규모 언어 모델(LLM)을 미세 조정하여 영상의학 보고서에서 감별 진단을 효과적으로 추론할 수 있으며, 이는 상용 LLM의 높은 비용 및 개인 정보 보호 문제를 해결하면서 GPT-4에 필적하는 성능을 달성할 수 있다.