Core Concepts
病理学分野における汎用的なマルチモーダルな AI アシスタントシステムの開発と評価
Abstract
この論文では、病理学分野における汎用的なマルチモーダルな AI アシスタントシステム「PathChat」の開発と評価について述べている。
まず、病理学分野では、特定のタスクに特化した予測モデルや自己教師あり視覚エンコーダーの開発が進んでいるが、一般目的のマルチモーダル AI アシスタントの研究は限られていることが指摘されている。
そこで本研究では、病理学分野の視覚エンコーダーと大規模言語モデルを組み合わせ、45万6千以上の多様な視覚言語命令データを用いてファインチューニングを行い、PathChat を構築した。
PathChat は、多肢選択式の診断問題や自由回答形式の問題に対して、既存のマルチモーダル AI アシスタントや ChatGPT-4 を上回る性能を示した。また、病理学専門家による評価でも、より正確で好ましい回答を生成することが確認された。
PathChat は、病理学の教育、研究、臨床意思決定支援などへの応用が期待される、対話型の汎用的なビジョン・言語 AI コパイロットである。
Stats
456,000 以上の多様な視覚言語命令データを使用してシステムを構築した
999,202 の質問-回答ペアから成るデータセットを活用した
多肢選択式の診断問題や自由回答形式の問題に対して、既存システムを上回る性能を示した
Quotes
"病理学分野における汎用的なマルチモーダルな AI アシスタントシステムの開発と評価"
"PathChat は、病理学の教育、研究、臨床意思決定支援などへの応用が期待される、対話型の汎用的なビジョン・言語 AI コパイロットである"