核心概念
ChatGPTは、伝統中国医学(TCM)の知識を理解する能力において、最も真偽問わず高い精度を示す。
要約
背景:大規模言語モデル(LLMs)は、医療分野を含むさまざまな領域で自然言語の理解と生成能力を示してきた。
方法:TCM-QAというTCM用質問データセットを提供し、LLMsの性能を評価。英語と中国語プロンプトの違いも検証。
結果:ChatGPTは真偽問わず質問で最高の精度を達成し、中国語プロンプトが有利であることが明らかになった。
結論:本研究は、LLMsが専門分野でどれだけ有用かを示し、将来的な研究への道筋を開く。
統計
ChatGPTはtrue or false質問で最高精度0.688を達成した。
ChatGPTはmultiple-choice質問で最低精度0.241を記録した。
引用
"In-context learning"は自然言語処理(NLP)における新しいパラダイムであり、テキストプロンプトを使用して下流タスクを再構築する。
伝統中国医学(TCM)では臨床判断に複雑なデータ統合が関与する。