Core Concepts
医療分野におけるプロンプトエンジニアリングの現状を包括的に分析し、効果的な活用と改善のための指針を提示する。
Abstract
本レビューは、医療分野におけるプロンプトエンジニアリングの現状を包括的に分析している。
主な知見は以下の通り:
プロンプトデザイン(PD)が最も一般的な手法で、78本の論文が該当する。一方、プロンプトラーニング(PL)が29本、プロンプトチューニング(PT)が19本と、PD以外の手法も活用されている。
ChatGPTが最も一般的に使用されているLLMで、7本の論文で機密性の高い臨床データの処理に用いられている。Chain-of-Thoughtが最も一般的なプロンプト手法となっている。
PL及びPTの論文では、従来の微調整手法との比較が行われることが多いが、PDの論文の64%では非プロンプト関連のベースラインが示されていない。
言語面では英語が圧倒的に多いが、中国語などの他言語の論文も散見される。ただし英語以外の言語については明示的に記載されることが多い。
今後の研究に向けて、プロンプトエンジニアリングの手法や設定の詳細な報告、ベースラインとの比較、言語の明示などが重要であると提言している。
Stats
ChatGPTは7本の論文で機密性の高い臨床データの処理に用いられている。
Chain-of-Thoughtが最も一般的なプロンプト手法で、17本の論文で使用されている。
PL及びPTの論文の22本では、従来の微調整手法との比較を行っており、17本がプロンプトベースの手法の優位性を示している。
Quotes
"医療分野におけるプロンプトエンジニアリングの効果は未だ十分に探索されていない。"
"プロンプトデザイン(PD)が最も一般的な手法で、78本の論文が該当する。"
"PL及びPTの論文では、従来の微調整手法との比較が行われることが多いが、PDの論文の64%では非プロンプト関連のベースラインが示されていない。"