本研究では、大規模言語モデル(LLM)を活用して、臨床試験データから表やグラフを自動生成する手法を検討した。
まず、CDISC Pilot データセットを使用して、LLMを用いて人口統計量の要約、ベースラインの計算、エンドポイントでの有効性の要約などの表を生成した。LLMに適切なプロンプトを与えることで、手動で作成した結果と100%一致する表を生成できることを示した。
次に、Novartisの別の臨床試験データセットを用いて、同様の手法を適用し、わずかな修正で同様の結果が得られることを確認した。これにより、LLMを用いた表の自動生成が、様々な臨床試験データに対して適用可能であることが示された。
さらに、ユーザーが簡単に表を生成できるよう、「臨床試験TFL生成エージェント」と呼ばれるアプリケーションを開発した。このアプリケーションでは、ユーザーの要求を事前定義された表の説明と照合し、適切なプロンプトを使ってLLMに表の生成を行わせる。これにより、ユーザーは統計的知識がなくても表を生成できるようになる。
本研究の結果は、LLMを用いて臨床試験データから表やグラフを自動生成する可能性を示しており、報告書作成の効率化に貢献できると考えられる。今後の課題としては、統計的検定を含む複雑な分析への対応や、ユーザーとの対話を通じたシステムの改善などが挙げられる。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Yumeng Yang,... kl. arxiv.org 09-19-2024
https://arxiv.org/pdf/2409.12046.pdfDybere Forespørgsler