Core Concepts
大規模言語モデルを使用して、製薬製造における過去の事故や逸脱の記録を活用し、新しい事例への対応を迅速かつ効果的に行うことができる。
Abstract
本研究では、製薬製造における事故や逸脱の調査プロセスにおいて、大規模言語モデルの活用可能性を検討した。
まず、一般目的の大規模言語モデル(GPT-3.5、GPT-4、Claude-2)を使用して、事故や逸脱の記録から特定の情報(発生日、製造サイト、影響を受けた製品バッチ、品質への影響、根本原因)を抽出する能力を評価した。その結果、GPT-4とClaude-2は高い精度を示したが、時に複雑な推論と幻覚的な振る舞いが見られた。
次に、過去の事例の記述をベクトル表現化し、類似した事例を検索する手法を検討した。この手法は、新しい事例に対して過去の知見を活用する上で有効であることが示された。ただし、製造分野に特化した事例間の微妙な違いを捉えるには、さらなる改善が必要である。
今後は、より明確な問題設定と、製造分野に特化したデータセットの構築が重要である。また、プロンプトエンジニアリングや、文書検索手法の改善など、大規模言語モデルの活用を高度化する取り組みが期待される。
Stats
製造サイトの特定に関して、ある事例では製造サイトの情報が報告書に記載されていなかったが、モデルは関連する情報から推論して製造サイトを特定した。
Quotes
"LLMsは数学モデルであり、すべてのタスクですべてのデータに優れているわけではない。したがって、私たちは問題を特定のサブタスクに分割し、各タスクについてモデルのパフォーマンスを定量化した。"