Conceitos essenciais
本研究は、臨床文献から実験的発見を抽出するための新しい表現スキーマを提案し、それに基づいて高品質な注釈付きデータセットを構築した。
Resumo
本研究は、科学文献から実験的発見を抽出し、構造化する重要性について述べている。従来の手法では、発見の複雑さや微妙さを十分に捉えられていなかった。
本研究では、バイオメディカル分野を対象に、実験的発見を n 項関係として表現するスキーマを開発した。このスキーマは、非連続的なエンティティスパン、ネストされた関係、可変アリティの n 項関係などの複雑な現象を統一的に扱うことができる。
この新しいスキーマに基づいて、700 件の抄録(臨床試験と症例報告)に対して詳細な注釈付けを行い、CARE データセットを構築した。さらに、コンピュータサイエンスと材料科学の分野でも同様の注釈付けを行い、スキーマの汎用性を示した。
CARE データセットを用いて、最新の情報抽出モデルの性能を評価した。その結果、GPT4 を含む高性能モデルでも、特に関係抽出の部分で大きな課題があることが明らかになった。
CARE は、科学文献からの発見抽出に関する重要な課題に取り組むための新しい基準を示すものであり、この分野の研究を大きく前進させることが期待される。
Estatísticas
123 回の発作が placebo 期間に観察され、31 回が治療期間に観察された (p < 0.006)
130 回の発作が placebo 期間に観察され、23 回が治療期間に観察された (p < 0.003)
Citações
"It is surely a great criticism of our profession that we have not organised a critical summary, by specialty or sub-specialty, adapted periodically, of all relevant randomised controlled trials."