バイオメディカル分野の大規模言語モデルの性能を、自動ベンチマークだけでなく人間評価によっても評価する必要がある。エルゼビアが独自に開発した大規模言語モデルは、OpenAIのGPT-3.5-turboやMeta社のLlama 2と比較して、特に会話能力や大規模データセットの活用においては劣るものの、小規模ながら高品質なデータセットを活用することで、バイオメディカル分野での有力な代替案となる可能性がある。
バイオメディカル文献から遺伝子と疾患の関連性を抽出し、ナレッジグラフを構築する自動化アプローチ