本研究は、ソフトウェア関連情報抽出の精度向上を目的として、ジェネラティブ言語モデル(GLM)を活用した単一選択式問題解答アプローチを提案している。
まず、ソフトウェア関連エンティティの抽出(Subtask 1)では、SciBERTモデルのファインチューニングと、GLMsを用いた手法を比較している。GLMsでは、ランダムサンプルの使用や、エンティティ・文章の類似性に基づいた検索手法を検討し、最大67.9%のF1スコアを達成した。
次に、ソフトウェア属性の抽出(Subtask 2)では、ソフトウェアエンティティを事前に与えることで、属性情報の抽出精度を10%以上向上させている。
最後に、ソフトウェア関係抽出(Subtask 3)では、エンティティ間の関係を単一選択式の問題として定式化し、GLMsに解答させる手法を提案した。これにより、ルールベースのベースラインよりも5.1%のF1スコア向上を実現した。
本研究の成果は、ドメイン固有のタスクにおけるGLMsの活用可能性を示すものであり、ソフトウェア関連情報抽出の精度向上に大きく貢献すると考えられる。
To Another Language
from source content
arxiv.org
ข้อมูลเชิงลึกที่สำคัญจาก
by Wolfgang Ott... ที่ arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.05587.pdfสอบถามเพิ่มเติม