本研究では、食事と腸内細菌叢の関係に関する科学文献165本を収集し、15種類のエンティティ(栄養素、微生物など)と13種類の関係(増加、改善など)を注釈付けした大規模なコーパス「DiMB-RE」を構築した。
このコーパスを用いて、最新の自然言語処理モデルによるエンティティ認識、関係抽出、確実性検出の性能を評価した。
エンティティ認識の精度は0.760 F1と良好だったが、関係抽出の精度は0.356 F1と限定的であった。これは、エンティティ認識やトリガー認識の誤りや、文間関係の抽出が難しいことが原因と考えられる。
今後の課題として、エンティティ認識とトリガー認識の精度向上、文間関係の抽出、用語の標準化などが挙げられる。
DiMB-REは食事-腸内細菌叢の関係を網羅する最大規模のコーパスであり、この分野の自然言語処理研究の基準となることが期待される。
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Gibong Hong,... om arxiv.org 10-01-2024
https://arxiv.org/pdf/2409.19581.pdfDiepere vragen