自然言語処理競技会におけるシステムのパフォーマンス分析は、競技会結果を効果的に評価するための手法を提案しています。この手法は、ブートストラップ法を使用して各競技者と勝者との性能差について信頼区間を構築します。さらに、統計的有意性を計算して、一部の競技者が他者よりも優れているかどうかを判断します。複数比較補正方法も適用され、異なるNLP競技会がその競争力や将来の改善可能性について比較されます。
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Serg... klokken arxiv.org 03-08-2024
https://arxiv.org/pdf/2403.04693.pdfDypere Spørsmål