自然言語処理競技会におけるシステムのパフォーマンス分析は、競技会結果を効果的に評価するための手法を提案しています。この手法は、ブートストラップ法を使用して各競技者と勝者との性能差について信頼区間を構築します。さらに、統計的有意性を計算して、一部の競技者が他者よりも優れているかどうかを判断します。複数比較補正方法も適用され、異なるNLP競技会がその競争力や将来の改善可能性について比較されます。
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Serg... às arxiv.org 03-08-2024
https://arxiv.org/pdf/2403.04693.pdfPerguntas Mais Profundas