この論文では、韓国の会話における皮肉検出タスク向けの新しいデータセット「KoCoSa(Korean Context-aware Sarcasm Detection Dataset)」を紹介しています。データセットは12.8K件の日常的な韓国語対話から成り、最後の応答に対するラベルが含まれています。データセット構築には、大規模言語モデルを活用した効率的な流れが提案されており、自動および手動フィルタリング、人間アノテーションが行われました。さらに、提案されたデータセットでGPTモデルなどを使用したベースラインパフォーマンスも提供されています。
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Yumin Kim,He... ב- arxiv.org 03-25-2024
https://arxiv.org/pdf/2402.14428.pdfשאלות מעמיקות