この論文では、韓国の会話における皮肉検出タスク向けの新しいデータセット「KoCoSa(Korean Context-aware Sarcasm Detection Dataset)」を紹介しています。データセットは12.8K件の日常的な韓国語対話から成り、最後の応答に対するラベルが含まれています。データセット構築には、大規模言語モデルを活用した効率的な流れが提案されており、自動および手動フィルタリング、人間アノテーションが行われました。さらに、提案されたデータセットでGPTモデルなどを使用したベースラインパフォーマンスも提供されています。
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Yumin Kim,He... às arxiv.org 03-25-2024
https://arxiv.org/pdf/2402.14428.pdfPerguntas Mais Profundas