この論文では、韓国の会話における皮肉検出タスク向けの新しいデータセット「KoCoSa(Korean Context-aware Sarcasm Detection Dataset)」を紹介しています。データセットは12.8K件の日常的な韓国語対話から成り、最後の応答に対するラベルが含まれています。データセット構築には、大規模言語モデルを活用した効率的な流れが提案されており、自動および手動フィルタリング、人間アノテーションが行われました。さらに、提案されたデータセットでGPTモデルなどを使用したベースラインパフォーマンスも提供されています。
Іншою мовою
із вихідного контенту
arxiv.org
Ключові висновки, отримані з
by Yumin Kim,He... о arxiv.org 03-25-2024
https://arxiv.org/pdf/2402.14428.pdfГлибші Запити