この論文では、韓国の会話における皮肉検出タスク向けの新しいデータセット「KoCoSa(Korean Context-aware Sarcasm Detection Dataset)」を紹介しています。データセットは12.8K件の日常的な韓国語対話から成り、最後の応答に対するラベルが含まれています。データセット構築には、大規模言語モデルを活用した効率的な流れが提案されており、自動および手動フィルタリング、人間アノテーションが行われました。さらに、提案されたデータセットでGPTモデルなどを使用したベースラインパフォーマンスも提供されています。
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Yumin Kim,He... om arxiv.org 03-25-2024
https://arxiv.org/pdf/2402.14428.pdfDiepere vragen