この記事は、バングラ文学における著者特定の重要性と難しさに焦点を当てています。インターネット上での匿名性が増加する中で、セキュリティや盗作検出分野でこのタスクがますます重要となっています。英語、スペイン語、中国語など他言語での進歩にもかかわらず、バングラでは言語的特徴や文章構造の複雑さから包括的な研究が不足しています。本研究では、AWD-LSTMアーキテクチャと効果的な転移学習手法を提案しました。また、16人の作者から成る公開データセット(BAAD16)を導入し、他言語NLPタスク向けに6つの事前トレーニング済み言語モデルをリリースしました。実験的に、提案されたモデルは最新技術モデルよりも優れたパフォーマンスを発揮し、BAAD16データセットで99.8%の精度を達成しました。
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Aisha Khatun... pada arxiv.org 03-11-2024
https://arxiv.org/pdf/2403.05519.pdfPertanyaan yang Lebih Dalam