この研究は、YouTube動画から収集されたコード混在Hinglishでの女性蔑視検出用の新しいデータセットに焦点を当てています。EDA技術が使用され、データセットの特性やパターンに洞察を得ることが目的です。さまざまなEDA技術が適用され、コメントの長さや感情スコアなど、有益な情報が明らかにされました。PCAにより3つのクラスターが特定され、コード混在コメントが別々にクラスタリングされました。今後は機械学習および深層学習モデルのトレーニングと評価と並行して重要な要因を明らかにするための追加分析が行われます。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Sargam Yadav... alle arxiv.org 03-18-2024
https://arxiv.org/pdf/2403.09709.pdfDomande più approfondite