本論文では、黒箱分類器を用いて、オンラインコメントの毒性度合いを推定する手法を提案している。
まず、校正フェーズでは、基準データセットの一部にラベルを付与し、分類器出力と真のラベルの関係を学習する。次に、外挿フェーズでは、基準データセットと目標データセットの間の何らかの安定性を仮定し、目標データセットの毒性度合いを推定する。
具体的には、以下の手順を踏む:
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Siqi Wu,Paul... at arxiv.org 04-03-2024
https://arxiv.org/pdf/2401.09329.pdfDeeper Inquiries