ポルトガル語の神経処理を支援するために、主要な英語ベンチマークをマシン翻訳して作成したデータセットと、それらのデータセットを使用して微調整したモデルを提供する。
単一の自己注意層を用いることで、一般化ポッツモデルの条件付き確率分布を正確に再構築できることを示した。
LLMsを使った憎悪スピーチ検出モデルの性能は、ファインチューニングのパラメータや、トレーニングデータの特性に大きく依存する。また、モデルの分野横断的な汎化性能も重要な課題である。
深層学習モデルなどの高度な現代システムが説得力のある現実的なコンテンツを生成する能力が高まるにつれ、機械生成コンテンツと人間生成コンテンツを区別する必要性が高まっている。
対照学習と効果的なデータ拡張を組み合わせることで、単一のモデルでも機械生成テキストを高精度に検出できることを示した。
スタイル表現を活用することで、少量の機械生成テキストサンプルから、人間が書いたテキストと機械生成テキストを効率的に区別できる。さらに、特定の言語モデルによって生成されたテキストを予測することも可能。