感情的プロソディを使ったバックドア攻撃は、発話者識別システムの完全性を危険にさらすことができる。
フィッシング Webページ検出モデルの堅牢性を評価するために、多様なフィッシング特徴を組み込んだ敵対的なフィッシング Webページを生成する。
攻撃-防御木を使用して、デジタル電力メーターへの不正アクセスの可能性を分析し、対策の優先順位を付けることができる。
人工知能技術の悪用により、民主主義プロセスが深刻な脅威に晒されている。偽造動画、ボットネット、標的型の虚偽情報キャンペーン、合成アイデンティティなどの手口を通じて、有権者の行動に影響を及ぼし、公共の信頼を損なう可能性がある。
Twitter上のユーザープロフィールの自己表現の次元を測定し、それらが誤情報共有に及ぼす影響を明らかにする。特に、年齢と政治的立場の交互作用、および宗教性との関係に焦点を当てる。
データ浄化、活性化クリッピング、分類器ファインチューニングを統合したPAD-FTは、追加のクリーンデータセットを必要とせず、モデルの一部のみをファインチューニングすることで、様々な裏口攻撃に対して効果的に防御できる。
ログデータの内容と因果関係を統合的に捉えることで、ラベル付きデータを必要とせずに効果的なログ異常検知を実現する。
本論文では、GDPR の要件を満たす個人情報の同意管理システムの実装を検証する方法を提案する。
ID不要型レコメンデーションシステムは、従来のID埋め込み型システムの限界を克服するために提案されたが、LLMを使った文章シミュレーション攻撃に対して脆弱であることが明らかになった。
大規模言語モデルの安全性メカニズムは、数学的表現に対して脆弱であり、有害なコンテンツの生成を許してしまう可能性がある。