Download Linnk AI
•
Autonomous Research Assistant
>
Sign In
insight
-
大規模言語モデルのトロイ検出
大規模言語モデルにおけるトロイの検出: NeurIPS 2023 Trojan Detection Challengeからの洞察
大規模言語モデルにおけるトロイの検出は非常に困難であり、既存の手法では十分な検出精度を達成できないことが明らかになった。トロイの挿入方法によっては、検出が事実上不可能になる可能性がある。
1