Download Linnk AI
•
Research Assistant
>
Sign In
insight
-
大規模言語モデルの安全性と攻撃手法
大規模言語モデル(LLMs)の二面性:Dr. JekyllとMr. Hyde
ChatGPTやBardなどのチャットボットは、悪意あるペルソナを利用して安全メカニズムを回避される可能性があり、信頼できるペルソナを導入することでこれらの攻撃に対抗できることが示唆されている。
1