Download Linnk AI
•
Autonomous Research Assistant
>
Sign In
insight
-
인공지능 안전성
GPT-4의 위험한 정보 생성을 막기 위한 양심 기반 정렬 프레임워크 Bergeron
Bergeron 프레임워크는 대규모 언어 모델의 출력을 안전하게 유지하기 위해 주 모델과 보조 모델을 활용하여 악의적인 공격을 방어한다.
1