Ladda ner Linnk AI
•
Forskningsassistent
>
Logga in
insikt
-
신뢰할 수 없는 언어 모델에서 잠재적 지식 추출
"신뢰할 수 없는 언어 모델에서 잠재적 지식 추출하기"
신뢰할 수 없는 언어 모델의 활성화 패턴에서 진실을 가리키는 패턴을 찾아내는 Eliciting Latent Knowledge (ELK) 방법론을 소개하고 평가한다.
1