Linnk AI 다운로드
•
리서치 어시스턴트
>
로그인
통찰
-
신뢰할 수 없는 언어 모델에서 잠재적 지식 추출
"신뢰할 수 없는 언어 모델에서 잠재적 지식 추출하기"
신뢰할 수 없는 언어 모델의 활성화 패턴에서 진실을 가리키는 패턴을 찾아내는 Eliciting Latent Knowledge (ELK) 방법론을 소개하고 평가한다.
1