下載 Linnk AI
•
AI 研究助理
>
登入
洞見
-
신뢰할 수 없는 언어 모델에서 잠재적 지식 추출
"신뢰할 수 없는 언어 모델에서 잠재적 지식 추출하기"
신뢰할 수 없는 언어 모델의 활성화 패턴에서 진실을 가리키는 패턴을 찾아내는 Eliciting Latent Knowledge (ELK) 방법론을 소개하고 평가한다.
1