이 연구는 BERT 모델의 미세 조정 과정에서 어휘 범주(내용어와 기능어)에 따라 토큰 간 주의 점수가 어떻게 변화하는지 조사했다.
실험 결과:
추가로, 특정 BERT 층이 어휘 범주에 대한 선호도를 일관되게 보이는 것을 발견했다. 이는 BERT 층이 언어학적 지식을 일반화할 수 있음을 시사한다.
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Dongjun Jang... klokken arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.16447.pdfDypere Spørsmål