이 연구는 BERT 모델의 미세 조정 과정에서 어휘 범주(내용어와 기능어)에 따라 토큰 간 주의 점수가 어떻게 변화하는지 조사했다.
실험 결과:
추가로, 특정 BERT 층이 어휘 범주에 대한 선호도를 일관되게 보이는 것을 발견했다. 이는 BERT 층이 언어학적 지식을 일반화할 수 있음을 시사한다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Dongjun Jang... at arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.16447.pdfDeeper Inquiries