이 연구는 BERT 모델의 미세 조정 과정에서 어휘 범주(내용어와 기능어)에 따라 토큰 간 주의 점수가 어떻게 변화하는지 조사했다.
실험 결과:
추가로, 특정 BERT 층이 어휘 범주에 대한 선호도를 일관되게 보이는 것을 발견했다. 이는 BERT 층이 언어학적 지식을 일반화할 수 있음을 시사한다.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Dongjun Jang... في arxiv.org 03-26-2024
https://arxiv.org/pdf/2403.16447.pdfاستفسارات أعمق