이 연구는 포르투갈어 신경 언어 처리를 위한 벤치마크 데이터셋과 모델을 제공한다. 영어 GLUE와 SuperGLUE 벤치마크를 기반으로 기계 번역을 통해 포르투갈어 버전을 만들었으며, 이를 PORTULAN ExtraGLUE로 명명했다. 또한 이 데이터셋을 활용하여 저랭크 적응(LoRA) 기법으로 포르투갈어 언어 모델을 미세 조정하고 공개했다.
이 연구에서는 포르투갈어 정의 생성을 위한 첫 번째 데이터셋인 DORE를 소개하고, 다양한 딥러닝 모델을 사용하여 DORE 데이터셋에서 정의 생성 실험을 수행한다.