이 논문은 OccCANINE이라는 새로운 도구를 소개한다. OccCANINE은 직업 설명을 HISCO 분류 체계에 자동으로 매핑한다. 직업 설명을 HISCO 코드로 변환하는 수동 작업은 오류가 발생하기 쉽고 시간이 많이 소요된다. 우리는 기존의 언어 모델(CANINE)을 미세 조정하여 이 작업을 자동화했다. 이를 통해 이전에 며칠이나 걸렸던 작업을 몇 분 만에 수행할 수 있다.
OccCANINE은 14개 언어로 된 1,400만 개의 직업 설명과 HISCO 코드 쌍을 사용하여 학습되었다. 이 모델의 정확도, 재현율, 정밀도가 모두 90% 이상이다. OccCANINE은 HISCO 장벽을 허물고 직업 구조 분석을 위한 데이터를 손쉽게 사용할 수 있게 만든다.
A otro idioma
del contenido fuente
arxiv.org
Consultas más profundas