이 논문은 SemEval-2024 Task 1: 의미적 텍스트 관련성 과제에 참여한 IITK 팀의 시스템을 설명한다. 이 과제는 14개 언어(아프리카어와 아시아어 포함)로 구성된 문장 쌍의 의미적 관련성 정도를 자동으로 탐지하는 것이 목표이다.
팀은 두 가지 하위 과제에 참여했는데, Track A는 지도 학습 기반, Track B는 비지도 학습 기반이다. 이 논문은 주로 Track A의 BERT 기반 대조 학습 및 유사도 메트릭 접근법을 다루며, Track B에서는 자동 인코더를 활용한 방법을 소개한다. 또한 부정적 샘플링 전략을 사용하여 바이그램 관련성 말뭉치를 생성하고, 이를 통해 정제된 단어 임베딩을 생성하는 방법도 제안한다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Udvas Basak,... a las arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.04513.pdfConsultas más profundas