이 논문은 SemEval-2024 Task 1: 의미적 텍스트 관련성 과제에 참여한 IITK 팀의 시스템을 설명한다. 이 과제는 14개 언어(아프리카어와 아시아어 포함)로 구성된 문장 쌍의 의미적 관련성 정도를 자동으로 탐지하는 것이 목표이다.
팀은 두 가지 하위 과제에 참여했는데, Track A는 지도 학습 기반, Track B는 비지도 학습 기반이다. 이 논문은 주로 Track A의 BERT 기반 대조 학습 및 유사도 메트릭 접근법을 다루며, Track B에서는 자동 인코더를 활용한 방법을 소개한다. 또한 부정적 샘플링 전략을 사용하여 바이그램 관련성 말뭉치를 생성하고, 이를 통해 정제된 단어 임베딩을 생성하는 방법도 제안한다.
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Udvas Basak,... pada arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.04513.pdfPertanyaan yang Lebih Dalam