이 연구는 아랍어 자연어 처리 분야의 중요한 격차를 해소하기 위해 ArabicaQA라는 대규모 데이터셋을 소개합니다. 이 데이터셋은 아랍어 기계 독해 및 오픈 도메인 질문 답변을 위한 첫 번째 대규모 데이터셋입니다.