본 연구 논문에서는 그리스어 트윗의 감정 분석 및 공격적 언어 식별 작업에서 예측과 자연어 설명을 모두 제공하는 새로운 멀티태스크 텍스트 분류 파이프라인을 제안합니다.
기존의 해석 가능한 기계 학습 기술은 주로 규칙 또는 특징 중요도 기반의 해석을 제공하지만, 이는 비전문가 사용자에게 이해하기 어려울 수 있습니다. 따라서 최근에는 사용자가 쉽게 이해할 수 있는 자연어 형태의 설명이 선호되고 있습니다.
본 논문에서 제안하는 파이프라인은 텍스트에 레이블을 지정하는 분류기와 자연어로 설명을 제공하는 설명 생성기의 두 가지 모델로 구성됩니다. 텍스트 분류 문제에 적용 가능하며, 설명 생성기 학습을 위해서는 근거 데이터가 필요합니다. 본 연구에서는 그리스어 대규모 언어 모델(LLM)을 사용하여 근거 데이터를 생성하고, 사용자 연구를 통해 설명의 타당성, 일관성, 오해 가능성을 평가합니다.
실험 결과, 제안된 파이프라인은 충분한 양의 학습 데이터와 설명이 제공될 때 적절한 설명을 생성할 수 있으며, 단일 멀티태스크 모델을 사용할 때 발생할 수 있는 분류기 성능 저하 없이 효과적으로 작동함을 확인했습니다. 또한, 기계 생성 설명을 사용하더라도 설명의 품질이 크게 저하되지 않았습니다.
본 연구는 텍스트 분류 및 텍스트 생성이라는 두 가지 다른 유형의 다운스트림 작업을 효과적으로 수행하는 파이프라인을 제시하고, 텍스트 입력과 분류 레이블 정보를 결합하여 설명 생성기의 학습 프로세스를 용이하게 하는 방법을 제시했습니다. 또한, 근거 데이터가 없는 저자원 언어에서 기계 생성 설명을 사용하여 설명 생성기를 학습하는 방법을 제안했습니다.
향후 연구에서는 더 많은 영어 데이터 세트를 포함하도록 실험 절차를 확장하고, 인간의 주석이 달린 근거 데이터를 사용하여 설명의 타당성과 일관성을 향상시키는 데 주력할 예정입니다. 또한, 다양한 배경을 가진 더 많은 사용자를 대상으로 사용자 연구를 수행하고, 예측과 설명을 동시에 제공할 수 있는 단일 자기 합리화 모델을 사용하여 성능을 비교 분석할 계획입니다. 마지막으로, 분류기 및 설명 생성기에 대해 다양한 모델을 테스트하여 성능을 향상시키는 연구를 수행할 예정입니다.
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések