이 논문은 신경망 기계 번역(NMT) 시스템의 윤리적 문제를 다룹니다.
데이터 수집 및 준비 단계에서는 다음과 같은 윤리적 고려사항이 있습니다:
데이터 레이블링 단계에서는 AI 보조 레이블링의 정확성과 편향 문제, 전문가 레이블러의 편향 및 이해관계 충돌 등이 고려되어야 합니다.
모델 학습 단계에서는 데이터 불균형 해결, 오픈소스 코드 활용의 윤리성, 적절한 토큰화 방법 선택 등이 중요합니다.
마지막으로 연구 결과 공개 및 활용 단계에서는 데이터셋 공개, 사전 훈련 모델 공유, 출판 윤리, 투명성 및 재현성 등이 고려되어야 합니다.
이러한 윤리적 고려사항을 체계적으로 다루는 것이 NMT 기술의 공정성, 투명성, 책임성 있는 발전을 위해 필수적입니다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Richard Kime... lúc arxiv.org 04-02-2024
https://arxiv.org/pdf/2404.01070.pdfYêu cầu sâu hơn