Core Concepts
신경망 기계 번역 시스템의 개발 및 배포 과정에서 발생할 수 있는 윤리적 문제를 파악하고, 이를 해결하기 위한 실용적인 접근법을 제시한다.
Abstract
이 논문은 신경망 기계 번역(NMT) 시스템의 윤리적 문제를 다룹니다.
데이터 수집 및 준비 단계에서는 다음과 같은 윤리적 고려사항이 있습니다:
데이터 공유 및 사용 라이선스 준수
저작권이 있는 도구 사용에 대한 동의 확보
데이터 출처 및 대표성 확보
원격 협업 환경에서의 데이터 보안 및 프라이버시 보호
데이터 편향 해결
데이터 레이블링 단계에서는 AI 보조 레이블링의 정확성과 편향 문제, 전문가 레이블러의 편향 및 이해관계 충돌 등이 고려되어야 합니다.
모델 학습 단계에서는 데이터 불균형 해결, 오픈소스 코드 활용의 윤리성, 적절한 토큰화 방법 선택 등이 중요합니다.
마지막으로 연구 결과 공개 및 활용 단계에서는 데이터셋 공개, 사전 훈련 모델 공유, 출판 윤리, 투명성 및 재현성 등이 고려되어야 합니다.
이러한 윤리적 고려사항을 체계적으로 다루는 것이 NMT 기술의 공정성, 투명성, 책임성 있는 발전을 위해 필수적입니다.
Stats
"데이터 수집 및 준비 단계에서 데이터 공유 및 사용 라이선스 준수가 중요합니다."
"데이터 레이블링 시 AI 보조 레이블링의 정확성과 편향 문제를 해결해야 합니다."
"모델 학습 시 데이터 불균형 해결이 필요합니다."
Quotes
"윤리는 기술 발전의 핵심이며, 투명성과 책임성이 중요합니다."
"AI 시스템의 윤리적 행동을 보장하기 위해서는 인간의 감독이 필수적입니다."
"AI 모델 자체에는 윤리적 주체성이 없으며, 개발자에게 책임이 있습니다."