Core Concepts
다국어 기계 번역 시스템은 저자원 언어쌍에 악의적인 데이터를 주입함으로써 다른 언어쌍, 특히 고자원 언어쌍의 번역에 악영향을 미칠 수 있다.
Abstract
이 논문은 다국어 기계 번역 시스템의 보안 취약점을 조사한다. 연구진은 저자원 언어쌍에 악의적인 데이터를 주입하여 고자원 언어쌍의 번역에 악영향을 미칠 수 있음을 발견했다.
실험 결과, 저자원 언어쌍에 0.01% 미만의 악의적인 데이터를 주입하면 다른 고자원 언어쌍에서 약 20%의 공격 성공률을 달성할 수 있다. 이는 저자원 언어쌍이 가진 더 큰 공격 표면으로 인한 것이다.
현재 언어 모델 기반의 방어 기법은 저자원 언어에 대한 견고한 모델이 부족하여 이 공격을 효과적으로 막기 어렵다. 따라서 저자원 언어의 보안을 강화하는 것이 중요한 과제로 제기된다.
Stats
저자원 언어쌍에 0.01% 미만의 악의적인 데이터를 주입하면 다른 고자원 언어쌍에서 약 20%의 공격 성공률을 달성할 수 있다.
Quotes
"다국어 기계 번역 시스템은 특히 저자원 언어에 내재된 더 큰 공격 표면으로 인해 이 유형의 공격에 특히 우려된다."
"현재 언어 모델 기반의 방어 기법은 저자원 언어에 대한 견고한 모델이 부족하여 이 공격을 효과적으로 막기 어렵다."