本論文は、自然言語処理(NLP)分野における宗教テキストの使用に関する倫理的な考慮事項について議論している。
まず、NLPにおいて聖典(聖書、コーラン、ヴェーダなど)がしばしば使用されていることを示す実証的な分析を行っている。聖典は多言語対訳データとして利用されやすく、NLP研究者にとって便利な資源となっている。
しかし、これらの聖典は単なるデータではなく、文化的に重要な価値観の表現であり、NLPモデルはそこに埋め込まれた文化的価値観を再現する傾向がある。また、聖典の翻訳は本来の目的(新規信者の獲得)とは異なる目的で再利用されることもある。
そのため、NLPにおける聖典の使用には、モデルバイアスを超えた考慮事項がある。具体的には、データの出自、文化的文脈、布教活動への利用などが挙げられる。研究者の立場性や、マージナライズされた言語・宗教コミュニティの視点を考慮することが重要である。
倫理理論、AIの原則、文化的な視点、マージナライズされたコミュニティの懸念など、様々な観点から検討し、NLP研究者に対して以下のような提言を行っている:
To Another Language
from source content
arxiv.org
Djupare frågor