本調査では、ウェブコンテンツの所有者が生成型AIの学習に自身のコンテンツが使用されることを防ぐための法的背景と技術的な取り組みについて概説する。
法的背景として、EU法とUS法における知的財産権と個人情報保護法の観点から、ウェブコンテンツの使用に関する規制を説明する。EU法では2019年のDSM指令により、コンテンツ所有者がテキストマイニングの利用を拒否できる仕組みが定められたが、具体的な技術的な標準は未だ確立されていない。一方、US法では公正利用の原則に基づき、ケースバイケースの判断が必要となっている。
技術的な取り組みとしては、ロボット除外プロトコル(REP)をはじめとする既存の仕組みの拡張や、新たな提案規格の検討が行われている。具体的には、ロボット.txtファイルの拡張、ユーザーエージェントの使い分け、学習用ファイルの導入、メタタグの活用、メタデータの活用などが提案されている。しかし、これらの取り組みはいずれも一定の課題を抱えており、ウェブ全体で広く採用されるには至っていない。
本調査では、これらの技術的な提案を評価し、ウェブコンテンツ所有者の管理ニーズと実装可能性のバランスを検討する。生成型AIの台頭により、ウェブコンテンツの使用に関する所有者の権利が重要な課題となっており、実用的な技術的標準の確立が求められている。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor