Core Concepts
AIモデルの訓練に使用されるデータの著作権を管理し、モデルの系譜を追跡するブロックチェーンフレームワークを提案する。
Abstract
本論文は、AIモデルの訓練に使用されるデータの著作権管理とモデルの系譜追跡を目的としたブロックチェーンフレームワークIBISを提案している。
主な特徴は以下の通り:
既存のAIモデル訓練ワークフローとの統合性: モデルの再訓練や微調整、ライセンスの更新などに対応し、既存のプロセスを最小限の変更で統合できる。
適応性: モデルのメタデータ間のリンクや、ライセンスの定期更新チェックにより、モデルの再訓練や微調整に対応できる。また、ブロックチェーンの不変性により、過去のライセンス情報を参照できる。
トレーサビリティ: データセットのメタデータ、ライセンス、モデルのメタデータを連携した3つのレジストリを構築し、データとモデルの関係性を双方向にトレースできる。
ブロックチェーンを活用した多者間署名: ブロックチェーンのアイデンティティ管理と電子署名機能を活用し、AIモデルの所有者とデータの著作権者の間で効率的かつ安全な契約締結ワークフローを実現する。
管理性: アクセス制御メカニズムと厳格な権限ルールにより、データ、モデル、ライセンスに関する商業的機密性を保護しつつ、多数のAIモデル、データセット、ライセンスを統一プラットフォーム上で管理できる。
本フレームワークは、Damlスマートコントラクト言語とCantonブロックチェーンプロトコルを用いて実装されており、性能評価の結果、ユーザー数、データセット数、モデル数、ライセンス数の増加に伴う処理時間の増加は小さく、スケーラビリティが高いことが示された。
Stats
モデルのライセンスを取得する際の処理時間は、モデルチェーンの長さと各モデルの訓練データ数に比例して増加する。
データセットを取得する際の処理時間も同様に、モデルチェーンの長さと各モデルの訓練データ数に比例して増加する。
ライセンスに基づいて許可されたモデルを取得する際の処理時間は、ライセンスに関連付けられたデータセットの数に比例して増加する。