本研究では、深層学習を用いたテキストを画像に埋め込むウォーターマーキング手法を提案している。
まず、テキストエンコーダ-デコーダネットワークを事前学習し、テキストの正確な再生を実現する。次に、エンコーダ、エンベダー、エクストラクター、デコーダからなる統合ネットワークを学習する。エンベダーはテキストを画像に埋め込み、エクストラクターはマーク付き画像からテキストを抽出する。
損失関数では、テキストの忠実性と画像品質のバランスを取るため、テキスト損失、画像MSE損失、テキスト抽出MSE損失、SSIM損失の4つの項目を組み合わせている。
実験では、Microsoft COCOデータセットと Multi30Kデータセットを使用し、従来手法と比較して高いSSIM、PSNR、BLEUスコアを達成している。また、様々な攪乱に対する堅牢性も確認された。
事前学習時にテキスト埋め込みにノイズを加えることで、デコーダのロバスト性が向上し、マーク付き画像への攪乱に対しても高い抽出精度を維持できることが示された。
本手法は、深層学習を初めてテキストを画像に埋め込むウォーターマーキングに適用したものであり、適応性、堅牢性、不可視性の向上を実現している。
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések