本研究では、YOLOv8xセグメンテーションモデルと、YOLOv8のバックボーンネットワークを組み合わせた単一の深層ニューラルネットワークを提案している。このアプローチにより、オブジェクトの特性を保ちつつ、芸術的なスタイルを転移することができる。
具体的には、YOLOv8xセグメンテーションモデルを使用してオブジェクトを検出・セグメンテーションし、その後、YOLOv8のバックボーンネットワークを利用してスタイル転移を行う。これにより、複数のステージやモデルを必要とせず、シンプルな学習と展開が可能となる。
提案手法の有効性は、さまざまなスタイル画像を適用した結果から確認できる。単一のオブジェクトに対するスタイル転移だけでなく、同一画像内の複数のオブジェクトに異なるスタイルを適用することも可能である。これにより、創造的で視覚的に魅力的な画像合成が実現できる。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問