核心概念
本稿では、偏光と波長多重化メタサーフェスを用いることで、単一の回折型光学ニューラルネットワーク(DNN)で複数の画像認識タスクを同時に実行できることを示す。
要約
多重化メタサーフェスを用いた全光学的回折プロセッサによるマルチタスク学習
本論文は、偏光と波長多重化メタサーフェスを活用し、単一の回折型光学ニューラルネットワーク(DNN)で複数の画像認識タスクを同時に実行する手法を提案している。従来のDNNは単一タスクに最適化されており、統一された人工知能プラットフォーム内で複数のタスクを同時実行する柔軟性に欠けていた。本研究では、光の偏光と波長の自由度を利用することで、MNIST、FMNIST、KMNISTのデータセットを用いた光学的なマルチタスク識別を実現している。
2層カスケードメタサーフェスを用いて、メタアトムライブラリを通じて偏光および波長多重化スキームを使用し、2つのタスクを同時に分類できるデュアルチャネルDNNを構築。
偏光多重化DNN(PM-DNN)と波長多重化DNN(WM-DNN)の2種類のM-DNNを設計し、MNISTとFashion-MNIST(FMNIST)データベースの同時分類を実施。
3つのタスク(MNIST、FMNIST、Kuzushiji-MNIST(KMNIST))を並行して実行するために、トライチャネルWM-DNNを導入。
メタアトムの構造パラメータとチャネル依存の複素透過応答をマッピングする代理モデルを構築し、トレーニング中にこれらのモデルをプロキシ関数として統合することで、メタアトムの構造パラメータを直接最適化するエンドツーエンドの共同最適化フレームワークを開発。