核心概念
深層学習は位相回復問題に対して高い有効性を示しており、データ駆動型と物理駆動型の2つの主要な戦略が存在する。これらの戦略は同じ目的を異なる方法で達成するが、類似点と相違点についての十分な研究がなされていない。本論文では、これらの2つの深層学習位相回復戦略を時間消費、精度、一般化能力、ill-posedness適応性、および事前知識容量の観点から包括的に比較する。さらに、高周波情報と低周波情報のバランスを取るためのデータ駆動と物理駆動の組み合わせ戦略を提案する。
要約
本論文では、深層学習を用いた位相回復の2つの主要な戦略、データ駆動型(DD)と物理駆動型(PD)について比較検討を行っている。
DD戦略は、位相と強度の対応関係をペアデータセットから学習する監督学習モードを採用する。一方、PD戦略は物理モデルを活用した自己教師学習モードを採用する。
比較の結果、以下のことが明らかになった:
時間消費と精度: uPDとtPDrが最も高精度だが推論に時間がかかる。tPDは高周波情報を、DDは低周波情報を良く学習する。
一般化能力: 学習データセットの密度が高いほど、一般化性能が高い。tPDはDDよりも疎なデータセットに対して優れる。
ill-posedness適応性: DDは位相と振幅を同時に推定できるが、tPDは ill-posedな問題に弱い。aperture制約や複数ホログラムの利用でtPDの性能を改善できる。
事前知識容量: DDはデータセットに含まれる暗黙的な事前知識を学習できるが、PDは数値伝搬に含まれる事前知識しか学習できない。
最後に、高周波情報と低周波情報のバランスを取るためのデータ駆動と物理駆動の組み合わせ戦略(CD)を提案している。
統計
位相回復では、ホログラムから位相を推定することが重要である。
ホログラムの強度分布H は、光波の振幅Aと位相Pから以下のように表される:
H = G(A, P)
ここで、G(·)は正方向の伝搬関数を表す。