Der Artikel präsentiert einen neuartigen tiefen Lernrahmen, der auf Fourier-Neuronaloperatoren (FNOs) basiert und für die Klassifizierung von Bildern unterschiedlicher Größe entwickelt wurde. FNOs sind gegenüber der Größe von Eingabebildern invariant, was bedeutet, dass Bilder jeder Größe ohne Änderung der Netzwerkarchitektur in FNO-basierte Rahmen eingegeben werden können, im Gegensatz zu herkömmlichen konvolutionalen neuronalen Netzen (CNN).
Der Rahmen wurde speziell entwickelt, um gleichzeitig auf Bildern unterschiedlicher Größen trainiert zu werden. Als praktische Anwendung wird das Problem der Vorhersage des Labels (z.B. Permeabilität) von dreidimensionalen digitalen porösen Medien betrachtet.
Der Schlüssel zum Erfolg des Ansatzes ist die Verwendung von statischem Max-Pooling anstelle von adaptivem Max-Pooling. Dadurch kann das Netzwerk effizient auf Bilder unterschiedlicher Größen trainiert werden, ohne dass Anpassungen an der Architektur erforderlich sind.
Die Leistungsfähigkeit des vorgeschlagenen Rahmens wird durch Experimente mit synthetischen dreidimensionalen digitalen porösen Medien unterschiedlicher Größen demonstriert. Die Ergebnisse zeigen, dass der Ansatz eine hervorragende Genauigkeit bei der Vorhersage der Permeabilität erzielt, selbst für Porenmedien, die nicht im Trainingsdatensatz enthalten waren.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問