Eine neuartige selbstüberwachte k-Raum-Regularisierung, genannt PISCO, verbessert die Bildqualität von bewegungsaufgelösten MRT-Rekonstruktionen unter Verwendung neuronaler impliziter k-Raum-Darstellungen.
Die Mansformer-Architektur kombiniert mehrere Formen der Selbstaufmerksamkeit, um sowohl lokale als auch globale Zusammenhänge effizient zu erfassen, und ersetzt die zweistufige Transformer-Architektur durch ein effizienteres einstufiges Design.
Eine neue zeitfrequenzselektive Bildrepräsentation mit inhärenter Rauschrobustheit und geometrischer Invarianz wird vorgestellt, die ohne Lernverfahren oder Entrauschung auskommt.
Das vorgeschlagene Modell rekonstruiert beschädigte Bildbereiche, indem es die strukturbeschränkte Textursynthese und die texturgeführte Strukturrekonstruktion in einem gekoppelten Ansatz modelliert, um realistischere Ergebnisse zu erzielen.
Der Kern der Arbeit ist die Einführung einer neuen stochastischen Entlärmungsregularisierung (SNORE) für die Lösung von Bildverarbeitungsproblemen im Rahmen des Plug-and-Play-Ansatzes. Diese Regularisierung basiert auf der Idee, dass ein Bild sauber aussieht, wenn seine verrauschten Versionen ebenfalls wie verrauschte Bilder aussehen. Die Lösung von inversen Problemen mit dieser Regularisierung kann mit einem nachweislich konvergenten stochastischen Optimierungsalgorithmus angegangen werden.
Die Recheneffizienz kann die Modelleffizienz von Convolutional Neural Networks stark beeinflussen und zu deutlich längeren Latenzzeiten führen, obwohl die Modelle weniger Operationen ausführen.
Das SUPIR-Modell (Scaling-UP Image Restoration) ist eine bahnbrechende Methode zur Bildwiederherstellung, die generative Vorkenntnisse und die Kraft des Modellskalierens nutzt, um außergewöhnliche Bildwiederherstellungseffekte und neue Möglichkeiten der Intelligenz zu erreichen.
Durch Destillation großer vortrainierter Sprach-Bild-Modelle können disentanglierte und kompositionelle visuelle Konzeptrepräsentationen erlernt werden, die eine flexible Rekombination von Konzepten ermöglichen.
TSNet ist ein zweistufiges Bildentnebelungsnetzwerk, das eine Multi-Skalen-Fusionsmodule und ein adaptives Lernmodul verwendet, um die Generalisierung zu verbessern und Artefakte sowie Farbverzerrungen in den Ausgaben zu reduzieren.
DiffBIR ist ein allgemeines Wiederherstellungssystem, das verschiedene blinde Bildwiederherstellungsaufgaben in einem einheitlichen Framework bewältigen kann. DiffBIR trennt das Problem der blinden Bildwiederherstellung in zwei Stufen: 1) Entfernung von Degradierungen: Entfernung bildunabhängiger Inhalte; 2) Informationsregeneration: Generierung verlorener Bildinhalte.