Anpassungsfähiges Mehrskalenmodell für die Bildklassifizierung
Ein mehrskaliges, vereinheitlichtes Netzwerk (MSUN) wird vorgeschlagen, um die Anpassungsfähigkeit von Convolutional Neural Networks (CNNs) an Eingabebilder unterschiedlicher Größen zu verbessern. MSUN besteht aus mehreren Teilnetzen für verschiedene Eingabeskalen, einem vereinheitlichten Netzwerk und einer skalenunabhängigen Beschränkung, um robuste Merkmale über Skalenvariationen hinweg zu lernen.