Die Studie untersucht, wann eine niedrigwertige Datenquelle bei der Erstellung von Ersatzmodellen für teure Blackbox-Probleme schädlich sein kann. Dafür wird eine Instanz-Raum-Analyse (ISA) durchgeführt, die eine visuelle Darstellung des Instanzraums und der Leistung verschiedener Ersatzmodelle in unterschiedlichen Regionen des Raums ermöglicht.
Die Studie beginnt mit der Erstellung eines unvoreingenommenen Benchmarks von Testfunktionen-Paaren, die sowohl hochwertige als auch niedrigwertige Informationsquellen enthalten. Dieser Benchmark wird dann für die ISA verwendet.
Die ISA zeigt, dass es Regionen im Instanzraum gibt, in denen ein Ersatzmodell, das nur die hochwertige Quelle verwendet (Kriging), genauer ist als ein Modell, das beide Quellen verwendet (Co-Kriging). Dies deutet darauf hin, dass die niedrigwertige Quelle in diesen Fällen schädlich sein kann.
Die Analyse der Instanzmerkmale zeigt, dass das Verhältnis der Anzahl von Hoch- zu Niedrigfidelitätsdaten der wichtigste Faktor ist, der die Leistung der Ersatzmodelle beeinflusst. Andere Merkmale wie die Landschaftseigenschaften der Quellen spielen eine untergeordnete Rolle. Daraus werden Richtlinien abgeleitet, wann eine niedrigwertige Quelle ignoriert werden sollte.
На другой язык
из исходного контента
arxiv.org
Дополнительные вопросы