Der Artikel beschreibt einen Ansatz zur intelligenten Datenteilung, um die Qualität der geteilten Daten in fortgeschrittenen Fertigungssystemen sicherzustellen. Maschinelles Lernen (ML) wird in Fertigungsanwendungen häufig eingesetzt, erfordert aber große Mengen an Trainingsdaten. Aufgrund hoher Kosten und Zeitaufwände für die Datenerfassung in Fertigungssystemen ist Datenmangel ein weit verbreitetes Problem. Mit der Entwicklung des industriellen Internets der Dinge (IIoT) ist Datenaustausch zwischen mehreren Maschinen mit ähnlicher Funktionalität weit verbreitet, um den Datensatz für den Aufbau von ML-Modellen zu erweitern. Obwohl die Maschinen ähnlich konzipiert sind, gibt es aufgrund unterschiedlicher Betriebsbedingungen, Prozessparameter, Messrauschen usw. unvermeidbar Verteilungsunterschiede in den Daten. Die effektive Anwendung von ML-Methoden setzt jedoch voraus, dass Trainings- und Testdaten aus der gleichen Verteilung stammen. Daher ist ein intelligenter Datenteilungsrahmen erforderlich, um die Qualität der geteilten Daten sicherzustellen, so dass nur nützliche Informationen geteilt werden, um die Leistung von ML-Methoden zu verbessern.
Der vorgeschlagene Active Data-sharing (ADs) Rahmen integriert die Architektur des kontrastiven Lernens (CL) und des aktiven Lernens (AL), um sowohl die Informativität als auch die Ähnlichkeit der ausgewählten Daten zur Zielverteilung zu maximieren. Eine neuartige Akquisitionsfunktion wird entwickelt, indem die Informationsmaße für den Nutzen der Downstream-Aufgabe und der Ähnlichkeitsscore für die Qualitätssicherung der Daten integriert werden. Die Wirksamkeit des vorgeschlagenen ADs-Rahmens wird anhand von Echtzeitüberwachungsdaten aus drei 3D-Druckern validiert, von denen zwei identische Spezifikationen aufweisen, während der dritte anders ist. Die Ergebnisse zeigen, dass der ADs-Rahmen die Überwachungsdaten zwischen identischen Maschinen intelligent teilen und gleichzeitig die Datenpunkte von den unterschiedlichen Maschinen beim Training von ML-Methoden eliminieren kann. Mit einem hochqualitativen erweiterten Datensatz, der durch den vorgeschlagenen Rahmen generiert wird, können die ML-Methoden eine bessere Leistung mit einer Genauigkeit von 95,78% bei Verwendung von 26% gekennzeichneten Daten erreichen, was eine Verbesserung von 1,41% gegenüber Benchmark-Methoden darstellt, die 100% gekennzeichnete Daten verwendeten.
翻譯成其他語言
從原文內容
arxiv.org
深入探究