Anzeige

AI for Beginners

Vom Vision Entwickler zum Deep Learning Einsteiger - Teil 2/2

Für Deep Learning gibt es eine große Auswahl an Frameworks, Netzwerken und Tools. Der folgende Beitrag bietet einige Einstiegstipps. Im zweiten Teil der Serie geht es um Voraussetzungen und Konsistenz.

Bild: Flir Systems GmbHBild: Flir Systems GmbH
Bild 1 | Während Bilder, deren Größe mit verschiedenen Methoden geändert wurde (links Kantenglättung mit Antialiasing, rechts ohne), auf den ersten Blick gleich aussehen, reichen die in weiß hervorgehoben Unterschiede aus, um einen signifikanten Einfluss

Die Trainingsbilder müssen den später vorliegenden Bildern so ähnlich sehen, wie es nur irgendwie möglich ist. Wenn bei Projekten nur sehr wenige Daten für das Training verfügbar sind, können bereits minimale Unterschiede bei der Positionierung und Beleuchtung der Gegenstände eine gewaltige Auswirkung auf die Anwendungsleistung haben.

Bild: Flir Systems GmbHBild: Flir Systems GmbH
Bild 2 | In allen Bildern sind zwei Unterlegscheiben und eine Mutter zu sehen. Bei Bild 2d sind allerdings die beiden Unterlegscheiben nicht sichtbar. Dies kann die Leistung eines Netzwerks beeinträchtigen.

Durch konsistente Positionierung und Beleuchtung des Ziels nimmt die Varianz zwischen den Bildern ab, wodurch weniger Trainingsdaten erforderlich sind. So ist 3D-Druck wie dafür geschaffen, in kurzer Zeit individuelle Befestigungen zu drucken und damit Muster zuverlässig zu fixieren. Die Beleuchtung sollte dabei die Unterschiede der verschiedenen Objekte hervorheben. Sie sollten unbedingt vermeiden, dass einzelne Bereiche zu hell oder zu schwach beleuchtet sind, dass so Feinheiten nicht mehr erkennbar sind. Viele Bildverarbeitungsprobleme mit Farbe sollten nicht mit einer Farbkamera, sondern einer monochromen Kamera und der richtigen Kombination aus Beleuchtung und Filtern gelöst werden. Eine hochwertige Kamera mit hoher Auflösung und einem großen Dynamikbereich erfasst detaillierte Trainingsdaten und bewährt sich schnell im Einsatz. Bei der Bildverarbeitung ist die Konsistenz zwischen den Trainingsdaten und den in der Praxis aufgenommenen Daten von entscheidender Bedeutung. So kann eine Kantenglättung bei der Anpassung der Bildgröße eine entscheidende Auswirkung auf die Netzwerkleistung haben. Zwei mit unterschiedlichen Methoden skalierte Bilder, die für das menschliche Auge identisch aussehen, können dennoch Unterschiede aufweisen, die zu Vorhersagen mit einer geringeren Wahrscheinlichkeit oder falschen Klassifizierungen führen. Um Vision-Entwicklern den Zugang und die Abläufe zu Deep Learning immer weiter zu erleichtern, erscheint in Kürze die neue Inferenzkamera-Serie von Flir. Neuronale Netzwerke können direkt auf diese Kameras geladen werden, wodurch der PC oder Einplatinencomputer wegfällt und die Inferenz direkt auf der Kamera stattfindet.

FLIR Systems GmbH

Dieser Artikel erschien in inVISION 5 2019 - 27.09.19.
Für weitere Artikel besuchen Sie www.invision-news.de