Anzeige

Neuroprozessor

Hochleistungs-Vektor-Matrix Mikroprozessor für KI mit 2,6W

Der Prozessor NM6407 ist ein Dual-Core Hochleistungs-Vektor-Matrix-Mikroprozessor, der auf der proprietären NeuroMatrix-Architektur beruht. Jeder der Master-Slave Prozessorkerne besteht aus einem RISC- mit Vektor-Matrix-Coprozessor.

Der RISC Prozessor verarbeitet Festkommazahlen, der Coprozessor Gleitkommazahlen. Er ist für Echtzeit-Datenverarbeitung konzipiert und eignet sich für die rechenintensive Verarbeitung von Stand- und Bewegtbilder, Deep Neural Networks (DNN) sowie generischen Vektor-Matrix-Berechnungen. Die Peak Performance beträgt 16GFlop/s, wobei er weniger als 2,6W verbraucht. Die NeuroMatrix-Architektur verwendet Very Large Instruction Words (VLIW), Single Instruction Multiple Data (SIMD) sowie Superskalare, wobei die Rechenleistung durch den Einsatz von programmierbaren 1 bis 64Bit breiten Operanden skalierbar ist. Der NM6407 ermöglicht es, anspruchsvolle Lösungen mit robusten Betriebssystemen, umfangreichen Benutzeroberflächen und hoher Prozessorleistung in kurzen Entwicklungszeiten auf den Markt zu bringen. Mit dem Prozessor wird ein umfangreicher Satz an Entwicklungstools mitgeliefert, der die Entwicklung von DNN Anwendungen unterstützt. Er enthält Module, um vortrainierte DNNs zu portieren. Das NMDL (NeuroMatrix Deep Learning) Toolkit unterstützt Modelle im ONNX- und DarkNet-Format. Derzeit sind Beispiele für AlexNet, SqueezeNet, ResNet18 und Yolo Tiny v2 Netzwerke bereits verfügbar. Microsoft CNTK, Caffe, TensorFlow sowie andere Frameworks, die den Export von Modellen ins ONNX-Format unterstützen, können zum Training neuronaler Netze verwendet werden. Es ist ebenso eine Bibliothek mit optimierten Funktionen zur Beschleunigung der auf der NM6407-Plattform laufenden DNNs verfügbar. Die Deep Learning Convolutional Library (DLCL) enthält Primitive für Faltungs-, ReLu-, Aktivierungs-, Pooling- und Normalisierungs-Layer. Die nmDL-API führt die Primitive und die zugehörigen Konfigurationsdateien aus und erstellt die Implementierungen der DNN-Realisierungen während der Initialisierungsphasen. Die nmDL-API verwendet verschiedene Schemata zur adaptiv optimierten Nutzung von Speicher, Datenverkehr und Prozessorkernen. Dies erleichtert die Optimierung verschiedener Architekturen auf der NM6407-Plattform. Darüber hinaus ermöglicht die DLCL-Bibliothek die Erstellung proprietärer DNNs.

Dream Chip Technologies GmbH

Dieser Artikel erschien in inVISION 2 2019 - 25.04.19.
Für weitere Artikel besuchen Sie www.invision-news.de