Das Team wollte zunächst einem Algorithmus beibringen, einen Artikel mit seinem Foto abzugleichen. Es gab jedoch keine konsequenten Bemühungen, Bilder von Artikeln zu machen, wie sie in den Abwicklungszentren auftauchten, so dass keine Trainingsdaten verfügbar waren. Der erste Schritt bestand darin, einfach Fotos von Produkten zu machen, während sie sich in den Fulfillment-Zentren über die Förderbänder bewegten, und so eine Bibliothek von Bildern anzulegen.



Jedes Bild wurde dann in eine beschreibende Liste von Zahlen oder einen Vektor übersetzt. Die Abmessungen des Artikels wurden ebenfalls in einen Vektor umgewandelt. Die Forscher entwickelten dann Algorithmen für maschinelles Lernen, um diese Vektoren zu extrahieren und sie mit den entsprechenden Vektoren der in Frage kommenden Artikel abzugleichen. Das Team nutzte die Möglichkeiten des Deep Learning - und war überrascht über die hohe Trefferquote bei den ersten Experimenten: Sie lag zwischen 75 und 80 Prozent.



"Das war ein großer Schritt für uns", sagt Antonakos. "Wir erkannten, dass wir etwas hatten, in das es sich zu investieren lohnt." Nach umfangreichen wissenschaftlichen Investitionen erreicht MMID derzeit Trefferquoten von nahezu 99 %.



Diese hohen Trefferquoten sind zum Teil darauf zurückzuführen, dass Amazons Bestandssysteme genau wissen, wo sich jeder Artikel bei jedem Schritt des Erfüllungsprozesses befindet. Der Algorithmus muss einen Artikel nicht mit dem gesamten Amazon-Katalog von Hunderten von Millionen Produkten abgleichen - eine derzeit unmögliche Aufgabe. Jeder Artikel stammt aus einem bestimmten Behälter, und jeder Behälter enthält ein paar Dutzend Produkte. Der Algorithmus muss also einen Artikel nur mit dem Inhalt eines einzigen Behälters abgleichen.



Die MMID-Technologie wurde zunächst in einem Fulfillment-Center in Stettin (Polen) erprobt, wo eine Kamera über einem einzelnen Förderband positioniert war und Bilder von "vereinzelten" Behältern machte - Behältern, die nur einen Artikel enthalten. Diese Einzeltabletts sind ideal, da es einfacher ist, ein einzelnes Produkt zu identifizieren, als zu versuchen, mehrere Produkte zu unterscheiden und dann jedes einzelne zu identifizieren.



Außerdem tauchen die einzelnen Schalen früh genug im Erfüllungsprozess auf, so dass "wir den Fall vermeiden, dass die Artikel bis zum Ende des Prozesses durchgelaufen sind und sich jemand um den Fehler kümmern muss", sagt Doug Morrison, ein Robotics AI-Wissenschaftler, der in den letzten zwei Jahren intensiv an dem Projekt beteiligt war. "Wir können dann den falschen Artikel einfach wieder in das System an seinen richtigen Platz zurückführen."



Die Verwendung der MMID-Sensorplattform in dieser Phase hat auch den Vorteil, dass sie nicht in das System eingreift: Wenn das System eine Abweichung feststellt, kann der Fehler behoben werden. Liegt keine Abweichung vor, unterbricht der Prozess die Linie nicht.