Künstliche Intelligenz : Wie Anyline Handys das Lesen lehrt

Anyline
© Anyline

Die Bigpacks mit Rohstoffen, die im Werk der Tyrolit ankommen, wiegen mehrere Tonnen. Fehler im Wareneingang des Schleifmittelherstellers haben somit buchstäblich gravierende Folgen. Fehler, die beim klassischen Procedere – Ablesen von nicht immer optimal lesbaren Seriennummern und manueller Abgleich mit einer entsprechenden Liste – vorkommen.

Seit einiger Zeit nicht mehr: Die Mitarbeiter im Wareneingang filmen heute mit ihren Handys die Seriennummern der Bigpacks ab, diese werden in Echtzeit erkannt und mit dem SAP-System des Unternehmens abgeglichen. Gibt es eine Fehllieferung, kann der Irrtum also behoben werden, ehe das Bigpack den Sattelschlepper überhaupt verlassen hat.

„Smartphones können nicht lesen“

An der App, die das leistet, hat der Wiener Softwareentwickler Anyline zentralen Anteil. OCR (Optical Character Recognition) ist keine neue Technologie, betont Anyline-Mitgründer und CMO Jakob Hofer, „sie war angesichts der notwendigen Rechenleistung aber immer Server-seitig“. Anyline wollte einen neuen Ansatz realisieren: „Wir wollten OCR auf das Smartphone bringen, damit die User nicht mehr spezielle Lesegeräte für spezielle Anwendungen benötigen. Und zwar offline und in Echtzeit. Wir haben uns vorgenommen, dass es auch funktioniert, wenn man gerade in einem Bereich unterwegs ist, in dem es aus welchem Grund auch immer keinen Handyempfang gibt.“ Für die Zusammenarbeit mit Tyrolit wurde Anyline 2018 von Gartner als einer von fünf „Cool Vendors“ in der Kategorie Supply Chain Execution ausgezeichnet.

Vor rund vier Jahren haben vier App-Spezialisten das Unternehmen gegründet, das mittlerweile auf mehr als 30 Mitarbeiter angewachsen ist. Mitgründer Jakob Hofer (der einzige Burgenländer neben drei Tirolern, aber „dennoch der beste Schifahrer“) erklärt den Grundgedanken so: „Es geht darum, eine Lücke zu schließen. Smartphones können nicht lesen. Was Menschen sehen können, ist nicht das Gleiche wie das, was Smartphones sehen können. Wir geben den Smartphones also die Fähigkeit, visuelle Information zu lesen, zu verstehen und zu verarbeiten – vereinfacht gesagt: aus einem pdf ein Word-file zu machen.“

70 Prozent sind nicht genug

Die Hürden auf dem Weg dorthin waren hoch. Dass OCR bislang immer über Server lief, hat seinen Grund in der enormen Rechenleistung, die notwendig ist. Was Menschen intuitiv „verstehen“, ist für Algorithmen harte Arbeit. Ohne KI ist der Anyline-Ansatz nicht möglich. Das Unternehmen setzt lernende neuronale Netzwerke ein, die über selbst geschriebene Tools trainiert werden. Gleichzeitig können die Grenzen angesichts permanent verbesserter Hard- und Software kontinuierlich verschoben werden. „Wir können also immer mehr Daten erfassen und kommen damit in immer extremere Use-cases“, erzählt Jakob Hofer. „Die Technologie kann mittlerweile Bilder verarbeiten, auf denen ein Mensch überhaupt nichts mehr erkennen kann.“

Anyline muss etwa Spiegelungen auf einem Gerät „wegrechnen“, eine Leistung, die das menschliche Gehirn völlig unbewusst erbringt. Die Unterscheidung also, welche Information überhaupt gelesen werden muss und welche nicht. Am Ende entsteht eine Art „Schwarz-Weiß-Bild“, erklärt Hofer: Das Weiße wird gelesen, das Schwarze nicht.

Eine weitere Hürde ist der Inhalt der erfassten Zeichen. Anyline beschäftigt sich in erster Linie mit per se bedeutungslosen Zeichen wie Seriennummern. Wird ein Zeichen nicht erkannt, gibt es also nicht die Möglichkeit, in einem Wörterbuch nach der wahrscheinlichsten Ergänzung zu suchen. Auch das, erklärt Jakob Hofer, unterscheidet Anyline von anderen Lösungen. „Für den alltäglichen Gebrauch ist eine Genauigkeit von 70 Prozent ausreichend, da das Ergänzen nicht erkannter Zeichen mittlerweile recht gut funktioniert. Wir wollen und müssen aber die 100 Prozent zumindest sehr knapp erreichen. Wir arbeiten im B2B-Bereich, da dürfen einfach keine Fehler passieren.“

Enormes Potenzial in der Logistik

Anyline ist aufgrund seiner Architektur für die Verarbeitung sehr unterschiedlicher Inhalte einsetzbar. Die neuronalen Netzwerke werden dabei meist für einen konkreten Use-case programmiert, und dies wird in die Lizenz für den Kunden codiert.

Entsprechend unterschiedlich fallen die Use-cases aus: Die Fokus-Industrien von Anyline sind derzeit die Bereiche Government, Utility und Smart Factory, erzählt Hofer. Die Wiener Polizei setzt das System etwa zur Erkennung von Nummerntafeln ein. Die Ableser von Stromzählern eliminieren damit die Fehlerquelle der schriftlichen Erfassung. Ein medizinischer Use-case ist die Dokumentation der Blutwerte durch Diabetiker. Doch es gibt auch exotischere Use-cases wie etwa jenen des landwirtschaftlichen Betriebes, der Anyline für die Verarbeitung der Cow-tags einsetzt, also der Codes, die Rindern ans Ohr geheftet werden.

Die Logistk-Branche als solche bietet in Hofers Augen besonderes Potenzial: „Gerade in der Logistik gibt es wirklich exzellente Prozesse. Aber immer wieder scheitert es an Kleinigkeiten wie daran, dass irgendwo eine Kiste steht, von der niemand mehr weiß, was sie eigentlich enthält. Aber auch die gängige manuelle Erfassung ist eine extrem häufige Fehlerquelle.“

In Richtung Logistik könnte auch einer der nächsten geplanten Schritte des KI-Unternehmens weisen. Anyline will das System Schritt für Schritt auch auf anderer Hardware als Smartphones ausrollen: fix installierten Kameras etwa. Damit könnte es demnächst möglich sein, das Tool etwa in Produktionslinien zur Echtzeit-Erfassung vorbeirasender Pakete einzusetzen. Oder auch zur Erfassung der Seriennummern von Containern auf einem vorbeifahrenden Zug.