Mensch und Maschine verstehen sich immer besser

Diese Diashow benötigt JavaScript.

Welcher Besitzer eines sprachgesteuerten Navigationssystems kennt das nicht: „Navigiere nach Rüsselsheim“ lautet der Sprachbefehl. Das System antwortet mit sanfter Stimme: „Soll die Zielführung nach Rüdesheim gestartet werden?“ Die Korrektur bringt weitere Vorschläge auf den Bildschirm. Roxelshausen, Rügen, Rühmheim, sogar die Rue d’Eglise ist bisweilen im Angebot. Hersteller, die etwas auf sich halten, mühen sich nach Kräften, ihren Spracherkennungsprogrammen im Auto Verständnis beizubringen. Undenkbar, dass in einem Premium-Wagen die Algorithmen ihre Aufträge nicht einwandfrei erledigen.

Auch Dialekte sollten sie im Rahmen des Verständlichen kapieren. Klar, dass etwa ein Mercedes auf schwäbische Laute hört. Aber er muss auch Bayrisch, Hessisch und sogar Sächsisch verstehen. Eng wird es allerdings bei den extremen, regional gesprochenen Mundarten wie „Pladdüdsch“, das verstehen selbst die ausgefuchstesten Spracherkennungen ebenso wenig, wie ein italienischer Computer im Automobil des „Ladinischen“ mächtig ist. Auch mit regionalen Begrifflichkeiten tun sich die Systeme schwer. „Buschenschänke“ bleibt als anzuvisierendes Navigationsziel ebenso unberücksichtigt wie „Dribbdebach“, was ein Frankfurter sagen könnte, wenn er über die Mainbrücken nach Sachsenhausen will.

Bei Mercedes lassen sich in der neuen E-Klasse mit ihrer weiterentwickelten Spracherkennung Linguatronic dagegen zusätzlich verschiedene Fahrzeug-Funktionen steuern. Die Temperatureinstellungen getrennt für Fahrer und Beifahrer gehören dazu, auch der Befehl „massiere mich“ wird bei Ausstattung mit den entsprechenden Sitzen umgehend in die Tat umgesetzt. Und was vielen Nutzern ganz sicher willkommen sein wird, ist die neue Duldsamkeit der Linguatronic. So nimmt sie es gelassen, wenn ihr der Nutzer ins Wort fällt um so einen Menüschritt zu überspringen. Das verkürzt die Befehlszeiten und somit die geteilte Aufmerksamkeit, die auch bei Spracheingabe nicht ausbleibt.

450 verschiedene Befehle erkennt das System. Die Trefferquote liegt laut Matthias Boll, Entwickler der Linguatronic bei Daimler, bei 85 bis 95 Prozent. „Da wo früher noch Ungenauigkeiten hingenommen werden mussten, erkennt das weiterentwickelte System die Spracheingabe äußerst zuverlässig und reagiert mit der gewünschten Information oder Funktionseinstellung.“ Was nicht selbstverständlich ist, denn die Voraussetzungen für eine Spracherkennung sind im Automobil – verursacht unter anderem durch Fahrgeräusche – alles andere als ideal.

Dabei kommt es auf feinstes Tuning, sprich Programmierung des sogenannten „Speech Signal Enhancement“, des Spracherkennungsmoduls an. Der Dialogmanager moderiert das Gespräch zwischen Mensch und Maschine, unterbricht es etwa dann, wenn der Rückwärtsgang zum Rangieren eingelegt wird. Und er koordiniert die Antworten der Sprachgenerierung, die dann hinterlegte Sätze und Worte zu verständlichen Sprachausgaben zusammensetzt.

Außerdem hält sich nicht jeder Sprecher an Regeln. Unterschiedlicher Satzbau wird jedoch ebenso erkannt wie ungenaue Artikulation. Hierfür sind bis zu 1.000 Alternativen je Kommandotext hinterlegt. Das klingt nach großem Speicherbedarf, macht aber im Vergleich zum Platzbedarf der Sprachausgabe einen vergleichsweise kleinen Teil aus. Zudem ist die Offboard-Linguatronic auch updatefähig. Städtenamen, Straßennamen oder auch POIs (Point of Interest), welche heute vom System noch nicht erkannt werden, können zukünftig durch Anpassungen im Offboard-Server erkannt werden. Somit wird die Linguatronic den Kunden im Laufe der Zeit immer besser verstehen können und dazulernen.

Durch die Integration von Online-Funktionalitäten, wie etwa bei der Sprachbedienung der MB-App Wetter oder auch der Online-Suche von Navigations Zielen und POIs wie Restaurants, Tankstellen, und Sehenswürdigkeiten greift die Linguatronic stets auf die aktuellsten Informationen in der Cloud zu. „Hier stehen uns immer die aktuellsten Informationen, bei schneller LTE-Verbindung in Sekundenbruchteilen, zur Verfügung“, sagt Matthias Boll.

Menschen bleiben dennoch nicht außen vor, wenn die Spracherkennung des Computers die Schulbank drücken muss. Ausführliche Tests mit unterschiedlichsten Sprechern gehören zum Standard-Programm der Entwickler. Denn schließlich soll sich jeder verstanden wissen, der die zunehmende Zahl von Funktionen seines Autos mit der Stimme steuert. Die Linguatronic lernt so ständig dazu. Zusätzliche Sprachen etwa oder Dialekte, und sie unterstützt viele neue Funktionen im Auto, um die Bedienung während der Fahrt sicher, komfortabel und ohne Ablenkung zu ermöglichen. Durch die Offboard-Technologie hält sie aktuelle Informationen im Fahrzeug bereit, das System wird ständig neu optimiert. So kommt es tatsächlich dazu, dass sich Mensch und Maschine immer besser verstehen. (Michael Kirchberger, mid)

Kommentar verfassen