ERLESEN

Interview: Sprache ist für Menschen die natürlichste Art der Interaktion

Warum an Voice in Zukunft auch für Unternehmen und ihre Berater kein Weg vorbeiführt, erläutert David Kaiser (Country Manager Alexa Skills bei Amazon) im Gespräch mit BDU-Präsident Ralf Strehlau.

Ralf Strehlau: Vor gerade einmal zwölf Jahren hat das I-Phone viele Geräte und Produkte überflüssig gemacht und das Kundenverhalten völlig verändert. Jetzt kündigt sich mit digitalen Sprachassistenten wie Alexa die nächste große technologische Disruption an. Wie werden sich in den nächsten Jahren unsere Informations- und Entscheidungsprozesse verändern?

David Kaiser: Der Einsatz von Sprache wird unseren Umgang mit Technologie grundlegend verändern. Sprache ist der natürlichste und einfachste Weg mit Menschen zu interagieren, aber auch mit smarten Geräten. Es ist viel mühsamer zu lernen, wie man die Eingabemedien für Computer und Geräte bedient. Ist das intuitiv, kundenorientiert und effizient? Wir bei Amazon Alexa sagen ganz klar Nein.

Zugleich entfallen immer mehr die technischen Limitierungen. Vor ein paar Jahren lagen wir bei der Spracherkennung noch bei 70 % Genauigkeit, heute sind es 95 %. Das wird in Zukunft noch besser und noch intuitiver. Deswegen glauben wir, dass Sprache als Interaktionsmedium sich in den nächsten Jahren durchsetzen wird und wir sehen bereits heute, dass viele unserer Kunden die Art und Weise, wie sie mit Technologie interagieren, ändern.

 

Ralf Strehlau: Die Vorteile „intuitiver, kundenorientierter und effizienter“ sind nicht nur für den privaten sondern auch für den geschäftlichen Bereich interessant. Experten sehen dieses enorme Potenzial. Vielen Usern erscheinen Sprachassistenten aber derzeit noch als nette Spielerei.

David Kaiser: Persönlich würde ich nicht von Spielerei sprechen. Im Haushalt gibt es viele Use Cases, wo Alexa den Alltag des Nutzers schon vereinfacht, sei es bei der Bedienung von Licht, Erinnerung an die Müllabfuhr, Steuerung der Heizung etc. Auch im Bereich des Entertainments ersetzt Alexa das klassische Radio. Ein Beispiel aus dem Unternehmerumfeld sind Hotelketten, die ihre Zimmer mit Echogeräten ausstatten, um den Aufenthalt ihrer Gäste angenehmer zu gestalten. Dann entfällt die Suche nach dem Lichtschalter oder man kann auf die Lieblingsmusik im Hotelzimmer zugreifen. Wenn Automobilhersteller Alexa im Auto integrieren, kann das die Sicherheit erhöhen, solange wir kein selbstfahrendes Auto haben und selbst dann wird Sprache eine große Rolle spielen.

 

Ralf Strehlau: Alle Großen der Tech-Branche wollen den Markt besetzen. Mit der Lautsprecher-Familie „Echo“ und dem Sprachassistenten Alexa ist Amazon zum Trendsetter geworden, obwohl Apple und Google mit ihren Assistenten schon viel länger im Markt sind. Microsoft ist mit Amazon eine Kooperation eingegangen, um seinen Assistenten Cortana zu erweitern. Welche Strategie verfolgt Amazon im Umgang mit den Wettbewerbern? Kooperation und indirekter Wettbewerb oder „The Winner takes it all?“

David Kaiser: Wir bei Amazon schauen uns nicht die Strategien der Wettbewerber an. Bevor wir ein neues Produkt oder einen Service entwickeln, schreiben wir zuerst auf, was der Mehrwert für den Kunden ist und arbeiten vom Kunden her rückwärts. Allgemein lässt sich sagen, dass ein offener Standard die Entwicklung der Künstlichen Intelligenz begünstigen kann. Ich glaube nicht, dass es bei KI in Zukunft nur einen Gewinner geben wird, sondern dass zahlreiche KIs mit Stärken in verschiedenen Bereichen miteinander interagieren werden. In den USA haben wir mit Microsoft einen ersten Schritt gemacht. Cortana kann jetzt auf Alexa zugreifen und Alexa auf Cortana.

 

Ralf Strehlau: Die Kundenorientierung hat für Sie, wie bekannt, oberste Priorität. Gibt es weitere Prinzipien und wie definiert Amazon seine Mission?

David Kaiser: Wir wollen das kundenorientierteste Unternehmen der Welt sein. Alles, was wir tun, muss für den Kunden etwas verbessern. Ein zweites wichtiges Prinzip ist die Leidenschaft für das Erfinden und langfristiges Denken bei unseren Entscheidungen.

Warum haben wir Alexa für Drittanbieter und für Entwickler geöffnet? Zum einen soll der User auf Alexa überall zugreifen können - egal, wo er sich gerade befindet. Darum können Hardware-Hersteller Alexa als Cloud-Service in die eigenen Geräte integrieren: ins Auto, in Kopfhörer, Waschmaschinen etc. Der zweite Grund ist, dass Alexa möglichst auf jede Frage eine Antwort hat. Das können wir als Amazon allein nicht leisten. Wir wissen nicht, ob der Zug Verspätung hat, wann die Mülltonne abgeholt wird und können kein Taxi bestellen. Alle diese Use Cases werden mit Alexa nur möglich, wenn Unternehmen eigene Services aufbauen und unseren gemeinsamen Kunden zur Verfügung stellen. Ich bin mir sicher, dass andere Unternehmen viele gute eigene Ideen entwickeln, an die wir heute noch nicht denken. Das entspricht unserer DNA, die Jeff Bezos mit folgenden Worten beschrieben hat: “The most radical innovations are those who empower others to be creative”. Wir wollen gemeinsam mit anderen Unternehmen die Zukunft von Sprache gestalten.

 

Ralf Strehlau: Wie funktioniert die Zusammenarbeit mit Drittanbietern in der Praxis? Welche Unterstützung bekommen diese von Ihnen?
David Kaiser: Amazon bietet viele Informationen und Hilfen an, z. B. verschiedene Tutorials für das Entwerfen von Skills. Die Developer Console, die wir Entwicklern und Partnern anbieten, enthält Werkzeuge, um Voice-Design zu vereinfachen. Wir haben eine eigene Voice Design Guideline, die wir jedem empfehlen, der entwickeln will. Außerdem gibt es viele Workshops zu diesem Thema. Es gibt auch erste Agenturen, die sich - von der Idee bis zur Entwicklung - auf dieses Thema fokussiert haben. Ich glaube, dass wir in den nächsten Jahren einen eigenen Zweig von UX-Designern sehen werden, die sich komplett auf das Thema Voice spezialisiert haben.  

 

Ralf Strehlau: Die Akzeptanz von Alexa als zentralem Sprachassistenten steigt natürlich, wenn Sie die Breite an Anwendungen haben. Stichwort: One Stop Shopping. Das würde nicht funktionieren, wenn Sie sich nur auf die Amazon-Kerngeschäftsfelder konzentrieren.

David Kaiser: Es geht darum, die besten Produkte anzubieten. Wie auf dem Amazon-Marketplace soll der Kunde aus einer Vielzahl von Produkten das für ihn richtige auswählen können. So ist das auch bei den Sprachassistenten. Wenn der Kunde eine Frage hat, die Alexa nicht beantworten kann, ist das keine gute Kundenerfahrung. 

 

Ralf Strehlau: Gerade im B2B ist man eher etwas konservativer unterwegs. Was sollten Unternehmen jetzt schon tun, um mit der Entwicklung Schritt zu halten und dieses neue Tor zu ihren Kunden zu öffnen? Und wie positionieren sich Unternehmen, ihre Marke, ihren Service und ihr Produkt am besten in diesem neuen Kanal, der ganz anders aussehen wird?

David Kaiser: Eine Studie des Bitkom zeigt, dass wir aktuell vor dem Durchbruch in der Nutzerakzeptanz cloudbasierter Sprachdienste stehen. Wir haben aktuell über 50.000 Skills im Alexa Skill Store weltweit und der Trend beschleunigt sich.

Unternehmen, die Teil dieser Sprachrevolution sein wollen, empfehle ich, eigenes Know-how im Bereich Sprache aufzubauen. Die Produktmanager und User Experience Designer in den Unternehmen haben bislang wenig Erfahrung, wie man ein tolles sprachbasiertes Produkt aufbaut. Man muss verstehen, was der Kunde will und was die Technik kann. Selbst für uns als Alexa Skills Team ist es eine Herausforderung, mit den täglichen Neuerungen bei Alexa Schritt zu halten. Einmal abgehängt wird es schwer, den Abstand wieder aufzuholen und gute Produkte für den Kunden anzubieten. 

Wir sehen spannende Entwicklungen bei Unternehmen, die ihre Services schon mit Sprachoberflächen erweitern. Im Marketing zum Beispiel im Bereich der Nutzerbindung oder als Bestandteil von Meetings.

 

Ralf Strehlau: Sie meinen, direkt im Meeting Daten abzufragen, wenn sie nicht zu Hand sind z. B. aktuelle Umsatzzahlen oder der Versand eines Updates unmittelbar nach dem Meeting? Was ist über Informationsbereitstellung hinaus noch denkbar?

David Kaiser: Manche Unternehmen nutzen Alexa proaktiv. Wichtige Daten als regelmäßiges Morgenbriefing oder eine automatische Benachrichtigung der Verantwortlichen, wenn definierte KPIs unter einen bestimmten Wert fallen.

 

Ralf Strehlau: Wenn wir beim Thema Marketing bleiben, war es bisher das Ziel, bei Google-Suchanfragen unter den Top Fünf zu erscheinen. Da rechne ich mit einer grundlegenden Veränderung bei Suchanfragen über Voice, denn Sprachassistenten versuchen, die eine, beste Antwort zu geben. Wie filtert das System die beste Antwort heraus? Wird der Wettbewerb mit Voice SEO an Schärfe zunehmen?

David Kaiser: Das ist eine sehr spannende Frage. Die klassische Suchmaschinenoptimierung wird sich durch Voice langfristig verändern, aber noch weiß niemand, wo diese Entwicklung hingeht. Unternehmen können über eigene Skills Services und weitere Funktionen anbieten und so eine direkte Kundenbeziehung aufbauen. Wir bei Amazon unterstützen, dass die Nutzer passende Skills finden. Es ist aber auch Aufgabe des Anbieters dafür zu sorgen, dass die Nutzer seine Skills finden und aktivieren. Hat der Nutzer dann z. B. einen Radioskill aktiviert, wird dieser bevorzugt abgespielt. Entscheidend ist, dass das Produkt dem Nutzer einen sinnvollen Mehrwert bietet und dass es auch genutzt wird. Darüber hinaus muss der Content im Skill Store sowie Antworten im Skill auch "Voice-optimiert" werden. Wir experimentieren hier derzeit z. B. mit Entwicklern im Bereich der besseren Auffindbarkeit oder aber auch bei einigen Sprachanfragen wie z. B. "Alexa, spiel ein Spiel", bei denen Alexa Skills empfiehlt, die relevant für den Nutzer sind.

 

Ralf Strehlau: Bei der klassischen Suchmaschinenoptimierung haben wir mit dem Einsatz von Analytics über Jahre gelernt, unsere Webseiten zu optimieren. Wie optimiere ich zukünftig meine Texte? Und wie können Anbieter ihren eigenen Traffic treiben?

David Kaiser: Starten Sie mit der Überlegung, was Ihr Kunde Alexa fragen würde, wenn er ein Produkt oder Service von Ihnen nutzen will. Wie sieht eine natürliche Interaktion damit aus, z. B. wenn ein Nutzer bei der Deutschen Bahn am Informationsschalter steht? Das muss man transformieren, wie sieht der Ablauf aus, wenn er mit einem persönlichen Assistenten spricht? Bauen Sie Schritt für Schritt Know-how im Voice Interface Design auf, um die richtige Interaktion und die richtige Sprachinteraktion anzubieten.

 

Ralf Strehlau: Das heißt, wir kommen klassisch von Personas und Use Cases und denken die Customer Experience vor?

David Kaiser: Genau, das unterscheidet sich eigentlich gar nicht von Websites und Apps, nur, dass es sich um ein neues Interface handelt, das anders ist. Viele glauben, es sei einfach, eine sprachbasierte Interaktion aufzubauen, aber für Designer ist es heute viel einfacher, ein App Design zu bauen als gute Sprachkommunikation. Es darf keine mehrstufigen Menüs geben - man muss alles sehr intuitiv auf den Punkt bringen. Je natürlicher die Interaktion mit dem User ausfällt, desto besser. Da geht es um Feinheiten, die sich durch das ganze Interface Design ziehen. Wenn Sie jeden Tag und zu jeder Tageszeit gleich begrüßt werden, fällt Ihnen das unangenehm auf.

 

Ralf Strehlau: Als die ersten Webseiten entwickelt wurden, musste man auch erst einmal lernen, dass analoge Unternehmensbroschüren nicht einfach 1:1 ins Internet gestellt werden sollten.

David Kaiser: Definitiv, wir sagen den Unternehmen, dass sie sich von der Vorstellung verabschieden müssen, einfach die App- oder die Webseiten-Sprache und Funktionen zu übernehmen. Man sollte sich auf ein bis zwei Use Cases konzentrieren, die mit Sprache einfacher werden. Wenn die Interaktion per Sprache komplexer ist als über eine App, dann entscheidet sich der User für die App. Beim Smartphone war es z. B. einfacher, den Lichtschalter zu bedienen, als die App zu suchen, das Handy zu entsperren und ins richtige Menü zu gehen. Mit Sprache kann ich auf der Couch sitzen und sagen „Alexa Licht an“ und das Licht geht genau dort an, wo ich gerade sitze.

 

Ralf Strehlau: Wie wird das UX Design für Sprachsteuerung aussehen?

David Kaiser: Das Voice User Interface Design ist ein ganz wichtiges Thema. Wenn wir mit Partnern zusammenarbeiten, dann empfehlen wir ihnen, erst auf den Use Case zu schauen und sich dann sehr tief mit dem UX Design zu befassen. Wenn man einmal ein gutes Voice Interface Design hat, ist die Entwicklung der kleinste Teil der Arbeit. Dort kommen standardisierte Webtechnologien zum Einsatz. Was wir bei Alexa nicht wollen, ist, mit einem 80er Jahre Mailbox Menüs zu enden „Wähle 1, mach das, wähle 2, mach das“.

 

Ralf Strehlau: Hinter dem Erkennen und Verarbeiten von Sprache steckt Künstliche Intelligenz. Welche Projekte in der KI-Forschung gibt es bei Amazon und wo sind die nächsten Durchbrüche zu erwarten?

David Kaiser: KI ist ein breit gefächertes Thema. Wir forschen gerade sehr intensiv daran, wie wir die natürliche Interaktion mit Alexa als Gesprächspartner besser machen können. Menschen erinnern sich, worüber sie vor drei Minuten gesprochen haben und kommen darauf zurück. Diese Kurzzeiterinnerungen sind für Künstliche Intelligenz schwierig. Ein zweites wichtiges Thema ist die Wiedererkennung des Sprechers, weil das Einfluss auf die gewünschten Antworten hat. 

 

Ralf Strehlau: Wenn die Technik nicht ausgereift ist, bietet das Kritikern eine Steilvorlage. Die Medien berichteten über eine Reihe von Pannen: Alexa schaltet sich ein, wenn sie gar nicht gefragt ist, laute Nebengeräusche führen zu falschen Antworten. Was muss noch verbessert werden?

David Kaiser: Diese Vorfälle sind natürlich ungünstig, aber selten, gemessen am Volumen. Mein Handy hat in der Hosentasche auch ab und zu schon einmal selbst gewählt. Dies soll keine Ausrede sein und wir bei Amazon arbeiten stetig an Schutzmechanismen, damit so etwas nicht passiert. Außerdem kommunizieren wir transparent mit den Kunden, wie das bei jeder neuen Technologie der Fall sein sollte. Letzten Endes erfahren wir auch von ihnen, wo unsere Produkte noch besser werden können. Da ist auch weiterhin Forschung und Entwicklung nötig.

 

Ralf Strehlau: Aufträge und Gesprächsinhalte werden aufgezeichnet und an den Server von Amazon übertragen.  Da reagiert man in Deutschland sensibel, insbesondere im B2B-Bereich. In den Nutzungsbedingungen steht, dass die aufgezeichneten Informationen ausgewertet werden. Was passiert damit bei Amazon? Wie verträgt sich das mit den europäischen Datenschutzbestimmungen und wie gewährleisten Sie deren Einhaltung?

David Kaiser: Die Sicherheit der Kundendaten ist für Amazon enorm wichtig. Wenn wir etwas tun würden, was das Vertrauen der Endkunden oder der Partnerunternehmen verletzt, würde das unser gesamtes Business-Modell in Frage stellen. Wir speichern Kundendaten am sichersten Ort, dort, wo wir auch Kreditkartendaten speichern und wir verkaufen keine Daten.

Den Datenschutz haben wir auch beim Design der Echo-Geräte in den Mittelpunkt gestellt. Erst nachdem der Anwender das Aktivierungswort gesprochen hat, werden die Inhalte übertragen und verschlüsselt gespeichert. Unter anderem signalisiert der Leuchtring, wann aufgezeichnet und an die Cloud übertragen wird. Der User kann das Mikrofon per Mute-Taste stumm schalten. Wir zeichnen das Gesprochene auf, um den Sprachdienst an persönliche Sprachmuster und Vorlieben anzupassen und um die Genauigkeit zu erhöhen. Der Kunde kann in seinem Alexa-Konto die Sprachaufzeichnungen jederzeit einsehen und auch löschen. Da legen wir großen Wert auf Transparenz. Die Kunden und auch viele Unternehmen vertrauen unseren Datenschutzbestimmungen und akzeptieren diese bei der Nutzung verschiedener Cloud-Anwendungen von Amazon Web Services.

 

Ralf Strehlau: Sie erwähnten Agenturen und UX-Designer, die sich auf die Entwicklung im Bereich Voice spezialisieren. Welche Rolle sehen Sie für Berater bei den genannten Entwicklungen?

David Kaiser: Beratungen sind als erster Ansprechpartner für Unternehmen ein wichtiger Faktor für den Bereich Voice. Wenn es darum geht, Voice Know-how im Unternehmen anzusiedeln, muss man sich fragen, was das für die verschiedenen Unternehmensbereiche bedeutet. Voice wird ja nicht alles ersetzen und es braucht einen ganzheitlichen Ansatz. Manche Unternehmen beschäftigen sich schon damit, aber es soll ja auch Unternehmen geben, die noch nicht einmal etwas mit mobile zu tun haben. Insofern kann ich Beratungsunternehmen dringend empfehlen, sich mit Voice zu beschäftigen. Sonst können sie ihre Kunden nicht nachhaltig beraten.

 

Ralf Strehlau: Sie sehen Beratung also als Katalysator für Veränderungsprozesse im Unternehmen?

David Kaiser: Ja, ich glaube das ist eine wichtige Aufgabe von Beratung. Es geht darum, Geschäftsmodelle in den Unternehmen zukunftsfähig zu machen und da wird Voice eine große Rolle spielen.

 

Ralf Strehlau: Noch heißt es „Mobile first“. Welches neue Schlagwort erwartet uns in zehn Jahren?

David Kaiser: Ich bin überzeugt, dass es irgendwann „Voice first“ sein wird. Es ist nur noch nicht klar, ob in zwei, fünf oder zehn Jahren. Vor allem für die Generation, die mit Tastatur aufgewachsen ist, ist es zu Beginn eine Überwindung, mit Technologie zu sprechen. Mein 4-jähriger Sohn wird mit Sprachsteuerung groß und er versteht bereits heute nicht, warum man mit bestimmten Geräten nicht sprechen kann. Er hat noch nicht gelernt, eine Tastatur zu bedienen und für ihn ist Sprache die natürlichste Art zu interagieren. Analog ist es bei meinen Großeltern. Sprache ist hier altersunabhängig.

 

Ralf Strehlau: Ich bedanke mich für das Gespräch, Herr Kaiser

Zurück zur Übersicht