Voice Search – Der Aufstieg der Conversational Systems

Einige von euch erinnern sich bestimmt noch an den Apple I oder die alten Klassiker von IBM. Damals wurden die ersten Computer noch komplett ohne Maus und nur durch die Eingabe spezieller Befehle in die Kommandozeile bedient, ehe Steve Jobs der Computermaus und auch der grafischen Benutzeroberflächen zum Durchbruch verhalf.

Grafische Benutzeroberflächen werden heutzutage überwiegend bei Computern, Smartphones oder klassischen Bedienelementen wie einem Geldautomaten eingesetzt und sind kaum noch wegzudenken. Dennoch könnten Sie in den nächsten Jahren durch die Verbreitung von Voice Search (als primäres Bedienelement) verdrängt werden.

Nutzung von Voice Search auf einem Conversational Interface

„With a conversational interface, people can speak to their smartphones
and other smart devices in a natural way in order to obtain information, access Web services, issue commands, and engage in general chat.“ – McTear; Griol; Callejas

Voice Search & Conversational User Interfaces

Durch die steigende Anzahl von gesprochenen Suchanfragen wird sich auch die Form ändern, in der die Suchergebnisse den Nutzern dargestellt wird. Genau hier kommen Conversational User Interfaces (CUI) zum Einsatz.

Ein CUI ermöglicht es dem Nutzer Suchanfragen oder Befehle, durch den Gebrauch natürlicher Sprache, auszuführen. Dabei wird dem Nutzer nach einer Suchanfrage meist eine direkte Antwort auf die gestellte Frage vorgelesen, wohingegen die Antwort bei einer grafischen Benutzeroberfläche als Ergebnisliste dargestellt wird und sich der Suchende aus den vorgeschlagenen Suchtreffern die Antwort selbst heraussuchen muss. Natürlich gibt es auch hier einige Ausnahmen wie Direct Answers bei Google.

Matt Weinberger, Tech-Journalist bei Business Insider, geht davon aus, dass Smartphones oder andere Geräte mit grafischer Bedienoberfläche in den nächsten Jahren immer weiter an Relevanz für den Nutzer verlieren und sprachbasierte Lösungen immer zentraler werden. Der gerade entstehende Wandel kann in Relation mit der Verdrängung des Desktop Computers durch das Smartphone und das Tablet gesetzt werden.

Um einen Computer zu nutzen benötigt es einen Bildschirm zur grafischen Darstellung, eine Maus und Tastatur als Eingabemedium und das Computergerät selbst. Das Smartphone kombiniert all diese Eigenschaften, schränkt sie auf das Wesentliche ein und kann jederzeit über die Touch-Funktion bedient werden.

“But consider the smartphone from another perspective. The desktop PC and the laptop are made up of some combination of a mouse, keyboard, and monitor. The smartphone just took that model, shrank it, and made the input virtual and touch-based.” – Matt Weinberger

Bei einem Conversational System entfällt selbst die Bedienung über eine Maus, Tastatur oder ein anderes Eingabemedium, da nur die eigene Stimme benötigt wird.

Auch die Problematik der Nutzung von einer Vielzahl von Apps, die über verschiedene grafische Oberflächen verfügen, wird durch die Nutzung eines CUI umgangen, da diese nun nicht mehr vom Nutzer persönlich bedient werden müssen. Zudem sind die Einstiegshürden für Nutzer sehr gering, da die intuitive Bedienung durch natürliche Sprache bereits in Kindestagen erlernt wird. Vor allem älteren Nutzergruppen, die noch nicht mit der Technik vertraut sind, wird eine Handhabung durch Sprachbefehle, anstatt durch die grafische Bedienung, leichter fallen. Auch Nutzer die Probleme mit der Sehkraft haben oder denen die Benutzung eines GUI aufgrund von körperlichen Beeinträchtigungen nur schwer möglich ist, profitieren von der Nutzung eines Conversational Interface. Neben dem Smartphone oder einer Suchmaschine im Allgemeinen verfügen auch andere Geräte und Anwendungen über eine Conversational Interface Schnittstelle.

Diese Geräte und die neuen Möglichkeiten, die sich daraus ergeben, möchte ich euch nachfolgend vorstellen.

Wearables

Ein weiterer Fortschritt im Bereich der Conversational Interfaces zeichnet sich mit der derzeitigen Entwicklung und Marktpositionierung von Wearables ab.
Wearables sind kleine Computergeräte, die jederzeit am Körper getragen und mit weiteren Geräten digital vernetzt werden können. Die Geräte und Anwendungen unterstützen Menschen bei auszuführenden Tätigkeiten, sammeln Informationen wie Körperleistungsdaten, nehmen Auswertungen vor oder führen Anweisungen des Nutzers aus. Aufgrund der dauerhaften Datenverarbeitung und Unterstützung des Nutzers sowie der drahtlosen Vernetzung der Geräte untereinander, gliedern sich Wearables in den Bereich des Ubiquitous Computing ein, welcher beschreibt, dass Computer nun allgegenwärtig sind und nicht mehr nur als reines Werkzeug genutzt werden.

Wearables als perfekte Unterstützung bei der Nutzung von Voice Search un Voice Interaction.

Wearables dienen somit der direkten Mensch-Maschine-Interaktion und haben sich durch deren hochentwickelte Sensoren und den Einsatz von Verfahren der künstlichen Intelligenz zu smarten Assistenten entwickelt. Zum Einsatz kommen die Geräte derzeit vor allem im medizinischen sowie Sport- und Fitness-Bereich, indem sie Daten des Körpers gemeinsam mit anderen Metriken wie der Zeit oder der geografischen Lage aufzeichnen, diese analysieren und dokumentieren. Wearables in Form von Datenbrillen wie Google Glass oder Oculus Rift halten derzeit ebenso Einzug in die Welt des Augmented Reality, die nachfolgend erläutert wird.

Augmented Reality Systeme

Der Markt an Augmented Reality Lösungen wächst immer schneller und wird in naher Zukunft zusätzliche Alternativen zur Informationsdarstellung bieten können.

Die großen Tech-Unternehmen Microsoft, Google, Facebook oder Samsung arbeiten derzeit bereits an der Entwicklung von Augmented Reality Headsets, die grafische 2D und 3D Projektionen direkt in das Blickfeld des Nutzers leiten. In Kombination mit einem CUI könnte somit die klassische grafische Benutzeroberfläche eines Smartphones abgelöst werden. So könnte die Datenbrille die Menüstruktur des Smartphones wiederspiegeln und über natürliche Sprache gesteuert werden. Nachrichten können somit viel schneller über Spracheingabe verfasst werden. Ebenso Online-Shops und Webseiten müssen sich diesem Trend entgegenstellen und geeignete Schnittstellen erstellen, die das Navigieren auf der eigenen Webseite komplett ohne Maus, Tastatur oder Touchbedienung ermöglicht.

Mit dem neuesten Modell der Oculus Rift integrierte das VR-Unternehmen, welches im März 2014 von Facebook Inc. übernommen wurde, bereits eine Voice-Schnittstelle, mit der das virtuelle Menü über Spracheingaben gesteuert werden kann.

 

Wireless Earbuds

Ebenso interessant in Verbindung mit Voice Search und Voice Interaction ist der derzeitig rasant wachsende Markt der Bluetooth-Kopfhörer und Wireless Earbuds. Aufgrund der stetigen Verbesserung von Spracherkennungssoftware, tragen die smarten Geräte einen großen Teil dazu bei Conversational Interfaces in unserem Alltag zu etablieren.

Fast alle verfügbaren Bluetooth-Kopfhörer unterstützen bereits die Nutzung von Sprachassistenten wie Siri und OK Google auf Knopfdruck oder per Gestensteuerung. Einige von ihnen besitzen sogar eine eigene Software, die unabhängig von anderen Geräten genutzt werden kann. Dadurch erweitern sich die Einsatzmöglichkeiten für Nutzer und Dienstanbieter gleichermaßen.

Das Marktforschungsunternehmen NDP Group ermittelte dazu im Juni 2016, dass der Verkauf von Bluetooth-Kopfhörern in Amerika erstmal den Verkauf von kabelgebundenen Kopfhörern überstieg. In Deutschland kommt dieser Trend aber erst langsam ins Rollen.

Der Aufschwung der Wireless Earbuds begann im Jahr 2014, als das schwedische Unternehmen Earin und das deutsche Unternehmen Bragi erste Crowdfunding-Kampagnen zur Finanzierung ihrer Produkte starteten. Bragi erreichte dabei in Rekordzeit eine Finanzierung von 3,39 Millionen Dollar und gehört heute zu den Marktführern. Direkt danach folgten weitere Unternehmen und Start-Ups, die ihre Geräte über Crowdfunding-Kampagnen erfolgreich finanzierten. Eine aktuell gängige Geräte sind bspw.  Teufel Move BT, Bragi The Headphone, Beats X by Dr. Dre sowie die Apple AirPods.

Im derzeitigen Wandel von GUI zu CUI haben Wirless Earbuds großes Potential sich am Markt erfolgreich zu etablieren. Ähnlich wie im Film „Her“ mit Joaquin Phoenix und Scarlett Johansson angedeutet, kann deren Nutzung und die Nutzung von anderen Wearables nahtlos in das Leben der Nutzer integriert werden. Auch wenn eine derzeitige Nutzung vor allem in Europa noch nicht sehr verbreitet ist, sind Analogien zur Einführung des Smartphones zu erkennen, welches damals auch einige Zeit benötigten, um zu einem gewohnten Anblick in unserer Gesellschaft zu werden.

Bluetooth-Kopfhörer ermöglichen bspw. die Wiedergabe von Musik und Podcasts, das Empfangen und Schreiben von Textnachrichten sowie die Verwaltung alltäglicher Abfragen und Interaktionen durch Sprachbefehle.

 

Nächster Halt „Brain Computer Interface?“

Eine Weiterentwicklung des Conversational Interface könnte in einigen Jahrzehnten das Brain Computer Interface (BCI) darstellen. Das Brain Computer Interface ist die direkteste Form der Kommunikation zwischen einem Menschen und einer Maschine. Eine Maschine kann somit alleine durch die Kraft der Gedanken und durch Muskelkontraktionen von einem Menschen gesteuert werden, ohne dass ein Eingabegerät benötigt wird. So könnten in einigen Jahren auch Fragen eines Nutzers direkt beantwortet und durch die Knochenschall-Technologie an das Hörzentrum oder direkt über smarte Brillen in das Blickfeld des Nutzers gesendet werden. Das Ganze ist bis dato natürlich nur schwer vorstellbar. Einige dieser Technologien sind bereits recht weit und müssen nur noch für den Massenmarkt weiterentwickelt werden.

Ausblick

Im nächsten Teil unserer Voice Search-Reihe dreht sich alles um Digitale Assistenten wie Alexa, Siri, Cortana & Co. Wir geben euch einen Überblick über die fünf derzeit bekanntesten digitalen Assistenten, welche Vorteile bzw. Nachteile sie haben und welche neuen Produktentwicklungen auf uns zukommen werden.

Weitere Beiträge unserer Voice Search Reihe

Teil 1: Voice Search: So funktioniert die Sprachsuche!

Teil 3: Digital Assistant: Smarte Helfer dank Sprachsuche

Teil 4: Voice Search im Online Marketing: Wie bereite ich mich richtig vor?

Teil 5: SEA & Sprachsuche – Worauf sollte geachtet werden?

Picture of Tobias Stiedl
Tobias Stiedl
Der Autor dieses Artikels hat das Unternehmen verlassen. Bei Fragen zum Artikel wenden Sie sich bitte an [email protected]!
Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert