VoiceUI - Alles was du 2017 wissen musst

DieProduktMacher |

22. Mar 2017 |

- min Lesezeit

VoiceUI - Alles was du 2017 wissen musst

DU HAST INTERESSE AN VOICE UI? Am Montag, 27.3.2017 organisieren DieProduktMacher ein Meetup zum Thema Voice Interfaces mit Liz Myers(Alexa Evangelistin). Sie wird euch zeigen wie man Skills (Anwendungen für Amazon Alexa) entwickelt. Wenn ihr Lust habt Alexa besser kennen zu lernen, kommt am 27.3. ins WERK1 in der Grafinger Str. 6. Wir freuen uns auf euch!

DieProduktMacher beschäftigen sich intensiv mit innovativen Themen wie Hardware, Internet of Things, Beacons und natürlich auch mit Zero UI Konzepten wie Sprach- und Gestensteuerung und Bots. Heute will ich euch vorstellen welche aktuellen Möglichkeiten es hinsichtlich Sprachsteuerung gibt.

Eine Sprachsteuerung ist im Grunde nichts anderes, als eine Software, welche die natürlich gesprochene Sprache erkennt, verarbeitet und daraufhin Aktionen ausführt. Sprachassistenten finden wir schon seit längerer Zeit auf unseren Smartphones (Siri, Google Speech) und neuerdings auch bei uns Zuhause (Alexa, Google Home). Sie erledigen für uns Aufgaben, die wir ihnen mit unserer Stimme mitteilen, z.B Fragen beantworten, Musik abspielen, Nachrichten vorlesen, Termine verwalten, Wettervorhersage, Rezepte vorlesen und viele mehr.

Dies ist aber nur der Anfang, da Hersteller wie z.B Amazon ihre Systeme für die Öffentlichkeit zur Verfügung stellen, können diese auch in andere Geräte integriert werden. Auf der diesjährigen CES (Consumer Electronics Show) in Las Vegas fand man Alexa gut vernetzt in z.B Staubsaugern, Waschmaschinen und sogar Autos. Das heisst, dass Entwickler die Spracherkennung und Intelligenz von Alexa nutzen können, um diese in ihre eigenen Systeme zu integrieren.

Siri

Zuerst habe ich die wohl bekannteste Spracherkennung namens Siri (Speech Interpretation and Recognition Interface) unter die Lupe genommen. Siri wurde 2014 vorgestellt und war ab iOS 5 auf dem iPhone 4s verfügbar.

Siri kommt in vielen Anwendungsfällen zum Einsatz, wie z.B Websuche, Apps starten, Nachrichten versenden, Kontakte anrufen, Musik abspielen, Kalendereintrag, SmartHome. Seit iOS 10 (Ende 2016) hat Apple Siri für Entwickler geöffnet, diese können jetzt Erweiterungen für ihre Apps schreiben und diese mit Siri verknüpfen.

Siri kann angesprochen werden indem der HomeButton des iPhones gedrückt wird oder - nach Freigabe in den Einstellungen - auch direkt per Stimme mit dem Befehl “Hey Siri”. Um eine App über die Siri UI nutzen zu können, muss die App installiert sein und der Nutzer muss in den Systemeinstellungen erlauben, dass diese App von Siri genutzt werden darf. Die Kommunikation kann innerhalb des gewohnten Siri UIs erfolgen, die App muss dazu also nicht geöffnet sein. Neben dem iPhone findet man Siri auch auf der Apple Watch, Apple TV, iPad und seit neustem auch auf MacOS.

Interessante Fakten hinsichtlich Entwicklung:

Apple erlaubt derzeit die Integration nur aus diesen Kategorien: Fahrt buchen, Messaging, Fotosuche, VoIP Calling, Fitness, Carplay (nur für Autohersteller)
Innerhalb der Kategorie können nur die von Apple festgelegten Sprachbefehle verwendet werden
bei gleichen Keywords fragt Siri welche App dazu verwendet werden soll

Google Now

Google Now ist das Konkurrenzprodukt zu Siri und die Erweiterung von Google Search. Der Sprachassistent ist in den meisten neuen Android-Geräten integriert.

Dieser wird durch das Wakeword “Ok Google” oder “Hey Google” aktiviert. Auch iOS User können diesen nutzen, indem sie die App “Google” installieren. Google Now funktioniert sehr gut mit den restlichen Google Apps wie Gmail oder Google Kalender und sucht innerhalb der Apps nach relevanten Informationen. Anwendungsfälle sind Wettervorhersage, News, Spiele, SmartHome, Termine verwalten, Navigation und viele mehr. Neben dem VoiceUI erhält der User auf seinem Smartphone zum Kontext relevante Informationen in Form von Cards.

Größter Unterschied zu Siri: der User erhält Informationen situationsbedingt und lokalbasiert z.B werden in der Nähe eines Kinos Informationen zu aktuellen Filmen in einer Card angezeigt. Neben den Android Geräten findet man Google Now auch im Google Chrome Webbrowser.

Interessante Fakten hinsichtlich Entwicklung:

bei gleichen Keywords fragt Google welche App dazu verwendet werden soll

Alexa

Alexa ist ein von Amazon entwickelter Sprachassistent. Dieser ist seit Ende Juni 2015 in den USA und seit kurzem auch in Deutschland verfügbar.

Der Sprachassistent ist in die Geräte Amazon Dot und Amazon Echo Dot integriert. Der Unterschied zwischen Dot und Echo Dot ist, dass die Dot Version über einen kleineren Lautsprecher verfügt; von der Funktionsweise unterscheiden sich die Geräte jedoch nicht. Das Gerät kann mit dem Wakeword “Alexa”, “Echo”, “Amazon” oder “Computer” angesprochen werden. Neben den Basisfunktionen welche bereits auf dem Gerät installiert sind wie z.B Wettervorhersage, Nachrichten oder Todo Liste, können Nutzer weitere Erweiterungen so genannte Skills installieren. Diese werden über die Alexa App (verfügbar für iOS und Android) in einer Art Skillstore (ähnlich einem App Store) installiert und verwaltet. Danach kann der Nutzer den entsprechenden Skill nutzen und mit diesem interagieren in dem er das Wakeword “Alexa” benutzt und im Befehl den “Skillnamen” verwendet.

Zum Beispiel: “Alexa frage Wissenslexikon wie groß der Mond ist” wobei “Wissenslexikon” in diesem Beispiel der Skillname wäre. Alexa muss immer aktiv angesprochen werden, sie erinnert mich z.B nicht selbstständig an Termine oder spricht mich an wenn es bestimmte Neuigkeiten gibt. Dank verbauter künstlichen Intelligenz lernt Alexa immer mehr hinzu je mehr man mit ihr spricht.

Interessante Fakten hinsichtlich Entwicklung:

Alexa kann dank SDK auf jedem Gerät mit Internetverbindung, und Lautsprecher / Mikrofon installiert werden
Skills werden von Amazon geprüft und freigeschaltet

Google Home

Google Home ist ein von Google entwickelter Sprachassistent. Dieser ist derzeit nur in den USA verfügbar und wird voraussichtlich im Frühjahr 2017 auch auf dem deutschen Markt erscheinen.

Der Sprachassistent ist neuerdings auch auf den Google Pixel Smartphones und in Googles Allo Messenger verfügbar. Der Unterschied zu Alexa ist derzeit, dass an Google Home nicht nur Befehle gesendet werden können, sondern richtige Konversationen mit dem Assistenten möglich sind. Außerdem ist Google Home die nächste Generation von Google Now, hierbei stehen Konversationen im Vordergrund, denn geantwortet wird in ganzen Sätzen statt knappen Antworten.

Bei der Verwendung unterscheidet man zwischen Befehlen (“direct actions”) wie zum Beispiel “Hey Google, schalte das Licht aus” und Konversationen (“conversation actions”) wie zum Beispiel “Hey Google, lass mich mit dem Küchenchef sprechen, ich habe Tomaten, Paprika und Reis, was kann ich damit kochen?”. Dabei wird eine Konversation gestartet, in der der Nutzer mit dem Google Home Assistenten interagiert. Die Actions müssen nicht vom Nutzer herunter geladen werden, denn sie sind, nachdem Google diese freigegeben hat, für alle Google Home Nutzer automatisch verfügbar.

Interessante Fakten hinsichtlich Entwicklung:

Um direct actions veröffentlichen zu können, wird eine Partnerschaft mit Google benötigt
Conversation actions können von allen Entwicklern eingereicht werden hierzu wird keine Partnerschaft benötigt
Bei conversation actions handelt es sich um eine Art Bots
Conversation actions können über Plattformen wie api.ai oder Gupshup erstellt werden, hierzu werden keine großen Programmierkenntnisse benötigt
Actions werden von Google geprüft und freigeschaltet