Google Assistant muss Geduld mit Füllwörtern und Stimmpausen haben

Von 9to5Google in einem kürzlich durchgeführten Deep Dive von APK Insights entdeckt, war a Funktion für den Nest Hub Max namens „Look and Talk“. Das Feature mit dem Codenamen „Blue Steel“ in Anlehnung an den Film „Zoolander“ von Ben Stiller wurde gerade auf der Google I / O 2022 offiziell enthüllt und ist ein kleiner Teil einer viel größeren Initiative, bei der Google hofft, seinen Assistenten viel natürlicher zu gestalten und angenehm zu interagieren.

Suchen und sprechen Sie nach Nest Hub Max

Das Ziel ist es, auf jedem Gerät einfach ein Gespräch mit Google Assistant zu initiieren und einfach natürlich zu sprechen und verstanden zu werden. Unsere Stimmen werden zum schnellsten Weg, um Computer anzuzapfen und Anfragen zu verarbeiten, aber bis heute ist es nicht perfekt. Zum Beispiel müssen Sie jedes Mal „Hey Google“ sagen, wenn Sie Ihren Nest Hub fragen oder etwas anrufen möchten – alles. „Schauen und sprechen„Versucht, das zu lösen, indem es Ihnen ermöglicht, einfach aus einer Entfernung von bis zu 1,50 m auf Ihren Nest Hub Max zu blicken und ihn zu aktivieren, bevor Sie sprechen.

Sie können aufhören, sich Gedanken darüber zu machen, wie man richtig um etwas bittet, und sich einfach entspannen und natürlich sprechen

Sissie Hsiao, VP/GM, Google Assistant bei Google

Um dies zu erreichen, verwendet der Assistent sechs maschinelle Lernmodelle, um mehr als 100 Signale sowohl von der Kamera als auch vom Mikrofon des Hubs in Echtzeit zu verarbeiten. Dinge wie Ihre Kopfausrichtung, Ihre Nähe zum Gerät, die Richtung Ihres Blicks, wie sich Ihre Lippen bewegen und jedes andere Kontextbewusstsein, das erforderlich ist, um Ihre Anfrage genau zu verarbeiten.

Lassen Sie mich zunächst sagen, dass dies absolut wild ist. Wir alle wussten, dass die Notwendigkeit des Hotwords eines Tages in den Hintergrund der Smart-Home-Nutzung treten würde, aber wir waren uns bisher nicht sicher, wie das passieren würde, und hatten Bedenken, wie Google dies auf eine Weise tun könnte, die beides ist effizient und respektvoll gegenüber der Privatsphäre der Benutzer.

In Bezug auf Look and Talk gilt es als sicher und geschützt, und alle Daten werden auf dem Gerät verarbeitet und niemals an Google oder andere Personen gesendet. Es verwendet auch gleichzeitig Face Match und Voice Match, also funktioniert es nur, wenn es erkennt, dass Sie wirklich Sie sind und dass Sie derjenige sind, der die Anfrage stellt, wenn Sie auf Ihr Gerät schauen, was super clever ist.

Der Assistent verarbeitet Pausen und Füllwörter in Sprachanfragen

Eine der größten Beschwerden, die ich habe, wenn ich versuche, meinem Haushalt beizubringen, wie man Google Assistant richtig verwendet, ist, dass sie häufig auf halbem Weg durch ihre Anfragen pausieren und der Assistent denkt, dass sie mit dem Sprechen fertig sind. Es verarbeitet den Befehl, kehrt zu den Ergebnissen zurück und erfüllt ihre Anfrage nicht, und es macht sie frustriert. In Wirklichkeit waren sie noch nicht ganz fertig mit Reden, sondern dachten einfach nur über das richtige Wort nach. Auf diese Weise haben viele Millionen Benutzer Bedenken, wie sie den Assistenten verwenden sollen, weil sie das Gefühl haben, dass sie ihre Gedanken perfektionieren müssen, bevor sie sprechen. Das ist sowohl unangenehm als auch nervig.

Um dies zu beheben, erstellt Google ein umfassenderes neuronales Netzwerk, das auf seinem Tensor-Chip läuft, und implementiert einen höflicheren und geduldigeren KI-Helfer. Anstatt davon auszugehen, dass der Benutzer mit dem Sprechen fertig ist, nur weil es ein wenig Stille gibt, verarbeitet es das Gesprochene und prüft, ob es Sinn macht oder ein vollständiger Satz ist, bevor es das Mikrofon abschaltet. Wenn es nicht ganz sicher ist, dass der Benutzer einen vollständigen Gedanken oder eine Bitte übermittelt hat (sprich: Wenn er unangenehme Pausen oder Füllwörter wie „ummm“ verwendet, während er laut denkt), wird er sanft aufgefordert, mit „mm hm“ zu beenden.

Der Assistent kann mit unangenehmen Pausen und Füllwörtern umgehen

Darüber hinaus sieht es so aus, als würde Google Assistant auch ein besseres Gefühl dafür entwickeln, wie die Gedanken des Benutzers in seinem Namen vervollständigt werden können. So höflich, oder? Als Sissie Hsiao dies auf der Bühne demonstrierte, benutzte sie das Wort „etwas“, und stattdessen verstand der Assistent, wie der Songtitel zu vervollständigen war, und entschied sich automatisch, ihn auf Spotify zu spielen!

Es wird auch in der Lage sein, Ihren Gedanken für Sie zu vervollständigen, wenn Sie nicht das richtige Wort kennen

Im Grunde ist das im Sinne von „ja? und was noch? Bitte fahren Sie fort… “Zugegeben, ich war überglücklich, als ich dies auf der Google I / O 2022 live demonstriert sah, und es wird wahrscheinlich das eine Update sein, das die meisten meiner Smart-Home-Frustrationen löst.

Quick Phrases und Real Tone-Anwendungen

Quick Phrases – Googles erste Implementierung, um die Notwendigkeit des „Okay Google“-Hotwords für bestimmte Aufgaben wie das Einstellen von Timern, das Umschalten intelligenter Lichter und mehr zu beseitigen – wird auf Nest Hub Max ausgeweitet! Schließlich wird Real Tone, ein Versuch, die Kamera- und Bildprodukte von Google über Hauttöne hinweg zu verbessern, um Benutzer mit unterschiedlichen Hintergründen richtig darzustellen, mit Nest Hub Max für Look and Talk funktionieren. Mit dem neuen wird an dieser Funktion weiter gearbeitet Hauttonskala des Mönchs die heute gestartet wurde (wirklich, es wurde dank seines Schöpfers, Harvard-Professor Dr. Ellis Monk, gerade Open-Source gemacht). Die Hauttonforschung von Google AI soll dazu beitragen, die Hauttonbewertung beim maschinellen Lernen zu verbessern und bietet eine Reihe von empfohlenen Praktiken darin eingesetzt werden ML-Fairness.

Wenn Sie sich die vollständige Google I/O 2022 Keynote ansehen möchten, können Sie dies unten tun. Wir haben auch reichlich Berichterstattung über alles, was gestern angekündigt und enthüllt wurde bitte schau es dir unbedingt an!! Lassen Sie mich in den Kommentaren wissen, auf welche dieser Google Assistant-Funktionen Sie sich am meisten freuen und ob Sie der Meinung sind, dass Google in Bezug auf KI und maschinelles Lernen Geschichte schreibt oder mit dem Feuer spielt.

Leave a Comment