Amazon Echo i Alexa – duet nie w ciemię bity. Z wizytą w Amazon
O zaawansowanych głosowych asystentach pisaliśmy w mijającym roku zapewne dziesiątki razy. Mamy do czynienia z globalnym trendem, który w odróżnieniu od wielu wcześniejszych, szybko otrzymał praktyczne realizacje.
Swoje dokonania ma na tym polu Amazon, posiadający kompletne portfolio urządzeń, na których można korzystać z usług Aleksy – asystentki, która rozwijana jest w Gdańsku, w tamtejszym centrum Amazon Research & Development. Wczoraj mieliśmy okazję odwiedzić to miejsce, dowiedzieć się, jak faktycznie przebiega praca nad Alexą od kuchni i w końcu odpowiedzieć sobie na kluczowe pytanie: czy rzeczywiście, przynajmniej w perspektywie kilkudziesięciu najbliższych miesięcy, docelową metodą korzystania z komputerów, niezależnie od półki cenowej czy klasy urządzenia, będzie język naturalny i głos?
Alexa, co potrafisz?
Imię Aleksy wzięło się od Biblioteki Aleksandryjskiej. Ma ona zatem stanowić krynicę wiedzy, interfejs obsługi wyszukiwarek poprzez precyzyjne odpowiedzi na proste pytania. Jak proste? Alexa bez problemu odpowie na pytania o jednostkową informację (kiedy urodził się Abraham Lincoln?), a często odpowiedź zostanie uzupełniona o dodatkowe dane (Abraham Lincoln urodził się 12 lutego 1809 roku w Hodgenville, w stanie Kentucky). Na razie jednak nie należy oczekiwać sukcesu w przypadku pytań, które wymagają dzielenia pytań na syntagmy, rozbijania na części pytań w pytaniu, jak np. kiedy urodził się 16. prezydent Stanów Zjednoczonych?.
Oczywiście dzięki Aleksie można także korzystać z usług. W praktyce stanowi ona jedynie pośrednika, kompletny ośrodek przetwarzania komend głosowych na polecenia i generowania komunikatu zwrotnego. Już dziś, czego byliśmy świadkami, dzięki Aleksie bez problemu można zamówić Ubera, obsługiwać usługi muzyczne (Prime, Spotify), Kalendarz Google oraz automatykę domową. Z tą ostatnią kwestią radzi sobie bardzo skutecznie: zarządzanie całymi grupami urządzeń (Alexa, wyłącz światła) jak i pojedynczymi żarówkami Philips Hue (Alexa, przygaś światło w kuchni o 50%) przebiega bezproblemowo.
Amazon Echo Dot, pierwsze chwile z asystentką Alexa
Wrażenie robi tutaj skuteczność działania kontekstowego, a także świetnego odnajdywania się Aleksy w przypadku ogólnych, nie do końca sprecyzowanych poleceń. Najlepiej widoczne było to podczas prezentacji usług muzycznych. Po integracji z Amazon Prime czy Spotify, możliwe jest nie tylko odtworzenie konkretnych utworów, ale na przykład posłuchanie rocka. Wystarczy poprosić o to Alexę, aby ta odnalazła i uruchomiła dostępne dla tego gatunku radio w usłudze komendą zagraj rocka. Muzyka się podoba? Nic nie stoi na przeszkodzie, aby zapytać asystentkę o aktualnie odtwarzany utwór, poznać jej autora, tytuł kompozycji i album, z jakiego pochodzi. Summa summarum, mimo że na linii człowiek-maszyna zdarzają się nieporozumienia, czy niekiedy konieczność doprecyzowania polecenia, Alexa potrafi sporo, jest skuteczna, a z czasem może być tylko lepiej.
Dziś z usług Alexy można korzystać na całkiem pokaźnej liście urządzeń Amazonu: na głośnikach Echo, Echo Dot, Tap, Fire TV 2. generacji, tablecie Fire HD. Nie brakuje producentów, którzy zdecydowali się na implementację Aleksy na własnych urządzeniach, jak na przykład LG czy Pebble. Nic nie stoi na przeszkodzie, aby dokonać samodzielnej implementacji, na przykład na Raspberry Pi. Oczywiście poza samą płytką, konieczne jest także zapewnienie odpowiedniej jakości mikrofonu i głośników.
Dziś z Alexą można porozmawiać po angielsku i niemiecku. Co ciekawe, Alexa jest w pewnych kontekstach dostosowana do rysu lokalnego i na te same pytania będzie odpowiadać nieco inaczej w obu dostępnych wersjach językowych i lokalizacjach, co ma dostosowywać ją do kręgu kulturowego. O ile ta kwestia (przynajmniej w przypadku porównań dwóch kultur zachodnich) ma dziś raczej znaczenie symboliczne, to dużo większym wyzwaniem jest dla Alexy… asertywność. Pod tym słowem ukryliśmy kwestię bezpieczeństwa: dziś polecenia głosowe włączonej Alexie może wydawać każdy kto jest w zasięgu siedmiu mikrofonów (układ sześciu na okręgu i jednego centralnego) wbudowanych np. w głośnik Echo.
Zarówno sama asystentka, jak i urządzenia Amazona, nie rozróżniają jeszcze głosów poszczególnych użytkowników, np. domowników, co wydaje się nie tyle brakiem, co niewykorzystanym potencjałem. Nietrudno sobie wyobrazić, że właściciel Echo chciałby ograniczyć możliwości swojego dziecka w zarządzaniu automatyką domową czy telewizorem. Jeżeli zatem użytkownik chce, aby jako jedyny mógł wydawać polecenia córce Amazonu, to jedyną możliwością jest… wyciszenie mikrofonu lub wyłączenie urządzenia. Nietrudno sobie także wyobrazić duże możliwości płyną z rozpoznawania użytkowników, jak np. personalizacja usług muzycznych.
Czy rzeczywiście, przynajmniej w perspektywie kilkudziesięciu najbliższych miesięcy, docelową metodą korzystania z komputerów, niezależnie od półki cenowej czy klasy urządzenia, będzie język naturalny i głos? Po tym, co zobaczyliśmy w gdańskim centrum Amazonu, z całą pewnością można nabrać wiele entuzjazmu do udzielenia odpowiedzi twierdzącej. Nawet jeśli asystentka Amazonu bywa niedoskonała, to już na aktualnym etapie może być świetną propozycją, szczególnie w warunkach domowych. Zwłaszcza gdy doczeka się bardziej zaawansowanej integracji z urządzeniami innej klasy, smartfonami czy pecetami (do czego może przydać się Microsoft Home Hub) oraz wykorzysta pełnię potencjału obsługi uprawnień i kont.
Jedną kwestię stanowi Alexa jako produkt, drugą proces prac nad asystentką, któremu mieliśmy okazję się przyjrzeć w Gdańsku. Zapraszamy do zapoznania się z artykułem opisującym Aleksę od kuchni oraz wideoprezentacją Amazon Echo Dot, mniejszego wariantu inteligentnego głośnika Amazonu, dostarczającego pełnię możliwości Aleksy, który trafił już do naszej redakcji.