Cyfrowe asystenty: prywatność ocaleje, ale ludzkie języki już niekoniecznie
Moda na cyfrowe asystenty zaklęte w sprzęty gospodarstwadomowego trwa w najlepsze. Nawet Andy Rubin, twórca Androida, popokazaniu swojego smartfonu Essential zapowiedział wprowadzenie narynek urządzenia Essential Home, przy którym produkty Amazona iGoogle wypadają naprawdę kiepsko. Czy w wyścigu komercyjnychproduktów do kieszeni konsumentów udział może jednak wziąćrozwiązanie otwarte, opracowywane przez społeczność? Ludziestojący za startupem Mycroft, którzy niedawno pokazali swojeurządzenie Mark 1, wierzą, że nie są bez szans.
31.05.2017 | aktual.: 31.05.2017 11:52
Essential Home: piękniej i poufniej
Nowy modułowy smartfon Andy’ego Rubina wzbudził zasłużonezainteresowanie, ale właściwie nie ma w nim niczego takiego,czego w tej czy innej formie nie widzielibyśmy wcześniej. EssentialHome to jednak naprawdę świeży pomysł – zmaterializowanycyfrowy asystent, którego aktywujemy zarówno głosem, jak i nawetspojrzeniem
Możliwości urządzenia mają być zbliżone do tego, co oferująsmart-głośniki Amazon Echo czy Google Home, jednak Essential Homema być bardziej elegancki, mniej nachalny i narzucający się, aprzede wszystkim – całkowicie wolny od Inwigilacji-jako-Usługi.Dane użytkownika przetwarzane są lokalnie, a nie w chmurzeproducenta. Czyni to produkt pana Rubina bardziej sprytnym menedżeremdomowego Internetu Rzeczy, niż podstępnym sprzedawcą historiinaszych partnerów, jak to jestz konkurencyjnym produktem pewnej wielkiej korporacji z branżyreklamowej.
Essential Home pojawić się ma wsprzedaży jeszcze tego lata, wiadomo że będzie działać podkontrolą androidowego Ambient OS-a i współpracować zrozwiązaniami innych firm, takimi jak HomeKit, Nest czy SmartThings.Zainteresowani uruchomią na nim Alexę, Asystenta Google, a byćmoże nawet i Siri – to jednak stawia pod znakiem zapytaniaobietnice poszanowania prywatności.
Mycroft Mark I: otwarty brytyjski styl
Inną strategię przyjmująwywodzący się z Wielkiej Brytanii twórcy startupu Mycroft AI. Onizaczęli od rozwoju opensource’owego cyfrowego asystenta, którymzamarzyło się dać sztuczną inteligencję każdemu chętnemu, wformie podatnej na wszelkie modyfikacje, tak że można by było jązastosować zarówno w szkolnych projektach, jak i np. do obsługicall center.
Finansowany za pieniądze zebranena Kickstarterze projekt pozwolił na stworzenie zarównooprogramowania, jak i referencyjnego (również otwartego) urządzeniaMark I, na którym Mycroft miał działać. Wzornictwo bardzostaroszkolne, można by było pomylić to z budzikiem czy radiem zlat siedemdziesiątych, a możliwości póki co raczej skromne – otmożemy zapytać Mycrofta o pogodę, czas, newsy, włączenie radiainternetowego, sprawdzenie czegoś na Wikipedii czy Wolframie Alpha.Głos jest byle jaki, szum przeszkadza w rozpoznawaniu mowy, widaćże oprogramowanie to wciąż wersja alfa.
Wersja beta obiecywana jest naluty 2018 roku, przynieść ma nie tylko ulepszenie głosowegointerfejsu, ale i lepszą integrację z domowym sprzętem, tak byMycroft mógł sterować multimedialnymi odtwarzaczami i kontrolowaćRzeczy podłączone do Internetu. Na razie pierwsi sponsorzy zKickstartera dostają swoje „budziki” Mark I (za które zapłacili129 dolarów) – i sądząc po opiniach tych entuzjastów, sącałkiem zadowoleni. Pozostali mogą zapoznać się z Mycroftem zasprawą projektuPicroft, tj. obrazu systemu dla Raspberry Pi z głośnikiem imikrofonem.
Cyfrowe asystenty i zmierzch języków narodowych
Ten pęd ku cyfrowym asystentom może mieć nieoczekiwanekonsekwencje społeczne. Ich rozwijanie to nie tylko ciężka pracaprogramistów, ale też i lingwistów – a języki naturalne są natyle unikalne w swych cechach fonetycznych, że biorąc się zaprzetwarzanie mowy w czasie rzeczywistym, dla każdego z nich trzebawykonać ogromną robotę od podstaw.
Nic więc dziwnego, że wsparcie dla języków jest ograniczone dotych najpopularniejszych. Z Amazon Echo porozmawiamy po angielsku iniemiecku. Z Google Home – tylko po angielsku. Cortana Microsoftuoprócz angielskiego mówi też po mandaryńsku, niemiecku,hiszpańsku, francusku, włosku, portugalsku, japońsku i rosyjsku –choć jej sprawność w tych językach odbiega od sprawności wangielskim. W teorii najlepiej wypada Siri, wspierająca dziś 21języków (w tym arabski tajski, turecki, nowohebrajski czy fiński),ale podobnie jak w wypadku Cortany, to wsparcie jest takie sobie.Nierzadko użytkownicy przyznają, że zamiast męczyć się ze swoimjęzykiem narodowym, po prostu przełączają się na angielski.
Podobnie jest ze wspomnianym Mycroftem – i tu jedynym językiemjest angielski, który wyrasta na uniwersalny język komunikacjigłosowej z maszynami, mimo że ze względu na swoją tragicznąfonetykę, najgorzej się chyba do tego nadaje. Co to oznacza dlareszty świata, na którym używa się dziś wciąż ponad 7 tysięcyjęzyków?
W środowisku lingwistów pojawiają się głosy, że uczynieniegłosu podstawą komunikacji z maszynami przyspieszy jedyniewymieranie tych mniej popularnych języków. I wcale nie chodzi tylkoo jakieś niszowe języki australijskich Aborygenów, które nigdynawet nie miały formy pisanej. Z raportuprzygotowanego w tym roku przez Multilingual Europe TechnologyAlliance wynika, że wskutek rosnącej popularności interfejsówgłosowych najbardziej zagrożone są islandzki, gaelicki irlandzki,łotewski, maltański i litewski.
Dla takiego islandzkiego, którym mówi dziś raptem kilkasettysięcy ludzi, żadnej firmie po prostu nie opłaca się tworzyćbibliotek do interfejsów głosowych. I nic dziwnego, w końcu nieopłacało się tego robić nawet dla polskiego, którym mówiprzecież ponad 40 milionów ludzi. Języki, które będą corazmniej pożyteczne w codziennym życiu, których nie ma na liściewspieranej przez Cortanę czy Siri, zaczną być wypierane zcodziennego życia, zapominane, na rzecz tych najbardziejprzydatnych, na czele z angielskim i mandaryńskim.
Czy cokolwiek może zatrzymać ten trend? Zapewne tylkoniekomercyjne projekty, pokroju Mycrofta, oraz prace nad sztucznymiinteligencjami wspomagającymitrening i rozwój sztucznych inteligencji. Nawet i to nie odbędziesię jednak za darmo. Władze Islandii oceniają, że potrzeba dziśco najmniej 9 mln dolarów na stworzenie opensource’owej bazyjęzyka, która pozwoliłaby na zachowanie islandzkiego w erzecyfrowych asystentów. Bez takiej inwestycji język ten podzieli losłaciny.