M – hybrydowa asystentka od Facebooka z ambicjami większymi niż Siri czy Cortana
Cyfrowe asystentki mają zdjąć z naszych barków ciężar tychwszystkich schematycznych czynności, jakie wykonuje się nakomputerze, nadać maszynie pozoru rozumności. Jednak jak dotąd,nawet najlepsza z nich, Siri firmy Apple, przedstawia raczej tylkogłupotę maszyny, dowodząc, że sekretarka z krwi i kościpozostaje niezastąpionym dobrem każdego szefa. Teraz swoją wersjęcyfrowej asystentki przedstawia Facebook, jednak w przeciwieństwiedo rozwiązań konkurencji, przyznaje, że sztuczna inteligencja jestgłupia – więc obiecuje wsparcie ze strony inteligencji człowieka.
Nowa cyfrowa asystentka z laboratoriów pana Zuckerberga nazywasię po prostu M, i pojawiła się jako eksperyment na smartfonachkilkuset niespodziewających się niczego użytkowników z DolinyKrzemowej. Zbudowana na bazie komunikatora Facebook Messenger M ialgorytmów AI firmy Wit.ai, jest jednak nadzorowana i wspieranaprzez ludzi – trenerów, którzy nie tylko szkolą sztucznąinteligencję, ale i wykonują jako M wiele operacji. Czy totechniczny regres, skoro do tej pory Google, Apple i Microsoft takbardzo się chwaliły pełną automatyzacją asystentek Now, Siri iCortany?
Niekoniecznie – można powiedzieć, że jest to realistycznepodejście do współczesnej techniki. Ludzcy trenerzy M stają sięw tym systemie źródłem danych o tym, co i jak należy robić,danych, które dziś nie istnieją. To na ich działaniach iodpowiedziach uczyć się mają algorytmy głębokiego uczenia zWit.ai, by z czasem osiągnąć porównywalny, a może i wprzyszłości wyższy niż ludzie poziom.
Obecnie cykl w jakim działa M jest znacznie bardziej złożony,niż w wypadku asystentek konkurencji. Po zadaniu M pytania, próbujeona dokonać jego dekompozycji i analizy, a następnie sformułowaćpoprawną odpowiedź. Odpowiedź ta nie trafia jednak bezpośredniodo pytającego, ale właśnie do zespołu trenerów, których każdykrok jest zapisywany pod kątem przyszłej formalizacji. I tak oto,jak wyjaśnia Marcus Lebrun, twórca Wit.ai, gdy M zostaniepoproszone o opowiedzenie żartu (typowa demonstracja umiejętnościcyfrowych asystentek), to odpyta internetową usługę dostarczającążarty, ale wybrany żart zostanie sprawdzony przez trenera, czy abynaprawdę jest śmieszny. Jeśli trener będzie rozbawiony, dopierowtedy użytkownik otrzyma swoją odpowiedź. To dobre podejście,biorąc pod uwagę to, jak kiepskie czasem żarty opowiadają Siriczy Cortana.
Jeśli jednak zażąda się od M czegoś bardziej wymagającego,np. umówienia go na egzamin na prawo jazdy, to póki co to właśnietrenerzy wykonają większość operacji, dzwoniąc do urzędukomunikacji i niejako „za plecami” M, umawiając chętnegoużytkownika. Jednak wszystko co zrobią w tym celu zostaniezapisane: witryny internetowe jakie odwiedzą, połączeniatelefoniczne jakie wykonają, słowa jakie wypowiedzą w celuumówienia, odpowiedzi, jakie uzyskają od urzędnika i wreszcie to,co w odpowiedzi napiszą proszącemu o umówienie. Na tych danych będą się później ćwiczyły sztuczne sieci neuronowe, stanowiącetrzon M.
M nie jest wynalazkiem Facebooka. W 2013 roku powstał wKalifornii mały startup Wit.ai, którego celem było stworzeniecyfrowego agenta, mogącego zastąpić ludzkich operatorówinfolinii, wykorzystywanych np. przez firmy telekomunikacyjne dorozmów z klientami. Agent taki był w stanie rozpoznać mowę i dopewnego stopnia „rozumieć” język naturalny, bez korzystania zwykorzystywanych do tej pory ogromnych zbiorów próbek ludzkiejmowy, wykorzystywanych przez Apple, Google i Microsoft.Wykorzystywane przez Wit.ai metody matematyczne nie były jakośszczególnie innowacyjne, to w zasadzie klasyka Data Miningu –metoda warunkowychpól losowych i zasada maksymalnejentropii są w tej dziedzinie wykorzystywane od ponad 10 lat, aleelastyczność rozwiązania przykuła uwagę Facebooka.Społecznościowy gigant za nieujawnioną kwotę kupił w styczniutego roku cały zespół, zatrudniając go do zbudowania cyfrowejasystentki o nieograniczonych wręcz możliwościach.
Zanim M uzyska pełną autonomię może minąć wiele lat, a tooznacza spore ryzyko dla Facebooka. By nauczyć sieć neuronowąsamodzielności, potrzebne są dane z ogromnej ilości interakcjiczłowiek-maszyna, te dane mogą być jednak pozyskane tylko przezudostępnienie M jak największej liczbie użytkowników Facebooka.Im więcej M będzie potrafiła, tym więcej jednak użytkownicy będąod niej wymagali, a to będzie wymagało zaangażowania większejliczby ludzkich trenerów. Lebrun wierzy, że uda się utrzymaćzależność, w której liczba ludzi pracujących nad M będzie rosłaliniowo, podczas gdy liczba użytkowników będzie rosławykładniczo, ale to bardzo optymistyczne założenie, tym bardziej,że nie ma żadnych gwarancji, że sieć neuronowa będzie sięakurat uczyła tego co istotne, zwracała uwagę na rzeczy, którenaszym zdaniem mają znaczenie. Doświadczenie z AI pokazuje, żeczasem maszynowe skojarzenia są dla nas bardzo kontrintuicyjne iprowadzą do bardzo wypaczonych modeli świata.