Google wyjaśnia, jak sztuczna inteligencja sprząta w Google Play
Na blogu deweloperskim Androida, Google podzieliło się informacjami o tym, jak wykorzystuje maszynowe uczenie się do weryfikowania aplikacji trafiających do sklepu Google Play. Celem tego procesu jest upewnienie się, że aplikacje nie zbierają zbyt dużej ilości danych.
Każdy z programów jest poddawany analizie, a jej wyniki są porównywane z wynikami uzyskanymi z badań podobnych aplikacji, tak zwanych funkcjonalnych towarzyszy. Grupowanie podobnie działających programów pozwala lepiej je porównywać i oceniać. Stosowane przez Google mechanizmy mogą dzięki temu lepiej wytyczać granice oczekiwań użytkowników odnośnie aplikacji i określać, kiedy granice te zostały przekroczone. Proces pozwala wyłapać programy zbierające dane, które nie są im potrzebne do działania. Na przykład większość aplikacji oferujących kolorowanki nie potrzebuje danych dotyczących lokalizacji urządzenia, a wiadomo to z analizy takich aplikacji. Jeśli więc do Google Play trafi wirtualna kolorowanka wymagająca dostępu do GPS-a, algorytmy Google'a mogą ją uznać za program zbierający zbyt dużo danych o użytkowniku.
Jak wyjaśniają na blogu pracownicy Google, jedną z metod stworzenia grup funkcjonalnych towarzyszy jest określenie zestawu kategorii i przypisywanie aplikacji do odpowiednich kategorii. Nie jest to jednak metoda idealna, gdyż z góry określone grupy są zbyt sztywne i nie uwzględniają wszelkich niuansów, jakie są spotykane w milionach aplikacji. Ręczne utrzymywanie takich grup jest bardzo uciążliwe i narażone na wystąpienie licznych błędów.
Google, by poradzić sobie z tym problemem, opracowało wspomniany algorytm, którego zadaniem jest grupowanie aplikacji o podobnych możliwościach. Głębokie maszynowe uczenie się pozwala mu na zidentyfikowanie funkcji na podstawie zarówno metadanych samej aplikacji (takich jak np. jej opis), jak i na podstawie danych przekazanych przez użytkowników, np. liczby instalacji. Automatycznie stworzone grupy są następnie wykorzystywane do wyławiania potencjalnie groźnych programów, które – jak wynika z analizy całych grup – działają odmiennie niż aplikacje im podobne. Oczywiście podejrzane aplikacje nie są z góry skreślane. Zajmują się nimi następnie ludzcy eksperci, którzy sprawdzają ich działanie i wyjaśniają wątpliwości z ich twórcami.
Czy taka metoda porządkowania Google Play się sprawdza? Nie od dziś oficjalny sklep Google kojarzony jest z mnóstwem aplikacji, które nie tylko są niskiej jakości, ale wręcz stanowią szkodliwe oprogramowanie. A jak skuteczność algorytmów Google oceniają Czytelnicy dobrychprogramów?