Facebook walczy z „fake news”? Po F8 wiemy, że jest wręcz przeciwnie
Na początku lat 90. Yann LeCun zrewolucjonizował systemy komputerowego rozpoznawania obrazu. Stworzył konwolucyjną sieć neuronową (CNN – Convolutional Neural Network), rodzaj sztucznej inteligencji, który był w stanie rozpoznać obiekty na obrazie, patrząc na nie. Oczywiście technologia nie była od razu doskonała. Jej pierwsza wersja potrafiła na przykład prawidłowo rozpoznać ciąg cyfr zapisanych ręcznie na kartce papieru. Osiągnięcie LeCuna zapoczątkowało prace nad zaprzęgnięciem podobnych systemów do rozpoznawania obrazów. Prace szły jak po grudzie i dopiero w ostatnich latach dokonano kolejnych znaczących przełomów.
20.04.2017 | aktual.: 20.04.2017 14:47
Teraz LeCun pracuje w Facebooku, gdzie jest dyrektorem laboratorium sztucznej inteligencji. Facebook korzysta z jego umiejętności i doświadczenia i chętnie się nimi chwali. Ostatnio chwalił się nimi podczas konferencji F8, na której o zastosowaniu SI w rozpoznawaniu obrazów mówił dyrektor ds. technicznych Mike Schroepfer.
Menedżer Facebooka przypomniał, że musiały minąć dwie dekady, zanim udało się zastosować CNN w rozpoznawaniu obiektów na zdjęciach. Dopiero w roku 2012 udało się uzyskać 55% trafność w rozpoznawaniu obiektów na obrazie. Od tego czasu jesteśmy świadkami gwałtownego rozwoju. W ciągu zaledwie czterech lat, trafność rozpoznawania obrazów przez CNN zwiększyła się z 55% do 80%.
Aby zademonstrować, jak wielka to różnica, Schroepfer zaprezentował zdjęcie, które zostało poddane obróbce przez najdoskonalsze technologie rozpoznawania obrazów z roku 2012, 2015 i obecnie. W 2012 roku CNN rozpoznawał, że na zdjęciu jest osoba. Trzy lata później system jest już w stanie rozpoznać nie tylko osobę, psa, lodówkę i miskę, ale również wskazać, gdzie się one znajdują. A skoro tak, to potrafi też nałożyć na te obiekty maski. Jednak system nie jest doskonały i popełnia spore błędy, szczególnie tam, gdzie różne obiekty nachodzą na siebie. W ubiegłym miesiącu inżynierowie Facebooka dokonali znaczącego kroku naprzód. Udoskonalony przez nich CNN sprawuje się znacznie lepiej niż jakikolwiek inny istniejący obecnie system rozpoznawania obrazu. Lepiej radzi sobie z obiektami, które częściowo się przesłaniają, lepiej też dopasowuje maski do kształtu rozpoznanych obiektów. To jednak nie wszystko. CNN Facebooka potrafi nie tylko wskazać położenie obiektu, ale również jego orientację. Innymi słowy, rozpoznaje mniejsze elementy przynależące do rozpoznanego obiektu.
Dla Facebooka jest to punkt wyjścia do pracy nad znacznie bardziej ambitnymi projektami, jak np. nad systemem, który będzie w stanie rozpoznać obiekt na filmie i nałożyć nań dokładną maskę. Nawet wówczas, gdy obiekt będzie poruszał się z dużą prędkością. W przypadku szybko jadącego samochodu może być to niezwykle trudne, ale samochód to monolityczny obiekt. Co powiecie na rozpoznanie biegnącego czy jadącego na deskorolce człowieka, który porusza nogami i rękami, przechyla głowę, którego ubranie się porusza? Dodajmy do tego biegnącego za człowiekiem psa.
Po co komu tego typu rozpoznawanie obrazu? Oczywiście do jego modyfikacji. Wyobraźmy sobie świetne wideo z wakacji, na którym nagle pojawia się niechciany bohater trzeciego planu i psuje nam romantyczne wspomnienia. Facebook ma ambicję stworzenia systemu, który takiego bohatera usunie z naszego filmu. By to jednak osiągnąć, nie wystarczy stworzenie algorytmów rozpoznawania obrazów. Te, które obecnie działają wymagają potężnej mocy obliczeniowej. Inżynierowie pracujący dla Zuckerberga chcą zaś, by odpowiednie oprogramowanie mogło trafić do naszych smartfonów. I w tej dziedzinie czynią imponujące postępy. Jeszcze w sierpniu 2015 specjaliści Facebooka dysponowali algorytmem, który ledwie pracował na bardzo wydajnym pececie, wlokąc się niemiłosiernie w tempie 0,004 fps. Obecnie po udoskonaleniu działa on na smartfonie z prędkością około 30 fps przy rozdzielczości bliskiej 720p.
Osiągnięcia zaiste imponujące i wkrótce zapewne dostaniemy do ręki kolejną zabawkę. Facebook nie zatrzyma się przy smartfonach, 30 klatkach na sekundę i rozdzielczości 720p. Przy tym tempie rozwoju możemy w najbliższych latach spodziewać się systemu sztucznej inteligencji, który błyskawicznie pozwoli zmodyfikować obraz wykonany profesjonalną kamerą. Z filmu będzie można coś usunąć lub coś dodać. Hollywood z pewnością się ucieszy. Ale nie tylko Hollywood.
Fake news? Facebook za, a nawet przeciw
Na ironię losu zakrawa fakt, że nad technologią pozwalającą na tak daleko idące modyfikacje obrazu pracuje firma, która nie tak dawno złożyła solenną obietnicę walki z fałszywymi informacjami. Fałszują one bowiem rzeczywistość, przez co ludzie, opierając się na fałszywych przesłankach, dokonują niewłaściwych wyborów. A do czegóż innego posłuży technologia, pozwalająca za pomocą zwykłego smartfonu usunąć kogoś lub coś z filmu lub coś do niego dodać.
Pamiętacie Jeżowa? Pan Krwawy Karzeł był w kluczowych latach 1936-1938 szefem NKWD. W tak krótkim czasie zdołał zostać symbolem stalinowskiego terroru. Zasługi niewiele mu jednak pomogły i w końcu popadł w niełaskę Stalina. W ramach usuwania pamięci o Jeżowie, wyretuszowano go nawet ze wspólnego zdjęcia ze Stalinem. Mieszkańcy ZSRR mieli nie wiedzieć, że swego czasu panowie pokazywali się razem publicznie. Dziś zdjęcie ilustrujące niniejszy artykuł jest symbolem kłamstwa rozgłaszanego na ogromną skalę, ikoną tego, co najgorsze w totalitaryzmach i realizacją orwellowskiego wyparowania.
Takie tam fałszowanie rzeczywistości sprzed 80 lat. Wówczas wykonanie dobrej jakości retuszu wymagało jednak sporej wiedzy i umiejętności. Teraz, dzięki rozwojowi technologii, znacznie lepszego retuszu będzie mógł dokonać każdy. W jaki sposób Facebook będzie chronił nas przed swoimi własnymi narzędziami? Który z umieszczonych w serwisie filmów uzna za prawdziwy, a który usunie, jako informację nieprawdziwą? Jakimi kryteriami będzie się kierował? Czy film pokazany przez wielką stację telewizyjną przychylną rządzącym, będzie bardziej wiarygodny od filmu wrzuconego przez amatora, który ukazuje tychże rządzących w mniej korzystnym świetle? A co jeśli dwie konkurencyjne stacje pokażą dwa różne filmy z tego samego wydarzenia?
Przypomina się łacińskie przysłowie: Kto będzie trzymał straż nad strażnikami?. W systemach demokratycznych, przynajmniej teoretycznie, straż tę trzymali wyborcy i niezależne media. Oby środek ciężkości nie przesunął się nam w kierunku korporacji dysponujących najpopularniejszymi wyszukiwarkami, serwisami wideo i serwisami społecznościowymi.