Po SI przyszedł czas na rozpoznawanie obrazu. Google udostępnia Cloud Vision API
Chociaż nazwa Cloud Vision nie jest być może powszechnie rozpoznawalna, to efekty rozwijania algorytmów będących przykładem jednej z najbardziej spektakularnych implementacji głębokiego uczenia można napotkać na co dzień, choćby podczas korzystanie z wyszukiwarki Google Grafika. API oprogramowania pozwalającego na złożone rozpoznawanie i analizę obrazów zostało właśnie udostępniona programistom.
Cloud Vision widzi sporo
Komunikat o udostępnieniu ograniczonego API zostało opublikowane na łamach bloga Google Cloud wraz z licznymi przykładami potencjalnych zastosowań. Ich publikacja nie wydaje się jednak konieczn. Nietrudno wyobrazić sobie jakie możliwości otwiera przed programistami dostęp choćby do części potencjału drzemiącego w algorytmach, które Google miesiącami bombardował ogromną ilością danych. Wszystko to, aby możliwie jak najskuteczniej były one w stanie analizować obraz.
What is Cloud Vision API?
O skuteczności Cloud Vision można się przekonać choćby na przykładzie algorytmów rozpoznawania twarzy wykorzystywanych w usługach Google, czy korzystając z wyszukiwania obrazów za pomocą innego pliku graficznego. To jednak dość prymitywne przykłady, znacznie bardziej spektakularne osiągnięcia udało się uzyskać w warunkach laboratoryjnych. Eksperymenty Google wykazały bowiem, że poddana głębokiemu uczeniu maszyna, skuteczniej niż człowiek rozpoznała niszczarkę, która dla ludzkiego oka nieszczególnie może różnić się na przykład od kserokopiarki. Dla Cloud Vision się różni, nawet jeśli pracownicy Google nie do końca wiedzą czym.
A zobaczy jeszcze więcej
Jak nietrudno się domyślić, Cloud Vision API doskonale radzi sobie z rozpoznawaniem twarzy i to właśnie ten aspekt może być dla programistów szczególnie atrakcyjny. Potwierdzają to doniesienia z Wielkiej Brytanii. BBC Future przygotowało bowiem obszerny raport na temat ewentualnych zastosowań zaawansowanego rozpoznawania twarzy w przestrzeni publicznej. A konkretniej w sklepach.
Wynika z niego, że zarówno drobni sklepikarze, jak i duże sieci handlowe testują lub są otwarte na wdrożenie systemu, który, wykorzystując kamery przemysłowe, ma zminimalizować straty związane z drobnymi kradzieżami. Wykorzystywane systemy kamer miałyby bowiem zostać wzbogacone właśnie o algorytmy rozpoznawania twarzy oraz dostęp do (policyjnej?) bazy danych osób, które były wcześniej zamieszane w kradzieże. Może to brzmieć jak futurologia w dość katastroficzny wydaniu, co nie zmienia faktu, o którym FaceFirst czy hiszpańska Herta Security. O ile jednak nabycie zamkniętego komercyjnego oprogramowania może być dla mniejszych firm zbyt kosztowne, tak wykorzystanie częściowo otwartego Cloud Vision juz nie.
Plusy dodatnie
Oczywiście rozpoznawanie twarzy wcale nie musi zostać wykorzystywane wyłącznie w celach rozpoznawania potencjalnych sprawców kradzieży. Straty z nich wynikające mogą być przecież zostać pokryte przez wzrost przychodów. Te zaś można osiągnąć na przykład dzięki, a jakże, rozpoznawaniu twarzy klienta. Śledzenia jego wyborów może przecież znacznie skuteczniej dostosować oferowane mu produkty przy następnej wizycie. W tym kontekście przywołać wypadałoby oczywiście kolejne argumenty sugerujące, że będzie to naruszeniem prywatności. Ostatnie lata są jednak wyjątkowo dobitnym przykładem tego, że konsument rezygnuje z niej bardzo chętnie na rzecz wyższej jakości świadczonych usług.
Oczywiście Cloud Vision API może przynieść wiele wygód i to zapewne znacznie szybciej, niż rozpoznawanie twarzy stanie się obowiązującym standardem, jak sugerują statystyki z Wysp. Zwłaszcza, że maszynowe rozpoznawanie obrazów zostało udostępnione użytkownikom niedługo po otwarciu Tensor Flow, silnika sztucznej inteligencji opracowanego przez Google. Taki zestaw narzędzi w rękach społeczności daje szansę na wysyp wartościowego oprogramowania edukacyjnego czy zdolnego do rozpoznawania zagrożeń zarówno w rzeczywistości, jak i świecie wirtualnym.