Windows Speech Recognition- przydatne?
Postanowiłem zmienić tematykę wpisów z PS3 na Windows. Zastanawiałem się co by tu opisać czego nie było w ogóle lub było ale bardzo dawno. Po namyśle wybrałem jedną z ciekawszych funkcji Windows od czasów Visty- Windows Speech Recognition, w polskiej wersji systemów MS "znane" jako rozpoznawanie mowy w systemie Windows.
Ważna informacja: funkcja ta działa tylko gdy nasz system (język interfejsu, nie mylić z językiem wprowadzania) jest w jednym z poniższych języków: angielski, francuski, hiszpański, niemiecki, japoński lub chiński uproszczony i tradycyjny. Jak już się zapewne domyśliliście, funkcja ta w polskich wersjach Windows nie jest dostępna- po wybraniu funkcji rozpoznawanie mowy systemu Windows użytkowników polskich Windows wita następujący komunikat:
Od mniej więcej 2008 roku korzystam z angielskich wersji Windows (najpierw Visty, teraz 7) dzięki czemu mam dostęp do tej funkcji już od dawna. W W7 działa ona odrobinę lepiej do tej znanej z Visty (choć na pierwszy rzut oka zmian brak- identyczny aplet, tutorial, panel ustawień itd) choć do ideału jeszcze wiele brakuje. Przede wszystkim, z naszego punktu widzenia brak wsparcia dla języka polskiego ale akurat to w ogóle nie dziwi- nasz rynek jest po prostu za mały dla MS by inwestować w rozwój tak "mało ważnej" (z ich punktu widzenia) funkcji, bez której i tak się Windows sprzeda. O ile brak wsparcia dla wprowadzania w języku Polskim rozumiem tak całkowite zablokowanie tej appki w polskiej wersji Windows już nie- część jej funkcji mogłaby spokojnie być dostępna w oparciu o angielskie komendy (np "zaznacz wszystko", wybieranie/otwieranie folderów- czyli to co nie działa w oparciu o nazwy elementów widoczne na ekranie- np takie okno komputer wyświetlać możemy mówiąc: "view numbers"/ na ikonach pokazują nam się numery, mówimy numer ikony komputer i enter- otwiera się okno komputer). WSR nadal nie jest doskonale jeśli chodzi o rozumienie tego co do niej mówimy- nadal zdarza się, że funkcja rozumie co innego niż my chcemy choć to akurat w dużej mierze wina mojej niezbyt dobrej wymowy języka angielskiego (a to dlatego, że po za IT preferuję język naszych zachodnich sąsiadów). Jako, że jednym z elementów tej funkcji jest wprowadzanie tekstów to najbardziej brakuje wielojęzyczności rozpoznawania mowy: mając Windows w wersji angielskiej możemy wprowadzać tekst tylko w języku angielskim, mając Windows w wersji niemieckiej tylko po niemiecku itd. Problemu tego nie mają użytkownicy Windows 8 (we wszystkich wersjach) oraz najdroższych vist i 7- mogą sobie w każdej chwili przestawić język na inny wgrywając paczkę językową (inna sprawa, że to mało wygodne gdyż wymaga wylogowania i ponownego zalogowania się). Prawda jest jednak taka, że 90% komputerów było sprzedawanych z Windows Vistą/7 w wydaniach Home Premium i czasem Bussiness/Prof a w tych wersjach zgodnie z licencją nie możemy zmienić języka. Osobiście nie mogę się już doczekać zakupu tabletu z Windows 8 i możliwości sprawdzenia tego co oferuje WSR w języku niemieckim.
Konfiguracja rozpoznawania mowy
Po uruchomieniu funkcji (najszybciej: w menu Start wpisz windows speech recognition i enter) wita nas kreator konfiguracji pozwalający wybrać z jakiego mikrofonu korzystamy a następnie tutorial, w którym możemy się dowiedzieć jak się korzysta z tej funkcji oraz sami podejmujemy pierwsze próby sterowania głosem. Jeśli ktoś potrzebuje więcej informacji to polecam wejście do Help& Support w Windows i wpisanie "speech recognition". Inforamacje odnośnie tej funkcji są też bardzo dobrze opisane na stronach Supportu MS, co ciekawe także w języku polskim. Jeśli ktoś potrzebuje tych informacji np. w języku niemieckim to wystarczy w adresie strony zmienić fragment odpowiedzialny za język strony ( en‑us na de‑de i podobnie dla innych języków).
Co możemy zrobić korzystając z Windows Speech Recognition?
Korzystając z rozpoznawania mowy można między innymi: - kliknąć gdziekolwiek na ekranie (poprzez wyświetlenie siatki myszy)- szczególnie przydatne w aplikacjach firm trzecich, które nie są całkowicie wspierane przez mechanizm WSR - dyktować tekst - otwierać, przełączać się między oknami/ programami - przechodzić do pól formularzy - wyświetlić pulpit - wyświetlić listę "co mogę powiedzieć" - korzystając z rozpoznawania mowy ustawionego na US‑English możemy też bezpośrednio szukać w pomocy technicznej: mówimy "how can i install a printer", otwiera się okno pomocy i szuka nam rozwiązania :) - korzystać z menu pod prawym klawiszem myszy - grać w pasjansa pająka -przewijać strony www, pliki
i wiele innych możliwości. Praktycznie jesteśmy ograniczeni tylko tym czy komputer nas zrozumie. Jak działa ta funkcja możecie zobaczyć na video-prezentacji autorstwa Docenta wykonanej jeszcze na przedpremierowej Windows Vista.
Czy przydatne?
Wszystko zależy od naszych zdolności językowych- jak wspomniałem ta funkcja jest dość wrażliwa na wymowę i zdarza jej się "rozumieć" co innego niż mówimy (przynajmniej ja tam mam) ale nie jest to uciążliwe. Sterowanie komputerem z użyciem głosu na start wydaje się być strasznie nienaturalne a tego typu spostrzeżenia są wzmocnione koniecznością używania obcego języka ale jak już przywykniemy to będzie to dla nas jeśli nie główna metoda "komunikacji" z pc to na pewno świetne uzupełnienie zwyczajnych sposobów. W każdym razie polecam wypróbować bo jest to coś fajnego :).