Od zera do spikera - sterujemy komputerem za pomocą głosu cz. 3
Komputer to nadal bezduszne narzędzie i bez cienia wątpliwości twierdzę, że nieprędko (o ile w ogóle) taki stan rzeczy ulegnie zmianie. Możemy jednak komunikować się z nim w całkiem ludzki sposób, tak jak z drugim człowiekiem, używając abstrakcyjnych pojęć i nośnika informacji jakim jest stara, wysłużona fala akustyczna.
Jak mówić do komputera, aby ten nas rozumiał? Najlepiej wykorzystać jakieś oprogramowanie, które wyszuka w naszej mowie wcześniej ustalone (zaprogramowane) komendy głosowe i podejmie właściwe dla tych poleceń działania. Aplikacją zdolną do podejmowania takich działań, obsługującą język polski, działającą szybko i sprawnie, jest Spikit. Ten tekst ma na celu pokazać, że utworzenie własnego asystenta głosowego może być bardzo proste i przyjemne.
Lekcja 3
W poprzednich dwóch częściach kursu (część 1, część 2 ) mieliśmy okazję zapoznać się z podstawowymi prawami rządzacymi światem tzw. Reguł głosowych. Utworzyliśmy przykładową listę z poleceniami głosowymi. Dowiedzieliśmy się również, że lista taka może przybierać różną postać i uzwględniać wiele scenariuszy, w których znaleźć się może użytkownik. Dziś zapoznamy się z właściwością Reguł głosowych, której warto poświęcić osobny wpis. W następnych częściach zajmiemy się już upragnioną konfiguracją programu w całej jego okazałości i przygotujemy nasz PC do pracy z użyciem naszego głosu.
Mów do mnie jeszcze...
Spikit 1.5+ nie jest wyłącznie oprogramowaniem, do którego tylko my, jego użytkownicy, możemy mówić! Nic nie stoi na przeszkodzie, aby zmusić komputer do przemówienia do nas. Technologie rozpoznawania mowy i jej syntezy wzajemnie się uzupełniają. Dzięki takiemu połączeniu i wynikającej z tego dwukierunkowej komunikacji, wrażenia z używania osobistego asystenta głosowego są o wiele bardziej bogate. W przypadku oprogramowania z naszego rodzimego podwórka, komputer może:
- powtórzyć po nas wszystkie wypowiedziane przez nas komendy
- wypowiedzieć rozpoznane zdania, których transkrypcja przebiegała z użyciem lokalnego Słownika lub przy użyciu modułu sieciowego
- poinformować nas o swym stanie, zaistniałych zmianach w konfiguracji
- wyartykułować odpowiedzi, które przypisaliśmy do poszczególnych poleceń w Regule głosowej
Pierwsze trzy z przywołanych wyżej cech Spikit można określić mianem zwyczajnych komunikatów głosowych i zarządzać trybem ich wypowiadania w dość prosty sposób tj. można włączyć lub wyłączyć tę funkcję programu tak jak zaprezentowałem to na poniższym filmie: [yt=http://www.youtube.com/watch?v=FDZL0qVrKhs]
Ostatnia właściwość, czyli odpowiedzi głosowe, wymagają zaangażowania naszej inwencji twórczej. Tak jak każdemu poprawnemu poleceniu możemy przypisać tylko jedną akcję, tak też każdej nowej komendzie możemy przypisać dokładnie jedną odpowiedź głosową, choć równie dobrze nie musimy tego robić wcale. Aby przypisać odpowiedź głosową do polecenia głosowego, tuż po zdefiniowaniu akcji wytarczy umieścić znak dwukropka i wpisać jakiś tekst zgodnie ze schematem:
W najnowszej wersji Spikit możemy wykorzystywać specjalną akcję NULL, którą dodałem do programu za namową użytkowników, by ułatwić tworzenie poleceń służących jedynie 'konwersacji' z naszym komputerem. Dzięki temu będziemy mieli pewność, że rozpoznanie polecenia nie będzie wiązało się z wykonaniem przez program jakiejkolwiek sensownej czynności poza wypowiedzeniem stosownego komunikatu. Oczywiście mechanizm ten najlepiej sprawdza się w sytuacji, gdy nie spoglądamy akurat na ekran urządzenia. Spróbuj samodzielnie utworzyć podobny zestaw komend:
Tryb wypowiadania odpowiedzi głosowych jest w Spikit włączony domyślnie. Możesz więc sprawdzić sposób działania własnych poleceń od razu. Prostota z jaką możemy przypisywać odpowiedzi głosowe do poszczególnych komend przemawiają na korzyść programu. Choć tak naprawdę nadal mamy tu do czynienia z rozszerzonym monologiem, od naturalnej rozmowy z PC dzieli nas już bardzo niewiele. Funkcja ta nie ma na celu zastępować wyspecjalizowanych czytników ekranu, których dobrym przykładem jest systemowy Narrator w Windows Vista i wyżej, a jedynie zwiększyć interaktywność Spikit i ogólny odbiór technologii rozpoznawania mowy. Można na tę funkcję programu spojrzeć z innej perspektywy. Jaką radość sprawiałoby Tobie mówienie do ściany?! No jaką? :‑)
Na pochwałę zasługuje tu postawa jednego z użytkowników programu, który we własnym zakresie tworzy programy pomocnicze współdziałające ze Spikit i rozszerzające pierwotną ideę. Cała dyskusja dobrze odzwierciedla sentencję "potrzeba jest matką wynalazków", więc z przyjemnością przekierowuję Czytelnika do całego wątku. Być może i Ty znajdziesz tu zalążek inspiracji.
Nowa wersja właśnie dostępna
Czy wiesz, że wraz z aktualizacją do wersji Spikit 1.5.2.0, bezpłatna wersja programu działa teraz dwukrotnie szybciej (opóźnienie zredukowane do 8 sekund), zachowując ten sam nieskończenie duży potencjał? Spikit lepiej radzi sobie teraz z treścią wyświetlaną na ekranie. Usprawnienia widoczne są począwszy od systememu Windows XP, a skończywszy na najnowszej wersji Windows 8 z trybem kafelków.
Garść najświeższych informacji, w tym opis wprowadzanych poprawek, znajdziesz na stronie programu na Facebooku.