O tym jak stałem się „gestosceptykiem”
10.10.2014 11:21
Pewnego dnia, pewna bardzo ładna nauczycielka klasy I podstawówki, prowadząc akurat lekcje języka angielskiego zapisała na tablicy słowo: table. Stół, jak mniemacie słusznie. Dzieci podniosły się ochoczo z ławek, ich łapki wystrzeliły w górę – one wiedziały dokładnie jak przetłumaczyć to słowo na język polski. Wszystkie chórkiem krzyknęły: Tablet! No i zaczęła się wśród sześciolatków dyskusja kto ma jaki tablet w domu i który jest lepszy.
Podłamana lekko nauczycielka wróciła do domu i zapytała swego przystojnego męża:
- Max, jak jest tablet po angielsku?
Przystojny mąż, informatyk z zawodu, programista z wykształcenia, zapadł w chwilową zadumę i już miał odpowiedzieć z angielskim łamanym akcentem: Tejblet! Lecz zamilkł.
- Pad? No wiesz, iPad, MemoPad, EeePad.
No i wtopił.
Bo Tablet po angielski to Tablet.
Ale nie o tym jest historia….
[…]
Na moment przenieśmy się w inne czasy. Każdy programista powinien znać Alana Kaya – ojca i protoplastę obiektowego języka programowania. Mało osób jednak kojarzy go z jego innym przełomowym pomysłem. Pierwszym laptopem i w gruncie rzeczy tabletem… oj Kay był wizjonerem.
Jest rok 1970, Xerox jest kluczowym, by nie powiedzieć największym innowatorem komputerowym ówczesnych czasów. To tam właśnie Alan odnajduje bratnie dusze a jego fantazja zostaje puszczona w las niesamowitych pomysłów. Pomijając już Smalltalka – dostajemy bowiem Dynabooka.
Komputer – majestatyczne słowo klucz. Wspomniane wczesne lata siedemdziesiąte pozwalały już na tworzenie ogromnych dysków twardych o rozmiarach 100 MB i z oszałamiającymi transferami rzędu 800 kB na sekundę. Choć ledwo co skaziliśmy srebrny glob naszą stopą a człowieka w kosmos wysłaliśmy na kalkulatorze to świat gnał szaleńczo do przodu. Z roku na rok wszystko się podwajało z wyjątkiem rozmiarów – te były obcinano o połowę. Ba, niektóre uczelnie mogły w jednym budynku pomieścić nawet DWA! Komputery. Słowem kluczem było: uczelnie. Osobistość maszyn liczących miała dopiero nas dotknąć. Nie bez udziału Kaya. Wymarzył on sobie bowiem coś strasznie abstrakcyjnego – już w 68‑ym, rok przed pamiętnymi słowami o małym kroku dla człowieka a wielkim skoku dla ludzkości wypowiedzianymi przez Neila należało by ten cytat zastosować w ramach pomysłu Alana.
Dynabooka – nazwa trochę pokraczna, fakt – to w rzeczywistości jedynie idea. Idea jednak tak niezwykła na tamte czasy, że trudno było by znaleźć jej odpowiednik w dzisiejszych czasach. Alan wymyślił sobie bowiem komputer dla każdego człowieka – a trochę dokładniej, dla każdego dziecka. „A Personal Computer for Childeren of All Ages” był w tamtych czasach oczywiście mrzonką, jednak razem z Lampsonem i Thackerem zasiedli i coś stworzyli. Stworzyli Xerox Alto. Oczywiście rodzicami (dwoma, istnie męskimi) stali się wspomniani Lampson i Thacker jednak gdyby nie idea osobistego komputera przyciągnięta przez Kaya do Xeroxa sprawa mogła by się potoczyć trochę inaczej. Zwłaszcza dla nas… bo przypomnę wam, to był pierwszy komputer z GUI – interfejsem graficznym i znaną nam dzisiaj obsługą myszki. Pierwszego nowoczesnego elementu interfejsu człowiek-komputer… i to o nim właściwie chciałem trochę napisać.
Interfejs Człowiek-Komputer
Wracając jednak jeszcze na chwile do Kaya, smalltalka (dzięki któremu Alto działało), Appla który wzorował się na pomysłach Xeroxa i wreszcie do Stara, następcy Alto i pierwszego komputera w pełni spełniającego wymogi WIMP.
Okna, Ikony, Menu i Wskaźnik – wyliczanka niczym dla dzieci w przedszkolu jest jednak podstawową notacją, którą każdy specjalista od interfejsów powinien znać. Alto mimo swojej innowacyjności i pierwszego GUI, wciąż był bardziej tekstowy niż okienny – można powiedzieć, że trochę udawał, był jednak niezbędnym krokiem na przód. Z kolei Star zniszczył kompletnie system i głowy ówczesnych wizjonerów – ikonki, edytor WYSIWYG, sieć lokalna, drukowanie i miliony innych możliwości – ten produkt Xeroxa wyprzedzał swoje czasy o lata. I to była jego największa wada – koszt rzędu 6‑7 pensji w Stanach było lekkim przegięciem nawet dla najbogatszych – zwłaszcza, że niewiele osób wtedy zdawało sobie sprawę z potęgi tej maszyny.
Zaczęła się jednak era graficznych interfejsów – panowie od Jobsa podchwycili pomysł (pomijam dywagacje na ten temat) i ruszyła lokomotywa, którą ciężko było już zatrzymać.
Tak brzmi wersja ładna – wersja trochę brzydsza i bliższa prawdzie powinna brzmieć mniej więcej tak:
Zaczęła się jednak era graficznych interfejsów – panowie od Jobsa podchwycili pomysł (pomijam dywagacje na ten temat) i ruszyła lokomotywa, która chwilę potem się zatrzymała i nie drgnęła od trzydziestu pięciu lat nawet o milimetr. Wciąż bowiem tkwimy w WIMP.
WIMP to akronim od angielskich słów Okna, Ikony, Menu, Wskaźnik – jak już wspomniałem – i choć wiele lat minęło od czasu pojawienia się Stara to Okna wciąż przesuwamy głównie na dwóch płaszczyznach, Ikonki segregujemy na pulpicie, Menu jest rozwijaną listą a myszką machamy po stole i starszym osobom próbujemy uzmysłowić relację gryzonia do tego małego białego Wskaźnika na ekranie.
Oczywiście to lekka przesada – przeszliśmy już przecież przez trójwymiarowe pulpity, odchodziły i wracały do łask widżety, myszki wymienialiśmy na kulki a teraz nawet niektórzy próbują wcisnąć nam gesty nad klawiaturą, a wskaźnik… cóż, ten pozostał bez zmian.
Wszystko to jednak są pewnego rodzaju ewolucje (wbrew hasłom marketingowym) nad którymi można lamentować, ale należy pamiętać o kilku kluczowych sprawach. Jedną z części interfejsu człowiek-komputer jest człowiek (duh!), który ma jedną zasadniczą różnice względem komputera – ewoluuje bardzo powoli. Dlatego o ile można zmieniać dosyć gwałtownie pewne interfejsy po stronie komputera, tak ciężko zmieniać nagle interfejsy po naszej stronie. Te mamy w końcu niezmienna od tysięcy lat: ręce, nogi, głos, wzrok, dotyk i… i to by było na tyle.
Legendarny już Dynabook był czymś w rodzaju tableto-laptopa – w czasach ogromnych szaf komputerowych Kay wymyślił, żeby zamknąć to wszystko w niewielkiej, płaskiej obudowie – dołożyć klawiaturę i dać dzieciom aby się uczyły (o grach komputerowych nie mógł jeszcze wtedy śnić).
Oczywiście nie było to wtedy możliwe technicznie – nikt nie upchałby tyle skomplikowanych podzespołów w niewielkim pudełku nie wspominając o ekranach, które do lat 90tych były kineskopowe. Nie mniej idea istniała i kwitła. Teraz, wiele lat późnij, nasze tablety z czterordzeniowymi procesorami i 2Gb RAMU są czymś powszechnym. Różnią się jednak od projektu Kaya w dosyć wyraźny sposób - nie mają klawiatury.
[…]
Klawiatura – najpowszechniejszy sposób wprowadzania informacji do komputerów, jaki jest nam znany. Wywodzący się jeszcze z czasów maszyn do pisania… no nie do końca. Bo raczej z czasów telegrafów i kart perforowanych (dziurkowanych). Sięgając aż do początków dziewiętnastego wieku odnajdziemy jedne z pierwszych klawiatur, które w pokraczny sposób po ówczesnych liniach telegraficznych przesyłały informacje o wciśniętej po jednej stronie literze. Co prawda bardziej popularny był alfabet Morse’a, ale pomysły Wheatstone’a i Cooke’a (bo to ich eksperymentalny telegraf miał klawisze i literki) okazał się w perspektywie czasu bardziej uniwersalny. Na początku nieśmiało, ale z czasem, każdego dnia liczba wysyłanych tak wiadomości rosła. Klawiatury powolutku ewoluowały.
Trochę obok, ewoluowały za to maszyny do pisania. Przypomnijmy, dla pewności, że choć oficjalnie datuje się pierwsza maszynę na rok 1870, to już blisko 70 lat wcześniej istniały urządzenia, które z łatwością można zakwalifikować do tej rodziny. Były one jednak mało znane, pojawiały się lokalnie w zamkniętych rejonach i nie zyskały światowego rozgłosu tak jak produkt Hansena, czyli Kula Pisarska Hansena.
Wspominam o tym, ponieważ zarówno maszyny do wybijania kart jak i zwykłe maszyny do pisania zeszły się pewnego razu w jedno – tworząc programator do ENIACa, pierwszego komputera do celów ogólnych, którego można było zaprogramować za pomocą kart do wykonywania dowolnych obliczeń. No i o pisanie tych kart się rozbiło.
Gdy już było jasne, że każdy kolejny następca ENIACa miał możliwość czytania dziurkowanych kartoników, rozpowszechnił się układ klawiatury, który w mniej lub bardziej zmienionej formie dotrwał do naszych czasów. Choć żal trochę kuli Hansena – była śliczna.
Cały ten wywód o historii klawiszy ma jednak pewien cel. Wspominany Dynabook – pochodzący aż z 1968 roku – zawierał zintegrowaną, niewielką klawiaturę. Coś, co tak naprawdę, standardem zaczęło być w 1967, czyli rok wcześniej, wraz z pojawieniem się Datapointa 3300. O ekranie dotykowym w komputerach nawet nikt nie marzył, a myszka – nim ta umości się w naszych dłoniach, jak dobrze wiecie, minie jeszcze parę lat. Dzisiaj wydaje się to absurdalne, ale wtedy trudno było wyjść poza pewne ramy, poza mocno utarte konwenanse, nawet będąc niezwykłym futurystą. Kay i tak wygiął swój umysł maksymalnie wymyślając Dynabooka, ale nie potrafił przeskoczyć czegoś, o czym nie mógł mieć pojęcia.
Dlatego właśnie bawią mnie gdybania dziś żyjących futurystów.
Dywagacja: Spoglądając tak na to, co Kay mógł wymyśleć, i jak wygląda to dzisiaj, bawi mnie prorokowanie żyjących specjalistów o tym jak to, nie dotykowe, a gestykularne interfejsy są przyszłością. Bo podobnie jak i on, wzięli nowinkę technologiczną i przyczepili do czegoś fajnego. Z tą drobną różnicą, że Kay był jednak wizjonerem.
A skoro mowa o gestach. Oglądaliście Raport Mniejszości?
[…]
No więc mamy Raport Mniejszości – i w tym momencie, moje oczy kręcą się na boki, wzdycham cicho i liczę na to, że jednak nie widzieliście tego filmu i nie będziecie wmawiać mi jako to interfejs użytkownika, którym posługuje się Tom, jest genialny i tak bardzo przyszłościowy. Bo nie jest. Jest śmieszną karykaturą, która ma fajnie wyglądać w kinie, gdzie trzeba pokazać twarz aktora patrzącego na tysiące gigabitów danych. Tak.
Nienawidzę tego filmu
Wypuszczony w 2002 roku, ale prace rozpoczęły się dużo wcześniej – choć na pewno nie przed pluskwą milenijną. Już wtedy istniały ekrany dotykowe (przypominam, że pierwsze powstały w latach 70tych) a multidotyk od 20 lat był realną technologią, choć głównie widzianą w laboratoriach za drzwiami pancernymi. Choć w 93 roku powstał pierwszy telefon z ekranem reagującym na dotyk to tak naprawdę aż do czasów iPhona jest to nowinka a nie standard. Tylko dlaczego o tym mówię, skoro w RM ten legendarny interfejs nie był dotykowy, tylko gestykularny. Po pierwsze pozostałe komputery w filmie były dotykowe (ot, fun fact) a po drugie wielki boom touchscreenów pokazuje kierunek, w którym nasza interakcja z komputerem zmierza. W gesty nam znane…
Tom, jakiegokolwiek wzrostu by nie był, stał twardo w owym Raporcie Mniejszości w dokładnie jednym miejscu i gestykulując różne dziwne wygibasy operował futurystycznym interfejsem jakby to była dla niego bułka z masłem. Gesty powiększania, wybierania, przeskakiwania wtedy były zachwycające – dzisiaj gdy kciukiem potrafimy obsłużyć smartfona wydają się śmieszne. Pinch to zoom, scroll palcem, odświeżanie przez zsuwanie, czy przełączanie się między aplikacjami przesuwając na ekranie palcem w prawo nie zostały wymyślone a jedynie zaadaptowane na potrzeby interfejsów w smartach. Niewielki ekran oraz trudność w umieszczaniu przycisków, gdy chcemy pokazać wiele rzeczy sprawiają, że ludzie postanawiają wykorzystać pewne znane ruchy do czegoś nowego operując nimi w kontekście. Skoro coś przesuwa ekrany, to czemu nie może przesuwać uruchomionych aplikacji? A skoro można obrócić smartfona ekranem w dół by przestał dzwonić, to po co wyciszać go jakimś gestem.
Mamy więc procedurę adaptowania pewnych znanych nam czynności do świata interfejsów przyszłości. Uczenie się pokracznych gestów, które mogą być dwojako zrozumiane (sławna scena z witaniem się Toma w Raporcie) jest bezsensowne. To zwłaszcza dobrze widać u osób, które nigdy nie miały styczności z ekranami dotykowymi a nagle dostają do obsługi laptopa z takowym. Fakt, strach ich trochę onieśmiela, ale czynności, które robią są tak intuicyjne, że bez problemu odnajdują się w tym dziwnym świecie ogromnych ekranów. O ile nie dostaną Win 8 z dualnymi instrukcjami. O nich później…
[…]
Spójność – magiczne słowo klucz, które bardzo lubię nadużywać w kontekście androida, który to za żadne skarby nie potrafi być spójny. Jednak tutaj oberwie się dużo bardziej firmie Microsoft, która potrafiła schrzanić, zdżemować i zpowidłowacić swój system ukryty pod cyfrą 8.
A dokładnie chodzi o gesty dotykowe – coś co miało być system sellerem (czyli punktem sprzedażowym, a nie kuzynem pora) – stało się jego gwoździem do trumny. Bo jak wytłumaczyć ludziom, że ten sam ruch robi dwie różne rzeczy w zależności od sposobu wykonania?
Każdy kto dotykał Windowsa 8 wie, że przesunięcie od lewej strony ekranu wywoła poprzedni program. Wywoła jednak też menadżer programów Modern, pod warunkiem, że zatrzymacie się i cofniecie palec w odpowiednim momencie. W warunkach polowych, rzeczy niewykonalna. W warunkach domowych… eh.
Tym co charakteryzuje popularne ruchy palców na smartfonach i tabletach jest ich uniwersalność. Przesunięcie w lewo jest przesunięciem w lewo, pinch jest pinchem, a scroll dwoma palcami, jest scrollem dwoma palcami. Do tych gestów zawsze są przypisane te same czynności, ponieważ jesteśmy do nich przywiązani i wszyscy je adaptują (stąd wspomniana uniwersalność). Gdyby nagle w połowie wykonany pinch uruchamiał dodatkowe funkcje, stało by się to dosyć kłopotliwe, nie mówiąc, że doprowadziłoby do jeszcze większego upowszechnienia się słowa na K. Problemem jest oczywiście ograniczona liczba wspomnianych gestów, która została już dawno spisana i weszła do powszechnego użytku. Wszystko inne, nowsze, wymagające gimnastyki nie sprawdzi się z racji tak zwanej doktryny siedmiu elementów. Czegoś co spece od UI mają w jednym palcu do obsługi ekranów dotykowych.
Ponoć – tutaj, jeszcze jest to lekko nieprawdziwa informacja – ludzie potrafią zapamiętać maksymalnie siedem elementów z jednej grupy (+/- 2) co wiąże się z nasza pamięcią krótką (podręczną). Zasada ta ma wielu swoich wielbicieli jak i przeciwników, coś w niej jednak jest i opanowanie listy gestów ponad 7 sztuk jest dla przeciętnego użytkownika trudne. Np. Apple w swoich ramach dla deweloperów iOS wskazuje 8 gestów dotykowych (tak naprawdę 7 + potrząśnięcie telefonem).
No tak… tylko co zrobić gdy ma się tylko siedem gestów, tudzież przycisków. Wtedy potrzebujemy czegoś więcej: magicznego słówka na K.
[…]
Świat przyszłości – gdybanie, które wręcz kocham. Czasem zastanawiam się, gdzie mogłoby powędrować sterowanie komputerem za dziesięć lub dwadzieścia lat. Czy wreszcie zepniemy nasze myśli z chmurą, czy może będziemy bawić się Kinectami zamontowanymi w naszych smartwatchach? A może zostaniemy w legendarnym WIMP? Jak już pewnie zauważyliście z powyższej lektury uważam, iż ani to, ani to. Zamiast tego do meritum naszej interakcji z komputerami, tabletami, smartfonami oraz innymi smart-urządzeniami wprowadzimy kontekst. Magiczne słowo na K.
Kontekst to nasza aktualna sytuacja, z której inteligentny system, z którym się komunikujemy zdaje sobie sprawę. Nie musi być nawet specjalnie inteligentny, by móc go rozpoznać. Kontekst lokalizacji i czasu jest wykorzystywany na szeroką skale przez właściwie wszystkie nowocześniejsze aplikacje mobilne. Niektóre robią to dobrze – oferując najbliższe otwarte o tej godzinie pizzerie z naszego rejonu. Inne po prostu umieszczają na facebooku naszą lokalizacje przy postowaniu ważnych fotek z wakacji. Co jeśli pójść krok dalej?
A gdyby tak mój smartfon – mini komputer podłączony do globalnej chmury – potrafił rozpoznać nie tylko moją aktualną lokalizację i czas, ale także osoby, z którymi przebywam. Podnosząc urządzenie moglibyśmy dostać np. pytanie czy zamówić pizzę dla 4 osób z tej pizzerii, z której ostatnio zamawialiśmy jak siedzieliśmy razem? Wystarczyłaby krótka odpowiedź w stylu: Tak, dwie hawajskie, jedna meksykańska.
Oczywiście kontekst nie jest samym interfejsem – jest jednak funkcją warunkującą pojawienie się pewnych elementów interfejsu, umożliwiając zmniejszenie szumu wynikłego z tego, że widzimy za dużo przycisków, lub możemy dokonać zbyt wielu gestów. Dlatego właśnie uważam, że to kontekst jest przyszłością w komunikacji i w interfejsie człowiek-komputer.
Skoro zacząłem od biednego Kaya to i na nim skończę. Przytaczałem go cały czas i jego abstrakcyjnego Dynabooka, aby uzmysłowić wam, jak przezabawni z dzisiejszej perspektywy są prawdziwi wizjonerzy. I tym się podbieram…
… bo moje pomysły są równie abstrakcyjne.