Śpiewać każdy może - nawet komputer! (Vocaloid, cz. 1)
24.08.2012 | aktual.: 14.09.2012 01:01
Zainspirowany ledwie muśnięciem tematu przez użytkownika techmagia postanowiłem popełnić niniejszy (i następny) wpis, dokładnie poruszający kwestię syntezatora śpiewu Vocaloid. Mam nadzieję, że uda mi się rozwinąć ten temat wystarczająco, aby zadowolić zarówno siebie, jak i wszystkich zainteresowanych tą technologią :)
Lekcja śpiewu dla komputera
Wydanie pierwsze
Historia Vocaloidów (ang. "Vocal Android" - "Śpiewający Android"; w dalszej części artykułu wyjaśni się liczba mnoga :) ) sięga 2000 roku, kiedy to pracujący na Pompeu Fabra Universitat w Hiszpanii Kenmochi Hideki utworzył jeden z głównych modułów systemu odpowiadający za przetwarzanie syngałów (signal processing). Pierwotnie, projekt ten miał charakter otwarty, jednak jego możliwości zwróciły uwagę firmy Yamaha, producenta znanego u nas głównie z rynku motocykli, czy "śmiesznych japońskich robotów", a zarazem podbijającego świat czołowej klasy sprzetem muzycznym. Yamaha bez wahania wykupiła całość projektu, czyniąc Hideki'ego (teraz dobrze użyłem apostrofu? :P) ojcem Vocaloidów. 4 lata później, po pokazie możliwości w 2003 roku, wydana została pierwsza generacja silnika Vocaloid.
[youtube=http://www.youtube.com/watch?v=G83PqKDakGI] Meiko - Noise; Vocaloid 1
Oczywiście silnik byłby bezużyteczny bez bazy danych o "wokaliście". Tu z pomocą przyszła firma Zero-G, która wraz z Vocaloid 1.0 udostępniła dwa głosy anglojęzyczne - męskiego Leona, oraz żeńską Lolę. Po kilku wygranych nagrodach muzycznych, pojawił się nowy głos żeński: Miriam. To, czym się ona wyróżniała, to fakt, że jako pierwsza posiadała "dawcę" głosu. Była to Miriam Stockley, wokalistka z Wielkiej Brytanii. Do tego momentu, popularność Vocaloid'a powoli wzrastała w stałym tempie.
[youtube=http://www.youtube.com/watch?v=JYJQ_K2gQVA] Megurine Luka - Dancer in the Dark (wersja angielska); Vocaloid 2
Yamaha, zachęcona sukcesami swojego silnika, postanowiła wprowadzić Vocaloid na swój rodzimy rynek - do Japonii. Zlecenie otrzymała firma Crypton Future Media, która wywiązała się ze swojego zadania bardzo dobrze, tworząc w odstępie dwóch lat dwa nowe głosy japońskie. Pierwsza była Meiko (jej możliwości prezentuje filmik zamieszczony wyżej), wzorowana na Meiko Haigou (tu uwaga do redakcji - nie obsługujecie zagranicznych znaków diaryktycznych, nie można użyć znaków z "macronem", gdyż są podmieniane na zwykłą literę. Do czytelników: takie literki oznaczam w zgodzie z notacją dodatkową, niemą literą "u", wydłużającą samogłoskę), profesjonalnej wokalistce japońskiej, drugi był Kaito, wzorowany na Naoto Fuuga, również profesjonalnym wokaliście z Japonii. Jako ciekawostkę podam tylko, że Naoto Fuuga to nie nazwisko i imię (Japończycy przedstawiają się "od tyłu"), lecz pseudonim. Wokalista ten nie udostępnia ani swojej prawdziwej daty urodzenia, ani prawdziwego nazwiska. Samo Naoto Fuga, tudzież "fuuga na oto" w bezpośrednim przełożeniu oznacza "szykowny dźwięk" (ang. "tasteful sound").
Wydanie drugie
Do 2007 roku Yamaha nauczyła się nieco na swoich błędach, które popełniła w pierwszej wersji. Jednym z nich był fakt, że pomimo angielskiego interfejsu oprogramowania, zastosowana fonetyka - zarówno dla vocaloidów angielskich, jak i japońskich - była w 100% japońska. Poza tym, firma widziała znacznie większy odzew ze strony swoich rodzimych odbiorców, niźli od użytkowników zagranicznych. To zaważyło na rozwoju silnika Vocaloid 2, najpopularniejszego syntezatora śpiewu na świecie, aż po dzień dzisiejszy.
[youtube=http://www.youtube.com/watch?v=EuJ6UR_pD5s] Jedna z najpopularniejszych piosenek Hatsune Miku; Vocaloid 2
Wraz z nim wszedł ogrom nowości, jak dodanie sampla udającego oddychanie wokalisty, czy system zarządzania emocjami w trakcie śpiewu. Trzeba przyznać - był to kawał dobrej roboty.
Vocaloid 2 doczekał się aż 17 oficjalnych Vocaloidów, z czego 5 przeznaczonych było do wersji angielskiej oprogramowania, zaś pozostałych 12 jedynie do wersji japońskiej. Każdy z nich posiada od jednej do kilku niezależnych od siebie bibliotek dźwięku, zwanych też presetami. Warto dodać, że Megurine Luka, jedna z najpopularniejszych Vocaloidek, pomimo przeznaczenia na rynek japoński i posiadania w metryce narodowości japońskiej, jako jedyna posiada dodatkowe biblioteki anglojęzyczne, co czyni z niej najbardziej uniwersalnego Vocaloida. Z drugiej strony, nawet bez takowych, fanom udało się "zmusić" do śpiewania po angielski także inne Vocaloidy ;)
Głównym dostawcą Vocaloidów dla tej edycji silnika znowu była firma Crypton Future Media. To ona odpowiada za pierwszy japoński głos tego syntezatora, Hatsune Miku, która pobiła wszelkie rekordy popularności. Dość powiedzieć, że mój kolega zdążył się zakochać w jej głosie, po czym nagle się ocknął, że ona nie istnieje :) Jego historia nie jest zresztą odosobniona.
[youtube=http://www.youtube.com/watch?v=6hlADpxjj0s] Piosenka Hatsune Miku wykorzystująca niemal pełną skalę jej głosu - właśnie ona zmyliła mojego koledę; Vocaloid 2
Teoretycznie mógłbym Wam opisać każdego z Vocaloidów dla wersji drugiej, jednak skupię się tylko na trzech (lub - gwoli ścisłości - czterech). Zwą się: Hatsune Miku, Kagamine Rin i Len oraz Megurine Luka. Dlaczego na nich? Były to pierwsze Vocaloidy "powołane do życia" w serii "Character Vocal Series", posiadające własny avatar (wzorowany na postaciach mangowych), metryczkę i historię. Jednak to dopiero w następnym "odcinku". Teraz przeskoczę szybko przez temat najnowszego wydania silnika Vocaloid, i na dziś kończymy ;)
Wydanie trzecie
Na rynku pojawiło się w październiku zeszłego (2011) roku. Ze względu na gigantyczną popularność swojego poprzednika, wiele firm wszczęło prace nad pluginami, zapewniającymi zgodność wsteczną z dotychczasowymi Vocaloidami i ich bibliotekami dźwięków. Jedną z największych nowości jest moduł "Vocalistener", czyli po naszemu mniej więcej "Wokalosłuch". Jego zadaniem jest iteracyjne dostosowywanie zaprogramowanej ścieżki do głosu nagrywanego standardowo przez użytkownika, co ma zapewnić jeszcze bardziej realne brzmienie generowanego głosu. Jeśli natomiast użytkownik nie czuje się mocno w śpiewie, lub chce zapewnić swojemu utworowi bardziej nieprawdopodobne brzmienie, może przełączyć aplikację do trybu "klasycznego", który zapewnia bardziej "komputerowy" efekt. Vocaloid 3 odróżnia jeszcze jedna kwestia od poprzedników. Wspiera kolejne dwa języki, poza angielskim i japońskim - chiński i koreański.
[youtube=http://www.youtube.com/watch?v=b7-LOXU0ueU] Oficjalne demo Lily - Vocaloida trzeciej generacji. W mojej opinii, Miku umie lepiej :P
Nowy jest także system dystrybucji. Do tej pory, silnik i głosy były ze sobą bardzo silnie związane - każdy Vocaloid składał się z silnika i biblioteki dźwięku. Trzecia generacja wprowadza niezależną sprzedaż pełnego silnika, od Vocaloidów (bibliotek) z jedynie jego silnie okrojoną wersją. Działanie takie Yamaha motywuje wygodą użytkowników, oraz ułatwieniem licencjonowania dla wielu celów. Dla przykładu, silnik Vocaloid 3, ma odnaleźć zastosowanie w branży gier komputerowych.
Jako bonus - mały szok (przynajmniej dla niektórych)
Wydawałoby się, że mało kto poza fanami nie miał styczności z Vocaloidami, w tym Hatsune Miku. Nic bardziej mylnego - miał z nią kontakt niemal każdy z nas, a to za sprawą pewnego internetowego mema. O czym mowa? Poniżej (przetłumaczony przeze mnie) fragment historii Nyan Cat'a, zaczerpnięty z anglojęzycznej Wikipedii:
Oryginalna wersja piosenki "Nyanyanyanyanyanyanya!" została udostępniona przez użytkownika "daniwell" na japońskiej stronie do streamingu wideo Nico Nico Douga 25. lipca 2010 roku. W piosence występuje Vocaloid Hatsune Miku. Japońskie słowo wykorzystywane jako onomatopeja dla kotów to nya, co jest ekwiwalentem angielskiego "meow". Użytkownik "Momo Momo" udostępnił zremiksowaną wersję piosenki "Nyanyanyanyanyanyanya!", dodawszy wcześniej powtarzający się dźwięk "nyan" w całym utworze, także na Nico Nico Douga, 31. stycznia 2011 roku. Dodany głos pochodził z syntezatora śpiewu UTAU [jap. śpiewać - przyp. NRN] z presetem głosu "Momone Momo". Głos ten bazuje na głosie Fujimoto Momoko, mieszkańce Tokyo. (...) Użytkowniczka YouTube "saraj00n" (której prawdziwe imię to Sara) połączyła animację kota z wersją Momo Momo piosenki "Nyanyanyanyanyanyanya!", po czym udostępniła to za pośrednictwem Youtube 5. kwietnia 2011 roku, trzy dni po pojawieniu się w sieci wykorzystanej animacji Torresa, nadając całości nazwę "Nyan Cat".
[youtube=http://www.youtube.com/watch?v=QH2-TGUlwu4] Nie zgadniecie... NYAN CAT! (oryginalna piosenka dostępna jest po bezpłatnej rejestracji na Nico Nico Douga )
Pomyślelibyście, że Nyan Cat ma tak silne powiązania z Japonią, a wykorzystany utwór nigdy by nie powstał, gdyby nie pierwowzór "wyśpiewany" przez Miku? :) I nagle do nas dociera, jaki ten świat mały :D
A na deser...
...filmik z walki na miecze świetlne między Hatsune Miku, a personifikacją... nudy (związane jest to z historią Miku - więcej może opiszę w części drugiej) - Neru Akita, oraz [SPOILER] zaskakującym zakończeniem z innym fanowskim alter-ego Miku (wykorzystywanym jako avatar dla utworów, gdzie głos Miku brzmi fatalnie) - Haku Yowane. [/SPOILER] Animację wykonano m.in. z użyciem oprogramowania Miku Miku Dance, bazując na walce Ryan vs. Dorkman z serii krótkometrażowych filmów fanów Star Wars. [youtube=http://www.youtube.com/watch?v=x4K33UD_Zxo]
W następnym odcinku...
- Przyjrzymy się postaciom z serii "Character Vocal Series"
- Dowiemy się nieco o koncertach Vocaloid'ów w Japonii
- Poznamy dobre źródła wiedzy na ten temat
Artykuły z serii Vocaloid:
- Śpiewać każdy może - nawet komputer! (Vocaloid, cz. 1)
- Tysiące ludzi i jeden głos - fenomen Hatsune Miku (Vocaloid, cz. 2)
- Lustrzane Rodzeństwo i Światowa Dziewczyna (Vocaloid, cz. 3)
- Projekcja semi-transparentna, AR i... Gorillaz z Madonną (?!) - czyli ...