Programy dla studentów: jak wyszukiwać materiały naukowe w Sieci?
Google ma słabość do chwytliwych bonmotów, które symbolicznie definiują istotę jego usług, przy okazji je promując. Swego czasu Google kierowało się dewizą „don’t be evil”, co być może posłużyło twórcom serialu Mr. Robot za przewrotną inspirację do stworzenia EvilCorpu. Obecnie, gdy gigant szermuje częściej doodle’ami niż górnolotnymi hasłami, usługę Google Scholar organizuje niemalże bojowe zawołanie „stań na ramionach olbrzymów” (parafraza z Isaaca Newtona, która jest z kolei parafrazą z Bernarda de Chartres). Maksyma spełnia dwie funkcje. Z jednej strony sygnalizuje nieco snobistyczną erudycję twórców wyszukiwarki naukowych publikacji. Z drugiej – swoją bezkompromisowością ma inspirować do prowadzenia badań naukowych z newtonowską pokorą i dużym szacunkiem dla poprzedników-olbrzymów, czyli dla bibliografii. Jak się to ma jednak do możliwości, które oferuje Google Scholar? Kolejny artykuł z cyklu jest poświęcony wspomnianej usłudze Google’a oraz – szerzej – bazom pozwalającym wyszukiwać publikacje naukowe.
21.11.2017 16:39
Istota Google Scholar: krótka historia buntu
Google Scholar jest darmową wyszukiwarką pozwalającą na znalezienie zarówno metadanych dotyczących publikacji naukowych, jak i pełnych wersji artykułów, referatów, prac naukowych, abstraktów, raportów technicznych czy patentów. Jest to możliwe dzięki temu, że Google Scholar traktuje naukowe i branżowe czasopisma jak osobny korpus danych. W rezultacie informacje, które w standardowej wyszukiwarce Google’a mogą pojawić się dopiero na odległych pozycjach, w Google Scholar odzyskują należne im miejsce.
Istota wyszukiwarki – jej darmowość – stanowi wyraz buntu. Pomysłodawcą usługi jest bowiem Anurag Acharya, którego podczas studiów w Indiach uderzył brak dostępu do materiałów naukowych utrudniający uprawianie nauki. By nadążyć za szybko zmieniającym się światem, Acharya przenosi się pod koniec lat dziewięćdziesiątych do Stanów Zjednoczonych na studia doktoranckie. Jednakże rozczarowanie metodyką prowadzenia badań naukowych popycha Hindusa w 2000 roku do decyzji o dołączeniu do startupu o dziwnej nazwie – do Google’a. Dopiero tam niedoszły naukowiec w pełni wyrazi swój gniew wobec faktu, że informacja wówczas miała, jego zdaniem, geograficzne granice. Początkowo Acharya pracować będzie nad sposobami indeksowania danych w głównej wyszukiwarce, by następnie stworzyć razem z Alexem Verstakiem to, co dziś jest znane jako Google Scholar. Wersja beta wyszukiwarki zostanie udostępniona w listopadzie 2004 roku i przewróci do góry nogami dotychczasowy – związany w dużej mierze z wydawnictwami oraz tworzonymi przez nie płatnymi serwisami – system dystrybucji publikacji naukowych.
Z pełnej lekkości, buntowniczej energii enfant terrible wyszukiwania materiałów naukowych niewiele zostało – Google Scholar obrósł w dodatkowe funkcje tak, jak obrasta się w piórka. Niemniej jednak jakkolwiek by nowych funkcji nie łączyć ze zjawiskiem komercjalizacji nauki (oraz podejścia samego Google’a do metod wyszukiwania, pozycjonowania treści oraz do informacji), pomagają one przygotowywać grunt pod własne badania naukowe, a także śledzić późniejszy odbiór prac i – pośrednio – rozwój samej dyscypliny, w której polu się mieszczą.
Google Scholar: podstawowe funkcje
W podstawowym wymiarze Google Scholar działa jak standardowa wyszukiwarka Google’a. Oznacza to, że materiały naukowe wyszukuje się za pomocą sformułowania odpowiedniego zapytania. By zawęzić pole wyników, można posługiwać się specjalnymi operatorami usprawniającymi formułowanie zapytań, które działają także w typowej wyszukiwarce giganta z Mountain View.
Google Scholar pozwala również na korzystanie z opcji wyszukiwania zaawansowanego, jaka znajduje się w lewym bocznym panelu po rozwinięciu menu. Tam można uszczegółowić wyszukiwane hasła pod kątem ich występowania w konkretnym miejscu w tytule lub tekście, ale i wyszukać prace pochodzące od konkretnego autora albo ze specyficznego czasopisma. Ciekawą opcją wydaje się też możliwość zawężenia okresu czasu, w którym miały zostać opublikowane poszukiwane materiały – może to ustrzec przed pomyłką powołania się na nieaktualne informacje lub, wręcz przeciwnie, pozwoli skupić się na ściśle określonym przedziale czasowym, a nawet umożliwi prześledzenie zmian sposobu postrzegania pewnych zagadnień. Wyszukany dokument zostanie wstępnie sklasyfikowany przez algorytm wyszukiwarki pod względem swojego charakteru, wskazując, czy dany wynik odsyła do książki w powiązanej usłudze Google Books, do cytowania lub zewnętrznego źródła.
Zanim przejdzie się do wyszukiwania warto jednak poświęcić chwilę na konfigurację ustawień dotyczących wyników wyszukiwania. Można tam nie tylko określić pożądaną liczbę wyświetlanych wyników na stronie, ale też zdecydować, czy wybrany przez nas wynik ma otwierać się w nowym oknie. Mimo tego najistotniejszym ustawieniem wydaje się menedżer bibliografii, który pozwala na pokazywanie na stronie z wynikami wyszukiwania linków umożliwiających importowanie cytatów do takich programów, jak BibTeX, EndNote, RefMan i RefWorks. Uwaga – by ustawienia te zostały zapamiętane, należy włączyć obsługę plików cookie. Wyszukiwanie dodatkowo usprawnia dostępna z poziomu panelu bocznego w menu funkcja Alerty. Pozwala ona na sformułowanie zapytania, w ramach którego użytkownik może następnie dzięki powiadomieniom przychodzącym na adres mailowy śledzić pojawiające się w Google Scholarze prace związane z jego zainteresowaniami badawczymi.
W wyszukiwarce pod każdym z wyników, oprócz linku dotyczącego menedżera bibliografii, dostępnych jest kilka przycisków. Pierwszy z nich, gwiazdka, pozwala na dodawanie wybranych materiałów do tzw. mojej biblioteki, do której użytkownik posiadający konto uzyskuje dostęp ze strony głównej wyszukiwarki. Moja biblioteka pozwala na ograniczone zarządzanie utworzoną bibliografią. Zaimportowany tam dokument można więc oznaczyć za pomocą specjalnych etykiet lub edytować dotyczące go dane bibliograficzne, które odnoszą się rodzaju publikacji, roku wydania czy ilości stron. Stamtąd też dokument można eksportować bezpośrednio do formatu BibTeX, EndNote, RefMan i CSV.
Ze wspomnianymi wyżej formatami wiąże się funkcja Cytuj, również widoczna pod każdym konkretnym wynikiem wyszukiwania. Pozwala ona na wygenerowanie cytatu danego dokumentu w jednym z trzech stylów bibliograficznych: MLA, APA, ISO 690 dla programów BibTeX, EndNote, RefMan i RefWorks. Funkcja Cytowane przez pozwala na prześledzenie, w jakich publikacjach pojawił się wyszukany dokument, podczas gdy funkcja Powiązane artykuły umożliwia sprawdzenie, w jakim kontekście badawczym sytuuje się dany dokument i z jakimi książkami lub cytatami można go ewentualnie zestawić. Ponadto funkcja Wszystkie wersje umożliwia wgląd do wszystkich dostępnych, zindeksowanych wersji danego dokumentu, co czasami pozwala na dotarcie do pełnego tekstu konkretnej publikacji, wystawiając na próbę zasady etyczne badacza. Przy niektórych wynikach wyszukiwania widoczna staje się także funkcja Find in NUKAT, która odsyła do szczegółowego opisu wybranej pozycji w największym bibliotecznym katalogu centralnym w Polsce.
Warto dodać, że w ramach dodatkowych udogodnień dostępne jest rozszerzenie Google Scholar, dostępne na Chrome'a i Vivaldiego, Opery i Firefoksa. Widoczny wówczas obok paska adresu przycisk ułatwi dostęp do Google Scholara z dowolnej strony internetowej. Kliknięcie przycisku otwiera niewielkie okno wyszukiwarki, do którego można przenieść zapytanie z wyszukiwarki internetowej. Rozszerzenie dubluje większość funkcji pełnoprawnej wyszukiwarki, niemniej jednak ciekawe są dwa, szybkie w dostępie, filtry: rok, pozwalający wybrać zasięg czasowy dla wyników wyszukiwania oraz filtr, gdzie można wybrać język materiałów, a także poprosić o wyszukanie cytowań i patentów.
Google Scholar Citations: prestiż i statystyki
Google Scholar nie polega jednak wyłącznie na wyszukiwaniu materiałów naukowych. Wyszukiwarka rości sobie bowiem prawa do roli narzędzia statystycznego, za pomocą którego naukowiec może śledzić odbiór swoich publikacji, a więc obserwować gdzie i przez kogo są one cytowane. Służy do tego profil Google Scholar Citations, widniejący jako Mój profil na stronie głównej wyszukiwarki. By móc z niego korzystać, należy uprzednio skonfigurować profil badacza, do czego na wstępie potrzebny będzie adres pocztowy na Gmailu. Konfigurowanie profilu składa się z trzech etapów: pierwszego, gdzie wypełnia się dane osobowe, czyli podaje się między innymi afiliację, stanowisko oraz zainteresowania badawcze, drugiego, który polega na zaznaczeniu własnych publikacji, które zostały już wcześniej zindeksowane w Google Scholarze oraz trzeciego, w ramach którego już z poziomu utworzonego profilu można zaktualizować dotyczące użytkownika informacje.
Profil autora odzwierciedla specyficznie pojmowany prestiż naukowca, nazywany wpływem, który mierzy się za pomocą następujących kategorii: 1) cytowań, a więc liczby wszystkich zaindeksowanych przez Google Scholar cytowań prac danego autora, 2) indeksu Hirscha oraz 3) indeksu i10. Ten ostatni wskaźnik został stworzony przez pracowników Google Scholar i został dodany do usługi w lipcu 2011 roku, która jest obecnie wyłącznym miejscem jego funkcjonowania. Odnosi się on do liczby publikacji, z których każda została zacytowana co najmniej dziesięć razy.
Profile naukowców można wyszukiwać i dodawać do profili obserwowanych, co pozwala na śledzenie nowych artykułów danego autora, związanych z jego publikacjami cytowań oraz powiązanych prac.
Wskaźnik Hirscha (indeks Hirscha, wskaźnik h, indeks h) jest rodzajem miernika wprowadzonym do użytku w 2005 roku. Odzwierciedla on dystrybucję cytowań publikacji określonego naukowca i liczbę jego najlepszych publikacji. Wskaźnik ten stosowany jest zazwyczaj do porównywania dorobku naukowców pracujących w tej samej dziedzinie ze względu na specyfikę funkcjonowania konkretnych dziedzin badawczych. Wskaźnik Hirscha jest często krytykowany jako narzędzie dyskryminacji naukowców, którzy mieli błyskotliwe, lecz krótkie kariery lub naukowców, których jakość publikacji jest zmienna. Popularnym narzędziem do obliczania wskaźnika jest program o proroczej nazwie Publish or Perish, stworzony przez Anne-Wil Harzing, który opiera się na cytowaniach zindeksowanych w wyszukiwarce Google Scholar. W Polsce wskaźnik obliczany jest przez stanowiący część bazy danych BazEkon program Cytowania w BazEkon autorstwa informatyków Biblioteki Głównej Uniwersytetu Ekonomicznego w Krakowie.
Google Scholar Dane: klasyka statystyk
Pochodną scholarowego szaleństwa katalogowania jest funkcja Google Scholar Dane. Z założenia służy ona do szybkiego oszacowania widoczności oraz wpływu niedawno opublikowanych artykułów o charakterze naukowym. Google Scholar Dane składa się z dwóch rankingów – Najlepszych publikacji oraz Prac należących do klasyki.
W przypadku Najlepszych publikacji Google Scholar Dane sumuje – na podstawie wskaźnika Hirscha oraz wyliczonej na jego podstawie średniej – cytaty z okresu minionych pięciu lat dla poszczególnych źródeł, by w efekcie wygenerować ranking czasopism naukowych, którego analiza może pomóc użytkownikowi w podjęciu decyzji co do miejsca, gdzie warto opublikować wyniki badań. Dane zostały ostatnio zaktualizowane w czerwcu 2017 roku. W ramach tego rankingu działa opcja Zobacz najlepsze publikacje, która pozwala na sprawdzenie, które artykuły w danym czasopiśmie zdobyły najwięcej cytowań, na zobaczenie liczby cytowań danego tekstu oraz na zweryfikowanie tytułów artykułów, w których wyszukane cytaty się znajdują, a także datę publikacji samych tekstów.
Podobną funkcję spełniają Prace należące do klasyki, za pośrednictwem których można sprawdzić bardzo często cytowane prace dla konkretnej dyscypliny naukowej oraz dla specyficznego obszaru badawczego. Nazwa tego rankingu może być jednak myląca, ponieważ nie odwołuje się on do pomnikowego i trwalszego od spiżu kanonu prac, które zmieniły bieg historii. Ranking ten opiera się na statystyce, a ta jest nieubłagana. W związku z tym okazuje się, że dla filozofii klasyczną pracą jest „Religia w sferze publicznej” Jürgena Habermasa z 2006 roku. Darwin znajduje się na miejscu drugim, jednak nie jako autor, tylko jako postać, której myśli poświęcono opracowanie zacytowane 472 razy.
Dlaczego tego typu informacje wydają się tak istotne, podobnie jak dystans, z którym należy do nich podchodzić? Przyjąwszy wskaźnik cytowań za wyznacznik wysokiej jakości merytorycznej tekstów, Google Scholar w konsekwencji może prowadzić do podejmowania specyficznych decyzji strategicznych dotyczących pisania artykułów naukowych opartych na odnoszeniu się do popularnych tekstów w celu nadania publikacji rozgłosu. Co więcej, niedawno wydane publikacje, które nie zdobyły jeszcze zawrotnej liczby cytowań, w pewnym sensie umykają samej wyszukiwarce oraz Scholarowym rankingom, lądując na odległych miejscach w wynikach wyszukiwania lub na liście, choć ich wartość poznawcza może być niezwykle istotna.
Wyjście poza Google Scholar: ResearchGate, Scopus, DOAJ
Google Scholar nie jest jednak jedyną usługą tego rodzaju. Użytkownicy chcący korzystać z wiarygodnego oraz profesjonalnego źródła mogą korzystać z wyszukiwarki ResearchGate, której rzetelność, jak i bogactwo źródeł, trudno podważyć. Choć konto na ResearchGate założyć mogą w zasadzie wyłącznie osoby związane z oficjalnie uznawanym środowiskiem naukowym, nie-naukowcy również mogą korzystać z wyszukiwarki, w ramach której można formułować zapytania w obrębie wielu dyscyplin oraz subdyscyplin. Posiadanie konta wiąże się z łatwiejszym dostępem do pełnych wersji tekstowych wyszukanych publikacji, niemniej jednak osoby nieposiadające konta mogą zwrócić się z prośbą o udostępnienie pożądanej publikacji. Po przejściu do konkretnego wyniku wyszukiwania ukazane są dane bibliograficzne, w tym źródeł, które są przytaczane w tekście głównym.
Widniejąca w nazwie bazy brama zdradza wiele z istoty usługi, która pozwala nie tylko na wyszukiwanie tekstów, ale również zachęca do traktowania jej jak serwisu społecznościowego. Dzięki temu można kontaktować się z badaczami, udzielać się na forach lub w grupach dyskusyjnych, jak i samodzielnie archiwizować teksty, korzystać z wirtualnej biblioteki czy tworzyć krótkie abstrakty. Ponadto w zakładce Research Jobs znajdują się oferty pracy, które można przeglądać za pomocą kategorii: państwo, dyscyplina, stanowisko, instytucja.
Kolejną wartą uwagi wyszukiwarką jest Scopus, będący usługą stworzoną przez wydawnictwo Elsevier. W związku z tym użytkownik, który korzysta już z innych narzędzi oferowanych przez ten podmiot, np. z programu Mendeley, automatycznie będzie posiadał konto i w Scopusie – wystarczy się zalogować. Logika wyszukiwania opiera się na autorstwie publikacji, w związku z czym teksty wyszukuje się po danych autora oraz jego afiliacji. Przy wynikach wyszukiwania można zauważyć liczbę, która oznacza ilość dokumentów zestawionych za pośrednictwem specjalnego algorytmu w grupę. Zaletą Scopusa jest to, iż pozwala przeszukiwać bazy wydawnictw związanych z Elsevier, co pozwala zakładać wysoką jakość artykułów, które z reguły są publikowane w ramach wieloetapowego procesu recenzyjnego.
Jako profesjonalne narzędzie Scopus zawiera także rankingi danych. W ich ramach Scopus posługuje się stworzonym przez własnych pracowników wskaźnikiem CiteScore, który pozwala obserwować współczynnik cytowań dla czasopism naukowych. Ponadto Scopus pokazuje także dane obliczone na podstawie innych wskaźników: SJR (SCImago Journal Rank) i SNIP (Source Normalized Impact per Paper), które nie tylko biorą pod uwagę liczbę cytowań, ale też renomę czasopisma, w którym cytowania się znalazły. Niemniej jednak Scopus stara się wyjść z getta źródeł wysoce komercyjnych i w związku z tym trudno dostępnych publikacji, uwzględniając w rankingach cytowań również czasopisma ukazujące się w Open Access’ie (o ile czasopismo znajduje się w odpowiedniej bazie).
Wspomnianą bazą jest DOAJ (Directory of Open Access Journals). Stworzona przez pracowników Uniwersytetu w Lund usługa zawiera spis międzynarodowych, recenzowanych czasopism naukowych – a więc linki do stron, abstrakty lub pełne artykuły naukowe – do jakich dostęp jest darmowy. Na stronie głównej bazy znajduje się wyszukiwarka, gdzie po sformułowaniu zapytania za pomocą wielu filtrów otrzymuje się listę wyników, z poziomu której można zobaczyć abstrakt lub przejść do zewnętrznej strony, gdzie znajduje się pełna wersja tekstu.
DOAJ pozwala także na wyszukiwanie materiałów według dyscyplin naukowych. Prostota oraz bezpośredni charakter korzystania z DOAJ sprawiają, że korzystanie z jego zasobów daje nie tylko dużo wiedzy, ale i przyjemności. Dodatkową zaletą DOAJ jest pewność, iż w wynikach wyszukiwania znajdą się nie tylko tytuły-widmo, czyli źródła niedostępne w pełnej wersji, choć przydatne do celów bibliograficznych, ale przede wszystkim materiały, z których można skorzystać, czytając je.
Podsumowanie. Zostań olbrzymem
Należy mieć świadomość, iż oprócz wymienionych narzędzi w przestrzeni Internetu działają także inne, nie mniej wartościowe. Dość przypomnieć, iż w powiązaniu ze Scopusem funkcjonuje ScienceDirect, skupiający się głównie na naukach o życiu oraz medycynie, ale oferujący wolny dostęp jedynie do abstraktów – za teksty trzeba płacić w systemie pay-per-view lub opłacić subskrypcję. Niemniej jednak wszystkie wyszukiwarki łączy bogactwo źródeł oraz podobny sposób wyszukiwania danych. Oprócz zalet wyszukiwarki te niejednokrotnie współdzielą wady, spośród których można wymienić nadmierne skupienie na statystykach, które zdają się wypaczać naturę uprawiania nauki, sprowadzając ją do dbałości o wskaźniki oraz miejsca w rankingach. Jeśli jednak podejdzie się krytycznie do tych rozmaitych polityk indeksowania tekstów, prowadzone badania oraz bibliograficzny korpus z nimi związany mogą na tym skorzystać w olbrzymi sposób.