Data scientist – nowy zawód na nowe czasy
Artykuły o pracy w świecie IT skupiają się głównie wokół programistów. Najczęściej słyszymy o zapotrzebowaniu na osoby specjalizujące się w aplikacjach webowych, desktopowych czy mobilnych, albo będącą ekspertami związanymi z bazami danych. W ostatnich latach coraz głośniej mówi się również o zawodzie, który jest rozszerzeniem analityka danych o umiejętności programowania, ale i nie tylko. Kim są zatem specjaliści data science, czym się zajmują oraz jakie umiejętności warto mieć, aby rozpocząć pracę na wymarzonym stanowisku?
Big Data i nowe wyzwania
Wraz z rozwojem IT, firmy pozyskują coraz więcej danych odnośnie klientów, produktów czy innych dóbr. Ilość informacji zwiększa się bardzo szybko i problemem nie jest już ich pozyskanie (aczkolwiek też jest nadal ważne), ale obróbka i użycie dostępnych faktów. Firmy są obecnie świadome, iż odpowiednie wykorzystanie danych jest kluczem do sukcesu (afera z Cambridge Analytica i wyborami w USA). Informacje o nas zbierają smartfony, smartwatche, telewizory, systemy operacyjne, przeglądarki internetowe, kamery przemysłowe czy nawet lodówki. Każdy z nas niebezpośrednio generuje olbrzymie ilości danych. Odpowiednie przetworzenie i użycie tych informacji generuje realny zysk. To właśnie zapotrzebowanie na zarządzanie danymi wymusiło potrzebę zaistnienia specjalistów data science.
Eksperci w tej dziedzinie są połączeniem osób zajmujących się analizą danych z nauczaniem maszynowym. Pozyskane informacje nie są już wartością samą w sobie. Głównym celem jest odpowiednie ich przetworzenie i wykorzystanie. Omawiany zawód łączy wiele zadań, które do tej pory wykonywane były przez różne zespoły, często w całkowitym odseparowaniu od siebie. Obecnie biznes oczekuje realnych korzyści z posiadanych danych. Mogą to być systemy do rekomendowania produktów w Internecie na podstawie działań użytkownika, aż po analizę danych z kamer CCTV w celu wykrywania terroryzmu (Microsoft obecnie tworzy system do wykrywania broni z obrazów z kamerach przemysłowych).
Data scientist – nieszablonowy zawód w branży IT
Specjaliści data science mają bardzo szerokie kompetencje. Muszą mieć wiedzę z zakresu matematyki i statystki, a także być biegłymi w programowaniu. Oczywiście warto znać także dziedzinę, którą badamy. Omawiani eksperci to także osoby, które stoją na pograniczu biznesu i IT. Często muszą komunikować się z klientem i mieć wiedzę niezbędną do przelania potrzeb na kod z użyciem dostępnych danych. Dodajmy tutaj, że jak zawsze w branży IT, język angielski jest niezbędny, aby móc realnie myśleć o pracy na stanowisku data scientist.
Osoby rozpoczynające karierę w tej dziedzinie nie muszą już od startu być obeznane we wszystkich omówionych zagadnieniach. Podstawą jest analityczne myślenie, które jest niezbędne w tej pracy, gdzie głównym celem jest rozwiązywanie zaistniałych problemów. Warto nadmienić, że zapewne łatwiej rozpocząć karierę w data science osobom mającym już jakiekolwiek doświadczenie w temacie
analizy danych czy statystyki. Z drugiej strony poszukiwani są również pracownicy z innych branż jak chociażby ekonomia, gdzie w trakcie późniejszej pracy będą mogli posiąść pozostałe wymagane umiejętności. Wspólną cechą niezbędną do wykonywania zawodu jest jednakże kreatywne podejście do zadanego tematu i komunikatywność.
Umiejętności miękkie to również bardzo ważny aspekt data science. Swobodna komunikacja z kardą zarządczą i umiejętność przekazania wyników analiz są ważne w pracy w każdej firmie. Dodatkowo zaawansowani eksperci data science często pełnią funkcje kierownicze nad całym zespołem, który składać się może z osób o różnych umiejętnościach.
Data Scientist, a programowanie
Umiejętność kodowania jest niezmiernie ważna w pracy osób na stanowisku data scientist. Wybór języka nie jest jednak w tym przypadku trywialny. Może się okazać, że wymagane będzie posiadanie wiedzy z programowania w kilku językach, w zależności od projektu czy klienta.
Rozpoczynając jednakże naukę warto zdecydować się na język popularny w danej dziedzinie i najbardziej przyszłościowy. Bez wątpienia takim językiem jest obecnie Python. Wg KDnuggets (https://www.kdnuggets.com/2018/05/poll-tools-analytics-data-science-machine-learning-results.html) Python ma obecnie niemalże 66% rynku data science. Wyprzedził on już rok temu „nieśmiertelny” język R i nie zwalnia tempa.
O popularności Pythona w data science zadecydowało kilka czynników. Po pierwsze jest on w pełni darmowy co jest niezaprzeczalną zaletą w porównaniu chociażby do płatnego Matlaba. Kolejną zaletą Pythona jest niski próg wejścia, w porównaniu do konkurencyjnych języków. Rozpoczęcie z nim przygody jest bardzo proste, co jest niezmiernie ważne w dziedzinie skupiających specjalistów z różnych dziedzin. Pierwsze skrypty można stworzyć odczuwalnie szybciej w Pythonie, niż w takiej Javie czy C++. Jest on także znacznie przejrzystszy i popularniejszy niż R, dzięki czemu łatwiej jest znaleźć kursy Pythona w sieci. Dodatkowo sam język jest bardzo uniwersalny i szeroko stosowany w różnych gałęziach IT. Znajdziemy go w aplikacjach zarówno desktopowych jak i webowych. Nic nie stoi na przeszkodzie, aby użyć go w procesie ETL (extraction, transformation, loading – wstępnej obróbki danych).
Dodatkowo za Pythonem przemawia bardzo duża liczba solidnych pakietów wykorzystywanych przy data science. Znajdziemy tutaj chociażby Pandas, Scikit-learn czy Tensorflow. Sprawa to, że Python jest znacznie atrakcyjniejszy od popularnej w świecie programowania Javy.
Jeśli omawiamy data science i języki programowania warto pamiętać, że ciągle ważna jest znajomość baz danych. Czy wybierzemy R, Pythona czy Javę, na jakimś etapie pracy pojawi się zapewne wymóg posiadania wiedzy z SQLa.
Ciekawy zawód z wyzwaniami
Data scientist to zawód, który jest wymagający, ale dający jednocześnie wiele satysfakcji. Pozwala on na poszerzenie wiedzy z zakresu programowania i analitycznego myślenia. Będzie to praca z wieloma wyzwaniami i problemami do rozwiązania. Ujarzmienie i wykorzystanie Big Data w wielu firmach to klucz do sukcesu, a jednocześnie coraz większe ilość danych dostarczanych przez ludzi i systemy powoduje, iż zapotrzebowanie na data scientistów będzie rosło.
Nie jest to praca prosta, a prawdziwi eksperci w swojej dziedzinie to osoby mające bardzo szeroką wiedzę. Znajomość matematyki i statystki, a także programowania jest zrozumiała w pracy data scientystów. Jednakże warto dodać, że równie ważne są umiejętności miękkie i ogólna dociekliwość w poszukiwaniu korelacji. Nie bez znaczenia jest także znajomość dziedziny, która wykorzystuje zdobyte dane do przetworzenia i użycia. Pomimo wielu wymogów, praca jest wyjątkowo ekscytująca i satysfakcjonująca. Data science jest młodą odnogą IT, która ma realny wpływ na otaczający nas świat.