Data Scientist – zawód przyszłości?

Wraz z dynamicznym rozwojem środków przekazu informacji coraz większego znaczenia nabiera rola statystyków i analityków, którzy odpowiadają nie tylko za zbieranie informacji, lecz także za ich przetwarzanie. Jak wygląda praca analityka danych? Na czym polega zawód Data Scientist? Jak zacząć pracę w Data Science? Na te i inne pytania odpowiada mgr Arleta Kędra, pracownik naszego wydziału.

Przeciętny Polak zarabia x złotych. Przeciętny Niemiec spożywa y litrów piwa. Przeciętny człowiek czyta z książek w roku.

„Przecięty”, czyli jaki? Czy statystyka jest nam potrzebna na co dzień? Czy „przeciętny” człowiek zastanawia się, czym jest statystyka i do czego nam służy? Średnia arytmetyczna, mediana, odchylenie standardowe – każdy chociaż raz słyszał o tych miarach, ale czy w życiu codziennym zastanawiamy się, gdzie się ich używa? Niekoniecznie, chociaż powinniśmy.

Podstawy filozoficzne

Z każdej strony zasypują nas informacje – z mediów społecznościowych, serwisów informacyjnych, telewizji. Większość z tych informacji jest już przetworzona – zebrana i opracowana w taki sposób, by odbiorca postrzegał ją tak, jak chce tego nadawca. Gottlob Frege już w 1892 roku pisał o tym, że informacja składa się z dwóch elementów: sensu (Sinn) oraz nominatu/znaczenia (Bedeutung)1, a Ludwig Wittgenstein w 1922 stwierdził, że z informacji, które do nas docierają jesteśmy w stanie zrozumieć tyle, na ile pozwala nam nasze doświadczenie i wiedza2. Jeśli nadawca wie coś, co chce przekazać odbiorcy, to formułuje tę wiedzę w sposób sobie właściwy, używając swojego idiolektu, czyli indywidualnego języka każdej osoby, będącego wynikiem dotychczasowego doświadczenia, nawiązywanych kontaktów, wychowania i pochodzenia. Odbiorca również kodyfikuje uzyskiwane informacje w sposób, który nierozerwalnie wiąże się z posiadaną przez niego wiedzą ukrytą3 , czyli taką, która jest niematerialna i immanentna dla danej jednostki. Każdy człowiek natomiast wie więcej niż jest w stanie przekazać4, a rolą analityka jest przetworzenie danych w taki sposób, by ich wartość informacyjna była jak najwyższa.

Rola statystyki we współczesnym świecie

Wraz z dynamicznym rozwojem środków przekazu informacji, gdzie coraz mniej istotnym okazuje się dystans geograficzny, a coraz ważniejszym – dystans poznawczy5, 6większego znaczenia nabiera rola statystyków i analityków, którzy odpowiadają nie tylko za zbieranie informacji, ale również jej przetwarzanie.

Surowe dane rzadko mogą być wykorzystane w sposób wiarygodny, a wynika to z ich zanieczyszczenia, niekompletności lub niespójności. Firmy z różnych branż zwracają się więc do ekspertów w celu zebrania, oczyszczenia i sprawdzenia poprawności danych, a następnie przygotowania raportu, najczęściej wizualnego, na temat interesującego je zjawiska. Jak wygląda praca analityka danych? Wymaga ona wytrwałości i umiejętności z zakresu inżynierii oprogramowania – wiedzy niezbędnej do zrozumienia tendencyjności danych i usuwania błędów w kodzie. Innymi słowy, analityk danych znajduje wzorce i wykorzystuje tę wiedzę do budowania i ulepszania algorytmów, których używa.

Zawody związane z analizą danych

Wybierz pracę, którą kochasz, a nie przepracujesz ani jednego dnia więcej w Twoim życiu”, Konfucjusz

Co znaczy „kochać pracę”? Zapewne ile osób, tyle odpowiedzi, ale na pewno wymarzona praca to taka, którą lubimy i która nas satysfakcjonuje również pod względem finansowym. Czy można kochać pracę analityka? Oczywiście! Ale czy jest to praca dla każdego. Niestety (a może na szczęście) nie.

Jeśli popatrzymy na zarobki w zawodach związanych z analizą danych zauważymy, że wartości przeciętne, mierzone medianą zarobków, znacznie przewyższają przeciętne wynagrodzenie w gospodarce.

Data analyst, data scientist, a może data engineer? Z czym związane są te zawody i czym się pomiędzy sobą różnią? Każda osoba pracująca przy analizie danych jest w pewnym sensie tłumaczem – zbiera dane surowe, które możemy potraktować jako tekst w języku obcym i tłumaczy je na język docelowy, tak by były zrozumiałe i interpretowalne dla odbiorców. Rysunki od 1. do 4. prezentują przeciętne wynagrodzenie brutto w trzech zawodach związanych z analizą danych: Data Scientist, Analityk Biznesowy oraz Data Analyst. Skąd wynikają różnice w zarobkach? Z wielkości firmy zatrudniającej, wnoszonego do zespołu doświadczenia i wiedzy, poziomu wykształcenia oraz znajomości narzędzi informatycznych wykorzystywanych w pracy.

Rysunek 1. Zarobki na stanowisku Data Scientist: po lewej stronie widoczne są symbole osób w kolorze czerwonym, nad nimi widoczny jest napis „50% osób zarabia mniej”. Na środku widoczny symbol osoby w kolorze niebieskim (nad nim znajduje się kwota 10 500 zł). Po prawej stronie widoczne są z kolei symbole osób w kolorze zielonym, nad nimi widoczny jest napis „50% osób zarabia więcej”.
Źródło grafiki: https://zarobki.pracuj.pl/stanowiska/badania-i-rozwoj/data-scientist, dostęp dn. 1.10.21

 

 

Rysunek 2. Zarobki na stanowisku Analityka Biznesowego: przeciętne wynagrodzenie osoby pracującej na stanowisku Analityk Biznesowy: po lewej stronie widoczne są symbole osób w kolorze czerwonym, nad nimi widoczny jest napis „50% osób zarabia mniej”. Na środku widoczny symbol osoby w kolorze niebieskim (nad nim znajduje się kwota 11 000 zł). Po prawej stronie widoczne są z kolei symbole osób w kolorze zielonym, nad nimi widoczny jest napis „50% osób zarabia więcej”.
Źródło grafiki: https://zarobki.pracuj.pl/stanowiska/it-rozwoj-oprogramowania/analityk-biznesowy, dostęp dn. 1.10.21

 

 

Rysunek 3. Zarobki na stanowisku Data Analyst z ponad trzyletnim doświadczeniem: po lewej stronie widoczne są symbole osób w kolorze czerwonym, nad nimi widoczny jest napis „50% osób zarabia mniej”. Na środku widoczny symbol osoby w kolorze niebieskim (nad nim znajduje się kwota 8 300 zł). Po prawej stronie widoczne są z kolei symbole osób w kolorze zielonym, nad nimi widoczny jest napis „50% osób zarabia więcej”.
Źródło grafiki: https://zarobki.pracuj.pl/stanowiska/strategia-bi/data-analyst->-3-lata-doswiadczenia, dostęp dn. 1.10.21

 

 

Rysunek 4. Zarobki na stanowisku Data Analyst z mniej niż trzyletnim doświadczeniem: po lewej stronie widoczne są symbole osób w kolorze czerwonym, nad nimi widoczny jest napis „50% osób zarabia mniej”. Na środku widoczny symbol osoby w kolorze niebieskim (nad nim znajduje się kwota 5 000 zł). Po prawej stronie widoczne są z kolei symbole osób w kolorze zielonym, nad nimi widoczny jest napis „50% osób zarabia więcej”.
Źródło: https://zarobki.pracuj.pl/stanowiska/strategia-bi/data-analyst-<-3-lata-doswiadczenia, dostęp dn. 1.10.21

 

 

Czym te zawody różnią się miedzy sobą? Ogólny zakres obowiązków i wymaganych umiejętności jest podobny, główną różnicę stanowią używane narzędzia – Data Analyst częściej niż Data Scientist używa Tableau, a Data Engineer korzysta raczej z Dockera. Co jest podstawą w każdym z tych zawodów? Znajomość statystyki i ekonometrii, w tym rozkładów statystycznych, metody gradientu prostego, regresji logistycznej czy metod taksonomicznych. Na początek wystarczy też znajomość R lub Pythona. Coraz popularniejszym staje się przetwarzanie języka naturalnego (Natural language processing – NLP), które łączy zastosowanie AI z językoznawstwem w celu rozpoznawania i wykorzystywania tekstów lub mowy w języku rzeczywistym.

Jak zacząć pracę w Data Science?

Przede wszystkim trzeba odpowiedzieć sobie na pytanie „Co lubię robić?”. Jeśli wielogodzinne pisanie kodu do mnie nie przemawia, to najprawdopodobniej nie będzie to praca dla mnie. Jeśli też brakuje mi skrupulatności i dokładności, to okaże się, że więcej czasu niż samo pisanie kodu zajmuje mi szukanie błędów, którymi często okazują się zbyt frywolnie pominięte lub wstawione nawiasy, przecinki czy kropki. Warto jak najwcześniej zacząć poznawać narzędzia informatyczno-statystyczne – studenci Wydziału Ekonomicznego UMCS, zwłaszcza kierunku Analityka gospodarcza oraz nowo powstającego kierunku Data Science pracują w różnych programach i językach programowania – od tych najmniej zaawansowanych, jak gretl czy SPSS do tych wykorzystywanych w biznesie, jak Stata, R lub Tableau. Takie przygotowanie wystarcza do podjęcia pierwszej pracy w branży Data Science. Później, zgodnie z profilem i kulturą pracy danej firmy, można rozszerzać swoje umiejętności o znajomość Matlaba, Octave, Pythona i, oczywiście, zagadnień związanych z uczeniem maszynowym (machine learning). Ważnym aspektem jest znajomość języka angielskiego na poziomie przynajmniej B2; znajomość innego języka jest dodatkowym atutem.

Pamiętać jednak należy, że dobry analityk, tak jak dobry tłumacz, uczy się całe życie, powinien się też cechować wrodzoną ciekawością i dociekliwością oraz dążyć do zdobywania coraz wyższych kwalifikacji. Czasem może się też okazać, że osoby z zainteresowaniami humanistycznymi również bardzo dobrze radzą sobie w zawodach analitycznych. Ważną jest umiejętność pracy w grupie, ponieważ część projektów wykonuje się kolektywnie. Dobry analityk musi umieć zadawać właściwe pytania, efektywnie poszukiwać informacji, akceptować swoją niewiedzę i intensywnie pracować, by sytuacji, w których brakuje mu tej wiedzy, było jak najmniej.

Podsumowanie

Ze względu na dynamicznie zwiększający się popyt na rzetelną informację zawody związane z zaawansowaną analizą danych cieszą się coraz większym zainteresowaniem. Wiąże się to również ze zwiększoną konkurencją w tej branży, co oznacza, że potrzeba coraz większych kwalifikacji, by być dobrym analitykiem. Warto pamiętać, że praca w Data Science daje bardzo szerokie możliwości wyboru formy zatrudnienia – można wybrać umowę o dzieło, zlecenia, o pracę lub B2B, oraz pełen zakres benefitów pracowniczych, jak na przykład prywatną opiekę zdrowotną, finansowanie zajęć sportowych lub ubezpieczenie na życie. Dodatkowym atutem jest możliwość swobodnego wyboru pomiędzy pracą zdalną a stacjonarną oraz dosyć nienormowany czas pracy – jeśli mamy analizę do wykonania, to po prostu musimy ją wykonać w terminie.

Data Scientist jest zawodem przyszłości, chociaż może się okazać, że za kilka lat zakres wymaganych umiejętności będzie się różnić od tego obecnie poszukiwanego. Może warto już teraz zacząć inwestować w swój rozwój i swoją przyszłość?


1. Frege, G. (1892). Über Sinn und Bedeutung. Zeitschrift Für Philosophie Und Philosophische Kritik, 100(1), 25–50.

2. Wittgenstein, L., Pears, D., & McGuinness, B. (1922). Tractatus logico-philosophicus. Routledge.

3. Nonaka, I., & Takeuchi, H. (1995). The knowledge-creating company: How Japanese companies create the dynamics of innovation. Oxford University Press.

4. Polanyi, M. (1966). The tacit dimension. Doubleday.

5. Asheim, B. (2012). The Changing Role of Learning Regions in the Globalizing Knowledge Economy: A Theoretical Re-examination. Regional Studies, 46(8), 993–1004. https://doi.org/10.1080/00343404.2011.607805

6. Foray, D. (2014). From smart specialisation to smart specialisation policy. European Journal of Innovation Management, 17(4), 492–507. https://doi.org/10.1108/EJIM-09-2014-0096


Mgr Arleta Kędra

Absolwentka Ekonomii oraz Lingwistyki stosowanej Uniwersytetu Marii Curie-Skłodowskiej. Od 2017 pracownik naukowo-dydaktyczny Katedry Statystyki i Ekonometrii Wydziału Ekonomicznego UMCS. Naukowo zajmuje się wykorzystaniem narzędzi ekonometrycznych do analizy zjawisk ekonomiczno-społecznych ze szczególnym uwzględnieniem wpływu akwizycji języka na procesy tworzenia i rozprzestrzeniania się wiedzy. Dodatkowo pracuje jako tłumacz języka angielskiego i niemieckiego oraz analityk danych.


Artykuł powstał w ramach obchodów Światowego Dnia Statystyki. Inicjatorem projektu jest Biuro Promocji i Popularyzacji Nauki UMCS.

Fot. Matryx/Pixabay

    Aktualności

    Data dodania
    21 października 2021