Datele – cum au revoluționat lumea

Într-o lume a datelor, există o nevoie clară de profesioniști care să le valorifice.

Salutare,

Eu sunt Denisa, sunt absolventă a masterului de Cibernetică și Economie Cantitativă, cu o experiență de peste 3 ani în Data Analytics și pasiune pentru date pe care îmi doresc să o transmit mai departe.

Îți propun să schimbăm puțin aria de interes și să ne îndreptăm atenția către un domeniu pe care mie îmi place să îl sumarizez într-un singur cuvânt: 

Poate că ai auzit până acum de termeni precum Data Science, Data Analytics, Machine Learning sau Big Data. Poate că te-ai confruntat cu materii în facultate cum ar fi Analiza Datelor, Inteligență Computațională sau Serii de Timp

Dacă încă te pierzi în denumiri și terminologie, află că este normal, cu toții trecem prin asta. Ca să te ajut, mi-am propus să îți ofer din cunoștințele și experiența mea și voi începe în articolul acesta cu o  introducere în domeniul datelor și a joburilor specifice. 

Am fost martoră de-a lungul timpului la evoluția pe care a avut-o zona de Analytics. Am văzut cât de multe nevoi au apărut imediat ce am descoperit cât potențial au datele și cât de mult pot ajuta business-ul. 

Ce a influențat evoluția domeniului? 

Ei bine, cantitatea de date generată astăzi crește exponențial.

Poate nu știai, dar:

  • În 2019, pe Facebook se înregistrau peste 1 milion de autentificări la fiecare 60 de secunde
  • Tot la fiecare minut, pe Youtube se încărcau peste 500 de ore de video și se înregistrau peste 4 milioane de video-uri vizualizate
  • Peste 300 000 de utilizatori stăteau pe Instagram la fiecare 60 de secunde. Sunt convinsă că tu erai unul dintre ei!

Trebuie să știi că această creștere în date nu are loc doar pe platformele de socializare, dar cu siguranță asta are un impact major. Vei întâlni date și în domenii precum vânzări, marketing, finanțe, sănătate, educație, gaming și multe altele.

Un studiu realizat de IBM în 2012 susținea că 90% din datele existente atunci în întreaga lume au fost generate doar în ultimii doi ani.

 O persoană care reușește să scoată informații esențiale din seturi de date uriașe este din ce în ce mai căutată de către marile companii pentru că poate avea un impact major în luarea deciziilor strategice și poate oferi noi perspective de dezvoltare.


Hai să facem un exercițiu!

Gândește-te chiar tu la o situație în care ai aflat o informație nouă prin intermediul numerelor sau în care ai luat o decizie după ce ai analizat niște date existente.

  •  Fitness App – Poate că folosești aplicații care îți monitorizează activitatea fizică pe care o faci zilnic și uitându-te peste date îți poți evalua progresul și alegi fie să continui în același stil sau decizi să schimbi strategia și să te mobilizezi mai mult. 
  •  Sesiune – De câte ori nu te-ai întrebat ce note au avut colegii mai mari la o anumită materie ca pe baza datelor istorice să decizi dacă e cazul să înveți mai mult sau din contră… să te mai relaxezi înveți și mai mult?

Ei bine, toate aceste aspecte banale au la bază un mecanism bazat pe date care ne oferă posibilitatea să le trecem prin filtrul propriu, să le analizăm și pe care le transformăm în informații pe baza cărora luăm decizii conștient și informat. 

La o scară mult mai largă, marile companii au înțeles de-a lungul timpului cât de importante sunt datele pentru performanța lor și și-au îndreptat atenția spre crearea a ceea ce putem numi data-driven culture. Mai exact, o tranziție de la modul tradițional de a lua decizii bazate pe instinctul profesioniștilor, la decizii asumate și care au o bază mult mai solidă.

Cum sunt folosite datele în cadrul marilor companii?

În funcție de domeniul în care activează, de datele pe care le au la dispoziție și de nevoile existente, companiile pot folosi și valorifica datele în numeroase moduri.

  • Pentru a-și evalua performanța și a lua decizii

70% dintre companiile care au echipe dedicate de Analytics și-au depășit targetul, conform unui studiu efectuat de Deloitte în 2019.

Având la dispoziție date, o companie calculează și evaluează diferiți indicatori de performanță (KPIs) și îi compară cu obiectivele stabilite pentru a vedea dacă le-a atins sau pentru a găsi zone în care sunt necesare îmbunătățiri. Sunt plănuite astfel noi strategii și se iau decizii privind activitatea viitoare.

”If you can’t measure it, you can’t change it.” Peter Drucker

  • Pentru a rezolva probleme

Analizând datele istorice, compania poate identifica scăderi în indicatorii monitorizați la anumite momente de timp, găsește factorii care au avut un impact asupra performanțelor sale și poate lua măsuri pentru a rezolva problemele sau pentru a evita pe viitor situații similare.

  • Pentru a îmbunătăți procesele existente

Numeroasele date existente ajută la crearea de scenarii și simulări care te ajută să  vezi din timp cum ar evolua o serie de indicatori dacă factorii de influență și-ar modifica la rândul lor valorile.

  • Pentru a înțelege clienții și comportamentul acestora

76% dintre consumatori se așteaptă de la companii ca acestea să le înțeleagă nevoile și să le anticipeze așteptările, conform unui studiu realizat de Salesforce. 

Prin intermediul datelor, companiile ajung să înțeleagă la ce stimuli reacționează consumatorii, când sunt mai predispuși să cumpere produsul sau serviciul lor și iau decizii menite să rețină consumatorul.

  • Pentru a anticipa evenimente viitoare 

Acest lucru se întâmplă prin analiză predictivă, răspunzând la întrebarea: ce se va întâmpla în viitor. De exemplu, o companie poate să estimeze probabilitatea ca un client să cumpere din nou un anumit produs sau să-l recomande mai departe, băncile pot decide să acorde sau nu credit unui client în funcție de probabilitatea ca acesta să îl plătească.

2 exemple de mari companii și cum folosesc ele datele

1. Netflix  

Every decision made at Netflix is deeply driven by data.

Netflix este primul exemplu care îmi vine în minte când vorbim de valorificarea datelor. 

Conform Netflix, peste 75% din activitatea utilizatorilor este bazată pe recomandările personalizate pe care le primesc.


Compania folosește datele ca mijloc principal de luare a deciziilor, colectează date de la cei peste 100 milioane de utilizatori și le utilizează pentru a le analiza comportamentul și tendințele de vizionare și pentru a crea o experiență personalizată pentru fiecare în parte. 

Netflix știe când te-ai uitat la serialul tău preferat, când ai pus pauză, de pe ce dispozitiv urmărești, calculează probabilități și folosește toate aceste date pentru a crea un sistem de recomandare în funcție de profilul utilizatorului. Sună interesant, nu?

2. Coca Cola 

Milioane de oameni consumă zilnic produsele companiei, de la Coca Cola, la Sprite, Schweppes și Fanta. În momentul de față, Coca Cola are 106 milioane de urmăritori pe Facebook și 2.7 milioane de followers pe Instagram. 

Toate acestea generează date care pot fi folosite pentru a lua decizii de Marketing, de vânzări, pentru a cunoaște mai bine consumatorii și pentru a îi determina să cumpere din nou produsele lor. Mai mult, datele sunt folosite și pentru a crea produse noi în funcție de preferințele oamenilor. 

Cum a crescut numărul angajaților în domeniu în ultimii ani?

Estimările ne arată că în 2020 ne putem aștepta să avem undeva la 2.7 milioane de poziții deschise pentru specialiști în date în toată lumea. Cifrele sunt cu siguranță orientative și sunt menite să îți faci o idee legată de amploarea domeniului.

Un lucru este cert! Companiile au nevoie de date pentru a-și crește perfomanța și a lua decizii informate și de oameni pregătiți să le ajute în tot procesul acesta.

Care sunt pozițiile pe care le poți ocupa?

Hai să parcurgem împreună câteva dintre rolurile pe care le poți ocupa dacă ești pasionat de date. 

Gândindu-mă la tot procesul prin care trec datele până se ajunge la rezultate concrete și la răspunsurile de business, constat că există două categorii de specialiști: 

  • cei care se ocupă de colectarea, crearea și gestionarea bazelor de date 
  • cei care folosesc datele cu scopul de a afla informații utile.

Este important ca bazele de date să fie bine gândite înainte de a fi create, arhitectura lor să fie optimă pentru a reduce timpul de accesare, iar datele să fie securizate. Aici există câteva poziții cheie: Data Architect, Data Engineer, Database Administrator.

  • Data / Big Data Architect – este persoana care gândește și proiectează structuri și sisteme complexe de baze de date. De obicei, un arhitect are în spate mai mulți ani de experiență și o viziune mai largă asupra datelor, proceselor și companiei, aspecte importante când vine vorba de proiectare.

Cunoștințe tehnice: SQL, NoSQL, Hadoop (Hive, Pig)

  • Data / Big Data Engineer – lucrează îndeaproape cu arhitecții de baze de date pentru a construi și menține infrastructura care conectează datele din cadrul unei organizații. Responsabilitatea lor este să integreze toate sursele de date necesare pentru a fi disponibile în activitatea ulterioară de raportare și analiză.

Cunoștințe tehnice: SQL, NoSQL| procese ETL |  Hadoop (Hive, Pig) |  Java, Python

* Orientativ, am putea împărți cele două poziții în rolurile tradiționale și Big Data. Cei dintâi lucrează cu date structurate și care pot fi ușor de prelucrat datorită volumului mai redus. Specialiștii Big Data în schimb lucrează cu date în diferite formate: imagini, fișiere video, audio și cu volum mult mai mare.

  •   Database administrator – ajută la proiectarea bazelor de date și se asigură că nu există probleme în accesarea lor. Totodată, ei se ocupă de optimizarea bazelor de date pentru ca acestea să funcționeze mai rapid și asigură securitatea datelor.

Cunoștințe necesare: SQL, NoSQL | procese ETL | Hadoop (Hive, Pig) | Java, Python

Între aceste 3 poziții există similarități și cu siguranță vor fi situații în care responsabilitățile se vor suprapune.

Cea de-a doua categorie de specialiști se ocupă cu utilizarea acestor date pentru a le reprezenta într-un mod simplu de urmărit, a le analiza și a obține informații.

  • Business Intelligence Consultant

Este o persoană responsabilă de extragerea, strângerea și raportarea datelor istorice legate de business prin intermediul dashboard-urilor care sunt folosite pentru a lua decizii și pentru a înțelege evenimentele trecute și evoluția lor.

Cunoștințe necesare: SQL | Tool-uri de vizualizare: PowerBI, Tableau, Qlik, Spotfire, Excel

  • Data Analyst

Responsabilitatea unui Data Analyst constă de asemenea în extragerea datelor din diferite surse, colectarea, prelucrarea și curățarea lor și crearea de grafice care să arate în mod clar și intuitiv informația dorită. 

Rolul său mai presupune și analizarea datelor pentru ca pe baza lor să ofere recomandări în luarea deciziilor de business: îmbunătățire a proceselor, reducere a costurilor etc. 

Cunoștințe necesare: SQL | R, Python |  Tool-uri de vizualizare: Tableau, PowerBI, 

  • Data Scientist 

Un Data Scientist analizează date, dezvoltă ipoteze statistice, creează modele predictive, testează și monitorizează performanța modelelor asigurând totodată și acuratețea datelor. Responsabilitatea lui este să ofere informații pentru a ajuta companiile să creeze strategii puternice de îmbunătățire a experienței consumatorilor, creștere a veniturile generate.

Cunoștințe necesare: SQL | R, Python | eViews, SPSS, Stata | statistică, probabilități

Exemple de aplicații:

  • Experimentul Titanic: unul dintre cele mai populare exerciții pentru cei care sunt la început de drum. Mai exact, folosind un set de date ce conține informații despre pasagerii Titanicului cum ar fi sex, vârstă, clasă, tipul de bilet, se aplică metode de clasificare pentru a stabili dacă un anumit pasager va supraviețui sau nu. 
  • Customer segmentation: gruparea clienților care au caracteristici comune în clustere folosind algoritmi de clusterizare este o tehnică des întâlnită în Marketing
  • Machine Learning Developer

Machine Learning se referă la implementarea de algoritmi care permit unei mașini să primească date și să le folosească pentru a face predicții, a analiza patternuri și a oferi recomandări. Astfel, un ML developer ajută la dezvoltarea de aplicații și modele de predicție folosind date și algoritmi.

Cunoștințe necesare: R, Python, Java, JS | statistică, probabilități, algoritmi

Exemple de aplicații: 

  • Spam Detector: algoritm care poate detecta dacă un anumit mail este spam sau nu
  • Topic Analysis: detectarea subiectului principal dintr-o colecție de fraze utilizând tehnici de Natural Language Processing

BONUS

Un data specialist va fi pus de multe ori în ipostaza de a prezenta datele și concluziile la care ajunge, de aceea skill-urile de comunicare și story-telling, mai exact abilitatea de a spune o poveste prin intermediul datelor, vor fi de multe ori necesare.

Nu există în practică o delimitare clară pentru oricare dintre cele 4 arii de mai sus, iar fiecare companie are așteptări diferite și propriul mod de a înțelege aceste roluri. Vei observa asta încă din job description, dar și din întrebările pe care te încurajez să le pui în cadrul interviurilor.

Concluzie

Într-un domeniu în plină ascensiune și cu numeroase nevoi și idei de utilizare a datelor, vei întâlni numeroase alte poziții, fiecare având diferite particularități. Deși vin la pachet cu multe provocări, îți oferă ocazia să îmbini tehnologia și cunoștințele de business.

Ce au în comun toate joburile din zona de date este o serie de skill-uri de care vei avea nevoie cu siguranță: 

  • un mindset orientat către date
  • gândire analitică
  • atenție la detalii
  • multă răbdare
  • skill-uri de comunicare

Experiența mi-a arătat că adeseori poți ajunge la același rezultat prin metode diferite. Pot spune că au fost momente când soluțiile pe care le-am implementat au necesitat să învăț și HTML, să creez baze de date de la 0, să scriu cod de Python ce nu presupunea doar lucrul cu datele și au fost situații care m-au scos din zona de confort și m-au împins să acopăr și alte arii care la prima vedere nu au nimic în comun cu rolul meu. 

Ce vreau să reții este că o atitudine orientată către cunoaștere și evoluție va fi întotdeauna apreciată, iar ca data specialist este important să te adaptezi noilor schimbări de business, să pui multe întrebări și să înveți constant ca să fii la curent cu cele mai noi tehnologii.


Fun fact care să te pregătească pentru o carieră în domeniu:

DATA jobs are 80% preparing data, 20% complaining about preparing data.

Acum că am ajuns la final, te provoc să te gândești chiar tu la o situație din viața reală în care sunt folosite datele atunci când vine vorba de luat decizii importante. Poate fi din viața ta personală sau din exemple cunoscute, important e să o împărtășești cu noi într-un comentariu!

Dacă ai întrebări sau vrei să stăm de vorbă, te aștept aici. Acesta este doar începutul, vor urma cu siguranță și alte lucruri interesante. Și nu uita:

Data makes your story more credible.

Author avatar
Dutcă Denisa

Adaugă un comentariu:

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *