Geek Academy

Le caratteristiche di un buon Data Scientist nelle aziende moderne

Quali sono le competenze e le abilità che un Data Scientist deve possedere per fare la differenza

Le caratteristiche di un buon Data Scientist nelle aziende moderne

Condividi su:

Data Science: uno di quei campi di cui tutti parlano ma che pochi conoscono in maniera appropriata. Le scuole stanno cominciando soltanto adesso a capire come integrarle nei propri programmi ministeriali, e ogni azienda ha le sue proprie politiche di recruiting quando si tratta di Data Science (per non parlare di quelle che non ne hanno affatto!). Lavoro in questo settore da un po' ormai, ho esaminato frotte di candidati per le Data Science, e ho assunto un team di persone che lavorano su problematiche ad esse legati a cui tengo particolarmente.
Ho notato che le cose che io tengo in conto e che vanno bene per me non sempre sono quelle che le grandi aziende cercano. Quindi in questo post vorrei elencare un po' di caratteristiche che, a parer mio, contribuiscono a fare un bravo data scientist, nella speranza che le grandi aziende le prendano in considerazione e che i candidati possano farsi un'idea di quello che gli esaminatori cercano.

Per quanto riguarda questo post, parlerò prevalentemente di Data Science in un contesto di costruzione e sviluppo di soluzioni di predictive analytics. Detto ciò, cominciamo.

Caratteristiche fondamentali di un bravo Data Scientist

Ci sono dei tratti e delle capacità che reputo siano gli aspetti più importanti per un buon data scientist. Queste caratteristiche sono fondamentali: se un candidato non le possiede, so già che la cosa non funzionerà. Fortunatamente sono abilità abbastanza basilari ed è relativamente facile diventarne esperti.

Il Data Scientist e le abilità comunicative 

Ormai la cosa più importante che cerco in un data scientist (ed in effetti in tutti quelli con cui lavoro) è la capacità di comunicare. Gli obiettivi si raggiungono in squadra. Il lavoro del singolo spesso dipende dal progresso di un'altra persona. Per poter creare un ambiente di lavoro funzionale e progredire velocemente, una squadra deve essere in grado di divulgare le idee in maniera efficace. La comunicazione è l'aspetto più importante in questo contesto.
Ho notato spesso che i buoni comunicatori riecono anche a lavorare bene insieme agli altri, cosa estremamente importante in un piccolo team. Per me le due caratteristiche sono strettamente interconnesse tra loro, e non ricordo un singolo caso in cui all'una non si accompagnasse anche l'altra.

Il Data Scientist e la capacità di gestire il tempo

Devo ancora trovare un'azienda che non sia schiava del tempo. I problemi tenici richiedono un bel po' di tempo per essere risolti, spesso sorgono complicazioni ed è importante che un data scientist sia in grado di svolgere tutti i suoi compiti in maniera efficace.
C'è da dire che a volte riuscire a completare un compito significa dover portare alla luce problemi e farsi aiutare da qualcuno, oppure avere il coraggio di dire chiaramente “non dovremmo occuparci di questa cosa in questo momento perché richiederebbe troppo tempo”. Riuscire a capire come completare i compiti in modo efficace è fondamentale.

Il Data Scientist e il problem solving

Il lavoro di tecnico consiste n una serie di problemi da risolvere uno dopo l'altro. “È così in tutti i lavori”, qualcuno potrebbe obiettare. Vero. Essere in grado di risolvere problemi complessi, quindi, è importante in senso generale. Questa abilità va di pari passo con il riuscire ad apprendere rapidamente nuovi concetti. Quando si tratta di questo, in genere preferisco le persone capaci di afferrare e utilizzare al volo nuovi concetti piuttosto che quelle che possiedono competenze importanti ma faticano ad imparare cose nuove.

Il Data Scientist e l'etica del lavoro

Non dovremmo neanche stare qui a parlane, che è poi il motivo per cui non ho inserito questa voce al primo posto nella lista, ma darsi da fare è essenziale. Non si può portare a compimento nulla senza la volontà di impegnarcisi. Certo, è un concetto ovvio, ma ho imparato che è meglio essere ridondanti piuttosto che dare le cose per scontate (tanto per tornare al punto primo!).

Caratteristiche importanti 

Quelle menzionate fino ad ora sono le caratteristiche più importanti da ricercare, ma io propendo per l'assumere chi sia in grado di imparare, crescere e lavorare bene.
Detto ciò, è importante che le persone abbiano capacità ben salde da mettere in campo. Queste caratteristiche sono importanti e in genere cerco sempre di metterle alla prova durante i colloqui per un nuovo data scientist. per la cronaca, non controllo se il candidato è in grado di risolvere enigmi né pongo domande a trabocchetto durante i colloqui. Mi assicuro semplicemente che chi ho davanti sappia fare quello che sostiene di saper fare, o che sia in grado di elaborare una soluzione ad un problema simile a quelli che potrebbe trovarsi ad affrontare in una normale giornata lavorativa.

Il Data Scientist e la programmazione

Qui non c'è neanche da stare a parlarne. Per poter essere un buon data scientist (capace di costruire buone soluzioni di predictive analytics) bisogna essere un bravo programmatore.
Posso insegnare le tecniche di software development, ma è comunque necessario mettersi d'impegno e praticarle. Programmare è fondamentale e immensamente importante, e bisogna saperlo fare almeno ad un livello tale da portare del valore aggiunto al prodotto della propria azienda, saperci fare con distribuzione e pulizia dei dati, e con l'apprendimento di algoritmi. Come data scientist è importante saper procedere verso il proprio obiettivo con le risorse che si hanno a disposizione. Ci vuole una comprensione di base di come i dati grezzi vengano preparati per essere dati in pasto ad un algoritmo di apprendimento, inseme ad una conoscenza minima degli stessi algoritmi.

Comunque, a me personalmente non interessa che un candidato sappia descrivere in maniera dettagliata come lavora un algoritmo sotto cappa. Quello che ho bisogno di capire è se sia in grado o meno di comprendere cosa accade all'interno di un algoritmo, in quali casi esso potrebbe funzionare e in quali no.

Il Data Scientist e la passione

Adoro parlare con gli appassionati di Data Science. C'è davvero un che di “magico” nel vedere una predizione materializzarsi da un set di dati che prima non avevano senso. Le persone appassionate sono spinte ad imparare e comprendere sempre di più del proprio campo, e questi sono gli elementi che voglio nella mia squadra.

Caratteristiche aggiuntive

Quando riesco a trovare un candidato che possieda tutti i tratti sopra elencati, sono abbastanza soddisfatto. Ma se trovo qualcuno che oltre a questi possiede un corredo di altre qualità che fanno sempre bene (e che menzionerò di seguito), vado al settimo cielo.

Il Data Scientist e le conoscenze teoriche

Le Data Science si fondano su un bel po' di matematica. Conoscere quella matematica permette a un data scientist di modificare il funzionamento interno degli algoritmi (in realtà non sempre c'è necessità di farlo nel machine learning applicato/pratico, però ogni tanto può essercene bisogno).
Conoscere le basi su cui è costruito un algoritmo di apprendimento o la teoria delle probabilità e le statistiche dietro un concetto può risultare inestimabile in alcuni casi, e sarebbe fantastico avere qualcuno in squadra in grado di applicare la conoscenza teorica ai problemi reali.

Il Data Scientist e i paper

Il campo delle Data Science è in continua e rapida evoluzione, nuove tecnologie e metodologie vengono fuori quotidianamente. Può succedere che una tecnologia in grado di apportare notevoli miglioramenti ad una applicazione di predictive analytics sia seppellita in un ostico paper accademico. Essere in grado di leggere e comprendere i paper può fare la differenza tra arrivare al punto di implementare la rete neurale convoluzionale del futuro, o restare ignorante fino a che essa non viene implementata in un framework di uso comune.
Considerate anche che non è importante diventare capaci di comprendere i paper in una sola sessione. Sono in molti a suggerire un approccio iterativo nei loro confronti.

Conclusioni

In qualità di data scientist e di recruiter per grandi aziende, tutto questo potrebbe sembrarvi controintuitivo. In effetti, quando mi occupavo di esaminare i candidati per posizioni di data scientist presso grandi e rinomate aziende della Silicon Valley, quasi tutto era improntato sulle conoscenze di statistica e della struttura interna degli algoritmi, e sulla risoluzione di sciocchi testi in codice. La cosa buffa è che alcuni dei candidati che ottenevano buoni risultati in questo tipo di colloqui non se la cavavano altrettanto bene nei loro compiti lavorativi quotidiani.
La ragione per cui pongo tanta enfasi sulle cosiddette soft skill è prima di tutto perché, nel corso della mia carriera lavorativa dalla consulenza al softare egineering, al mondo delle startup alle Data Science, le persone che apportavano il maggior valore erano sempre quelle che riuscivano a dare una mano e lavorare bene con i colleghi intorno, indipendentemente dal loro ruolo funzionale.

Detto ciò, è importante possedere una solida base di competenze tecniche necessarie per le Data Science. La buona notizia è che tali competenze possono essere acquisite col tempo grazie alla pratica e alla disciplina, quindi, finché si è determinati ad impegnarsi per imparare e lavorare sodo, alla fine si riesce ad ottenerle.

ARTICOLO ORIGINALE:
Shanif Dhanani
What makes a good Data Scientist at a small company

Hai curiosità e motivazione verso il mondo dei Big Data? Scopri l'offerta formativa di Geeks Academy!

Corsi in formula serale/weekend:

Big Data Streaming Analytics

Data Science & AI with Python

Corso professionale della durata di sei mesi:

Big Data Junior Professional

Diventa un professionista del futuro!

LEGGI TUTTE LE NEWS