Kuidas kasvada andmeteadlasena

Milliseid oskusi peate Jr.-st Sr.-i arendajaks saamiseks

autor Ben Rogojan

Foto autor Austin Distel saidil Unsplash

Andmeteadlase roll on endiselt erinev ettevõttes ja isegi meeskonnas. See teeb ettevõtetele oma teadlaste jaoks standardiseeritud kasvuplaani koostamise palju raskemaks.

Ilma selget kasvuplaani omamata on oht, et need andekad arvutiviisardid takerduvad. Need võivad pakkuda häid teadmisi, kuid nad ei kasva kunagi ja pakuvad tõelist investeeringutasuvust, mida nad peavad pakkuma ettevõttele või, mis veelgi tähtsam, iseendale.

Seda silmas pidades vestles meie meeskond Seattle'i ümbruse juhtidega, kes töötavad tipptasemel tehnoloogiaettevõtetes, et teada saada, mida nad oma vanematelt andmeteadlastelt soovisid ja ootasid. Tahtsime jagada õpitud teavet nii andmeteadlaste kasvamiseks kui ka abiks juhtidele, kes proovivad oma uusi andmeteadlasi kasvatada.

Arutelude põhjal tuvastasime, et asi ei olnud programmeerimises ega algoritmide kavandamises (see oli noorema andmeteadlase lähtepunkt). Kui küsisime nendelt juhtidelt, mida nad oma vanematelt andmeteadlastelt näha tahtsid, teatasid nad meile, et tahavad ajendatud isikuid, kes suudavad suhelda lühidalt, kes suudaksid ise mõelda, kellel on ettevõttest kindel arusaam ja kes on võimeline hakkama saama.

Andmeteadlase kasvamiseks tuleb neid vaidlustada väljaspool nende töö tehnilisi aspekte. Andmeteadlastel on võimalus ettevõtte otsuseid mõjutada. Neil lasub palju vastutust. See tähendab, et nad peavad oma töö enda kanda võtma. Nad peavad küsitlema oma andmeallikaid, olema kokkuvõtlikult sisemised, tundma oma ettevõtet ja aitama juhtidel juhendada.

Ärge vaidlustage oma järeldusi, vaidlustage oma andmeid

Vanemad andmeteadlased ei usalda pärast andmete saamist lihtsalt nende andmeid. Nad torkavad ja produtseerivad seda näiteks erapoolikuse, puuduvate andmete, dubleerivate andmete jne jaoks.

Andmetel on kindlasti keeriseid. Neile, kes veedavad tunde ja tunde andmetes, teate, mida ma ütlen. Andmeid kerides või graafikuid tehes näete imelikke mustreid, mis panevad teid peatuma ja ütlema: „Ma ei tea, miks x näeb välja nagu z“. Nooremad andmeteadlased on sageli liiga keskendunud projekti lõpetamisele. Nad pole õppinud, kuidas neid kummalisi mustreid peatada ja neid päriselt analüüsida. Neid mustreid võivad põhjustada süsteemid, mis vaikespetsiifilised andmeväljundid nagu -1 või 1, või võib-olla isegi erapoolikud andmed, mis on põhjustatud robotite ostmisest, mis võivad moonutada seda, mida kliendid tegelikult e-poe saidil ostavad, ja tuhat muud usutavat eksitava põhjuse põhjust. andmed.

Need mustrid ei ole tingimata valed või halvad andmed. Isegi kui andmed on täpsed, on alati toimivaid pöördeid. Aruannete, algoritmide ja mõõdikute kavandamisel tuleb neid arvestada. Kogenud andmeteadlane mitte ainult ei otsi neid andmete keeriseid, vaid eeldab neid.

Mõistet tõde allikas paisatakse andmetiimides palju ümber. See viitab algsele andmeallikale, mille kohta mitu meeskonda on otsustanud, et see on õige. Olin andmeteadlasena alustades väga naiivne. Minu ühe esimese projekti puhul teatati mulle andmeallikast, mille meie meeskond oli tõe allikaks nimetanud. Kuude kaupa töötasin analüüsi ja rakenduste arendamisel meie “Tõe allikas”, et aidata enam kui 200 juhil ja direktoril neile andmetele juurde pääseda. Muidugi ei läinud liiga kaua enne, kui muude mõõdikutega oli probleeme järjepidevusega. Just siis mõistsin, et olen töötanud tõeallikast mitme ETL-i andmeallika kallal.

Seattle'i tehnoloogiajuhtidega rääkimine on see tavaline teema. Noored analüütikud, andmeteadlased ja arendajad usaldavad oma andmeallikaid ülemäära. Tavaliselt on noored, vähem kogenud töötajad, kes tahavad tööd teha. See viib tahtmatult väiksema arusaamiseni sellest, mis andmed tegelikult on. Selle asemel, et küsida, miks nad kulutavad rohkem aega toote „funktsioonide” tagamisele, jäävad nad andmepikenduste märkamisele.

Andmeteadlasena kasvamiseks peate loobuma lihtsalt toote või algoritmi "nõuetele vastavuse" kontrollimisest ja enda omandisse võtmisest. Andmete ja nende keerukuste mõistmise eest peate vastutama. Nii saate oma juhi või direktoriga täielikult suhelda kõigi teie tehtud eeldustega. Andmeteadlane ei saa tõepoolest kasvada, kui süüdistab andmete halbu väljundeid.

Oskake oma järelduste väärtust lühidalt öelda

Andmeteadlasena kasvamiseks peate laienema kaugemale kui programmeerija / statistik. Peate õppima, kuidas suhelda, ja peate omandama oskuse lühidalt avaldada oma järelduste väärtust ning ka seda, mida teie direktor peaks selle teabega tegema.

Võib olla ahvatlev esitada direktoritele ja juhtidele kõik graafikud, kõik andmed ja kogu tehniline teave, mis meie uurimistöö käigus koguti, et tõestada, et me tegelikult tööd teeme. Eriti infoteaduses, kus mõnikord kulub mõne probleemi (mõjuval põhjusel) väärtusliku sammu tegemiseks mõne kuu jooksul. Kuid kõige selle lõppedes ei taha režissöörid liigset teavet.

Kõik, mida lavastaja soovib, on olulised punktid ja nad tahavad teada, mida nad peaksid nendest punktidest lähtudes tegema. ROC-ist edasi rääkimine ja see, miks kasutasite ühte või teist algoritmi, ei ole mänedžerile või direktorile koos 8 teise meeskonnaga haldamiseks eriti abiks. Enamasti leiame, et juhid tahavad tõesti vaid 2–3 lühikest punkti. Mõnikord on isegi lihtsalt "jah" või "ei" parem kui "Võib-olla nendes tingimustes ... must häm ... võimalusel on need riskid, teisel võimalusel on need riskid ..."

Kogenud andmeteadlased teavad, kuidas aidata oma haldurit, pakkudes destilleeritud toimingutega lihvitud teadmisi. Kui haldur soovib rohkem teada saada, küsivad nad (ja hea andmeteadlane saab vastuse). Lõppkokkuvõttes ei taha juhid olla hõivatud lisateabega, mis ei aita neil häid otsuseid vastu võtta.

Tunne oma ettevõtet

Iga kord, kui andmeteadlane alustab uut tööd, on mõistetav, et nad ei saa uue tööpäeva kõigest aru. Lisaks vaid andmeallikatele, koodialustele ja muudele ettevõttespetsiifilistele süsteemidele on veel palju õppida. Nad peavad tundma õppima igapäevaseid andmeid andmete kohta, millega nad töötavad. Samuti peavad nad mõistma ettevõtte ees seisvaid probleeme. Kuid kogenud andmeteadlased peaksid olema võimelised ettevõttest kiiresti aru saama.

Ärge keskenduge oma tehniliste oskuste lihvimisele nii palju, et ärite õppima. Õppige, kuidas töötada erinevate meeskondadega, osaleda projektides ja lubada end usinalt juhendada. Andmeteadlased võivad pärast projekti mitut eri tüüpi teema käsitlemist visata ja nad peavad olema võimelised kiiresti kohanema.

Jr. arendajad keskenduvad sageli palju rohkem oma tehniliste oskuste ja äritegevuse mõistmisele. Sarnaselt paljudele teistele ametitele, kus jahmatus (sel juhul kodeerimine, andmete puhastamine jne) toimub madalamal tasemel. See ei jäta neile aega põhjalikuks mõistmiseks, kuidas nad saavad äri aidata.

See on aga andmeteadlase esimestel aastatel oluline etapp, tagamaks, et nad omandavad laia tehniliste oskuste kogumi. Kogenumad andmeteadlased peavad rohkem keskenduma oma projekti põhjustele. Kui juht ei sea oma kogenumate andmetöötlusmeeskondade liikmetele väljakutseid ettevõtte laiendamiseks ja õppimiseks, siis on mõneti nende süü kasvu vähesuses. Igal aastal või iga paari kuu tagant peavad juhid aitama vaidlustada kogenumaid andmeteadlasi, et olla kindel, et nad tõesti kasvavad. Vastasel juhul kaotab ettevõte maksimaalse investeeringutasuvuse.

Hallake üles

Üles hakkama saamine on igas distsipliinis raske. Tehnilistel erialadel võib see mõnikord olla keeruline, sõltuvalt juhi tehnilisest taustast. Ettevõttele keskendunud juhtidel ei pruugi olla tehniliste meeskondade juhendamise kogemust. See muudab kogenud andmeteadlaste jaoks ülioluliseks oskused toimetulekuks.

Andmeteadlane, kes oskab hästi hakkama saada, mõistab inimesi. Hallamine nõuab andmeteadlastel (või kellelgi selles küsimuses ükskõik millises ettevõttes) aega ülemuste vajaduste mõistmiseks. Mitte ainult seda, mida ettevõte vajab. Mida ülemus sinult ja endalt soovib? Kui olete sellest aru saanud, saate aru, mis neid juhib. See võimaldab andmeteadlasel enne ülemuste palumist oma ülemuste vajadusi ette näha. See aitab arendada usaldust, aga ka täiendavaid investeeringuid teie juhtidelt ja direktoritelt. See maailm ei tähenda ainult teie kasvu. Juhid tahavad ka kasvada! Nagu kogenud (keegi) teate, tähendab see, et ka teiste kasvamine ja eesmärkide saavutamine aitab teil võita.

Kokkuvõte

Andmeteadlastelt oodatakse enamat kui lihtsalt algoritmide loomist ja suurte andmekomplektide haldamist. Kogenud andmeteadlaste väärtus ei tulene mitte ainult nende tehnilistest võimetest, vaid ka nende pehmest lihvimisoskusest. Teadlaste loodud teave ja algoritmid tõukavad kõrgema juhtkonna otsuseid. Seega peab direktorite ja asepresidentide, kes haldavad miljoneid kuni miljardeid dollareid inimesi, ressursse, seadmeid, projekte… ja kõike muud ettevõttes, aru saama kõik, mida nad pakuvad. See tähendab, et selleks, et andmeteadlane kasvaks ettevõtte väärtuses, peavad nad õppima, mida ettevõte väärtuslikuks peab.