Datatieteilijä

 

Untitled-1

 

 

 

Datatieteilijä on kaikkein tunnetuin Big datan luoma ammattinimike. Datatieteilijällä yhdistyvät vahva osaaminen ohjelmoinnista, tilastomatematiikasta ja liikettoiminnassa. Työ on siis erittäin ammattitaitoista tekiää vaativa, ja kysyntää riittää. Datatieteilijä tuo Big datan esille ymmärrettävässä muodossa sitä tarvitseville, eli on siis välikäsi tiedon ja ihmisen välissä. Työllä on monia eri ulottuvuuksia ja se on kyselyiden mukaan tekijöilleen erittäin palkitsevaa. datascopeanalytics.com sivun blogi ”six qualities of a great data scientist” listaa kuusi heidän mielestä tärkeintä datatieteilijän ominaisuutta:

  1. Statistical thinking: Datatieteilijöiden on osattava seilata datan läpi ja muuttaa se luettavaan tietoon. Heillä on oltava tietämys ja heidän on nähtävä metsä puilta dataa tutkiessaan
  2. Technical acumen: Datatieteilijöiden on oltava teknisesti taitavia. Heillä on oltava hyvät ohjelmoijan taidot ja ymmärrys standardeista rakenteista.
  3. Multi-modal communication skills: Datatieteilijöiden on osattava muuttaa data luettavaan muotoon muillekin kuin vain datatieteilijöille. Heidän on osattava kommunikoida data tarinaksi.
  4. Curiosity: Datatieteilijän on oltava utelias. Data tulee nähdä suurena aarrekarttana, josta etsivä löytää aarteita. Mikäli tuota uteliaisuutta ei löydy niin joitan kokonaisuuksia voi jäädä kokonaan huomaamatta.
  5. Creativity: Datatieteilijän on oltava luova
  6. Grit: Datatieteilijöiden on kestettävä painetta ja työn vaativutta. Työ on erittäin vaativaa, joten sen suorittamiseen vaaditaan oikeanlainen asenne.

 

http://datascopeanalytics.com/blog/six-qualities-of-a-great-data-scientist/

http://blog.udacity.com/2014/11/data-science-job-skills.html

https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century/

Tiedonlouhinta

Data-Mining

 

 

 

 

 

 

 

 

Tiedonlouhinta on joukko menetelmiä, joilla pyritään oleellisen tiedon löytämiseen suurista tietomassoista. Tämä määritelmä ei rajaa käytettäviä menetelmiä: tiedon louhinta voi olla esimerkiksi algoritmi kuten klusterointi, neuroverkko, itseorganisoituva kartta tai korrelaatio algorimi. Myös jo datan visualisointia voidaan pitää tiedonlouhintana, koska se voi paljastaa datasta uusia perspektiivejä. Tiedonlouhintaa voidaan lähtökohtaisesti käyttää ainoastaan datan etsimiseen, ja sitä hyödynnetään varsinkin suurissa tietokannoissa. Tiedonlouhinta on melko keskeinen aihe Big datassa, koska ilman edistyneitä tiedonlouhinta menetelmiä suurikin määrä dataa voi olla yllättävän hyödytön. Datalouhinnan kuusi yleistä tehtävää ovat anomalioiden tunnistaminen, assosiointi opittujen sääntöjen perusteella, klusterointi joka yhdistää samankaltaiset datat toisiinsa, klassifikointi joka klassifikoi datan esimerkiksi sen laadun mukaan, regressio joka etsii datan jossa on kaikkein vähiten virheitä ja summarisointi jossa data muutetaan kompaktimpaan muotoon.

 

http://www.anderson.ucla.edu/faculty/jason.frand/teacher/technologies/palace/datamining.htm

http://www.laits.utexas.edu/~anorman/BUS.FOR/course.mat/Alex/

http://www.thearling.com/text/dmwhite/dmwhite.htm

Big Data

big-data

 

Big dataa hyödyntävät niin valtiot, yritykset kuin yksityishenkilöt. Mahdollisia big datan hyötyjä esimerkiksi yrityksille ovat toiminnan optimointi ja siitä seuraava rahallinen etu, tarkemmat tiedot päätöksentekoa varten, tarkemman kuvan saaminen tilanteesta, parempi mahdollisuus asiakaspalveluun, tulevan ennustaminen ja uusien mallien ja yhteyksien löytäminen mallintamalla. Big datalla voi siis olla loputtomasti eri käyttäjiä ja loputtomasti eri käyttökohteita. Se on kasvava voima, jolla on jo nyt suuri vaikutus kaikkeen ympärillämme.

 

http://www.bigdata.fi/ erään tutun henkilön sivu

http://www.sas.com/en_us/insights/big-data/what-is-big-data.html

Blogi

Word Cloud "Big Data"

 

Tervetuloa! Tämä on blogi joka on perustettu BDP 2015 kurssia varten. Blogi koostuu asiaan kuuluvasta tiedosta ja linkeistä.

Muista kirjautuminen
Unohtuiko salasana?
Luo oma blogi  Seuraava blogi