Anteeksi, mutta olisiko sinulla hetki aikaa puhua datasta?
Viikonlopun runtelemia aivosynapseja sytyttelee tällä kertaa avoin data ja Big Data (konsulttipiireissä nykyisin vain data). Tuttuun tapaan heti alkuun avaan teille äidin pikku simasuille kirjoituksessa käsiteltävät termit eli esittelen muiden mielipiteitä kylmän rauhallisesti ominani. Loppusilauksen kirjoitukselleni antaa avointa dataa taitavasti alustassaan hyödyntävä suomalainen kasvuyritys nimeltään Vainu. Turvavyöt kiinni!
Big datalla viitataan suuriin järjestelemättömiin, jatkuvasti lisääntyviin tietomassoihin, joita kerätään, säilytetään, jaetaan, analysoidaan ja etsitään. Big Datan konkreettinen määritteleminen on melko hankalaa, kuten edeltävästä lausehirviöstä voitte päätellä, eikä sillä ole vakiintunutta yksiselitteistä määritelmää. Big Dataa kuitenkin yhdistää kolme tunnusomaista piirrettä, jotka ovat:
Määrä (volume), suuren datamäärän johdosta se ei ole käytettävissä yleisesti käytössä olevilla laiteilla järkevässä ajassa
Nopeus (velocity), dataa kertyy eri muodossa monista eri lähteistä ja se kasaantuu sekä muuttuu nopeasti
Monimuotoisuus (variety), datalla ei ole välttämättä mitään selkeää rakennetta, minkä vuoksi sen analysointi sellaisena on erittäin vaikeaa
Avoimella datalla viitataan julkiseen vapaasti ja maksuttomasti hyödynnettävään tietoon, jota tuottavat muun muassa julkishallinto, organisaatiot ja yritykset. On kuitenkin hyvä erottaa julkinen tieto ja avoin julkinen tieto, eli avoin data. Avoin data eroaa julkisesta tiedosta siten, että avointa dataa voivat yritykset ja kansalaiset käyttää omiin tarkoituksiinsa tasavertaisesti julkishallinnon kanssa. Puolestaan kaikkea julkista tietoa ei saa käyttää vapaasti ja maksuttomasti omiin tarkoitusperiin. Esimerkiksi verkkojulkaisun maksullisia uutisia ei saa käyttää vapaasti, vaikka ne ovat julkista tietoa. Toisin sanoen kaikki avoin data on julkista tietoa, mutta kaikki julkinen tieto ei ole avointa dataa.
Avoimeen dataan liittyy 4 pääperiaatetta, jotka ovat:
Julkisuus; dataa käyttäessä kenenkään yksityisyydensuoja tai turvallisuus ei saa vaarantua. Datan on siis oltava julkista tietoa
Koneluottavuus; data on esitetty sellaisessa muodossa, että sitä on helppo käsitellä erilaisilla tietokoneohjelmistoilla
Uudelleenkäytön sallivat lisenssiehdot; käyttöehdoissa lukee selkeästi, että datan luoja sallii aineiston uudelleenkäytön
Maksuttomuus; dataa voidaan käyttää maksuttomasti, mikä vähentää datan käyttöön liittyviä kuluja ja mahdollistaa erilaiset datan hyödyntämiseen liittyvät kokeilut
Pitkän ja puuduttavan terminologian jälkeen pääsemmekin konkreettiseen esimerkkiin siitä (yleisön pyynnöstä, siis hieman lisää dataohjautuvaa myyntiterminologiaa), kuinka avointa dataa hyödyntämällä voit viedä yrityksesi Nordic Startup Awardseissa kahdessa eri kategoriassa ykköspalkintopallille. Näin on toiminut kasvuraketti nimeltään Vainu, jonka luoman cloud-pohjaisen alustan avulla yrityksien perinteinen myyntiliidien prospektointi on jäänyt historiaan. Vainun platformin idea on muuttaa epäjärjestelmällistä avointa dataa asiakasyrityksille myyntiliideiksi. Vainu hyödyntää yli 108 miljoonan yrityksen yritystietokantaa ja avoimen datan lähteistä kerättyä yritysdataa, joka koneoppimisalgoritmien avulla muodostetaan yrityksille ajantasaisiksi myyntiliideiksi. Vainu luo lisäarvoa yritykselle tästä syystä muun muassa ajansäästön, paremman hit raten ja lisämyynnin merkeissä, koska alusta tekee prospektoinnin asiakasyrityksen puolesta ja itse yritys voi keskittyä pelkästään myyntiin.
DISCLAIMER: Allekirjoittanut pelaa jalkapalloa samassa joukkueessa Vainun CEO:n, Client Managerin ja Head of Real-Time Salesin kanssa.
https://www.sovelto.fi/ratkaisut/ict-ja-uudet-teknologiat/big-data/
https://hri.fi/fi/ohjeet/mita-on-avoin-data/
https://product.vainu.io/fi/