Az adatok ébredése, avagy a társadalom újragondolása az adatsokaság nyomán

2012. dec 20.



A Big Data –  vagyis a rendelkezésünkre álló óriási méretű adathalmazok – segítségével ma már betekinthetünk a társadalmi interakció mélyebb részleteibe, azok lejátszódására, és már nem csupán olyan adatokról beszélünk, mint értékesítési statisztikák vagy választási eredmények. Meghökkentő a változás, amivel szembesülünk. Tisztában lenni a piac összes mutatójával, a politikai játszmákkal, esetleg előre jelezni vagy kontrollálni azokat – nos, olyan ez, mint a prométheuszi tűz: egyaránt felhasználható jó és rossz célokra is. A Big Data, az adatok sokasága érdekes időket vetít előre. A vége az lesz, hogy teljesen újra kell definiálnunk a mai társadalmat.

ALEX „SANDY” PENTLAND úttörő szerepet játszik a nagy adathalmazok kutatásában, a társadalomtudományok, a fejlődő országok számára fejlesztett mobiltelefonok, egészségügyi berendezések és egyéb technológiák elismert szakértője. Egyike a legtöbbet idézett számítástechnikai specialistáknak a világon, a Forbes magazin pedig a világ 7 legbefolyásosabb adatbányász szakembere között listázza nevét. 

(SANDY PENTLAND): Úgy látszik, Tim O’Reilly-val egyetemben én vagyok ma a MIT szakértője, ha nagy adathalmazokról van szó, a Forbes magazin még a szakma legjobb 7 képviselője közé is nevezett. Nem tudom, mi ennek a jelentősége, de az biztos, hogy sajátos nézeteim vannak az adathalmazokról, és talán éppen ez az, amit az emberek hallani szeretnének.

Úgy gondolom, az adatok ereje abban rejlik, hogy az emberek hite, meggyőződése helyett azok tényleges viselkedéséről ad információt. A fogyasztók és a dolgozók viselkedéséről, új vállalkozások kilátásairól szól az egész. Nem arról, nem azokról az adatokról szól a történet, amit a Facebookon kiposztolsz, nem is arról, amit a Google segítségével keresel, pedig a legtöbb ember erre gondolna a „big data” hallatán; ugyancsak nem a vállalati belső folyamatok során keletkező adatokról van szó és nem is az RFID chipekkel gyűjtött adatokról. Azok az adatok, amikről most szólok, például a mobilodról vagy a hitelkártyádról származnak, melyek megmutatják, mely helyen tartózkodsz éppen, azok a „kis morzsák”, amiket magad után hagysz, bármerre is jársz a világban.

A morzsák útvonala az egész életedet elmeséli. Megmutatja az aktuális választásaidat. Ez alapjaiban más, mint amit a Facebookra kiírsz. Oda ugyanis azt írod ki, amilyen lenni szeretnél, amit el szeretnél hitetni magadról az emberekkel. Azt, hogy valójában ki vagy, sokkal inkább megmutatja, hogy hol időzöl vagy mit vásárolsz. Az adatok halmaza mindig valós cselekvéseket fed le, azok elemzése alapján pedig sokat tudunk meg a cselekvőről. Megtudhatjuk például, olyan ember vagy-e, aki visszafizeti a hiteleit, ahogy azt is, hajlamos vagy-e a cukorbetegségre.

Minderre az adatok azért képesek, mert a társadalmi környezet jelentősen befolyásolja, hogy ki is vagy. Ha látom, hogyan viselkedsz egy adott helyzetben, akkor hozzáképzelem, mit tennél egy másik szituációban, annak alapján, hogy melyik társadalmi csoport tagja vagy. Rengeteget lehet így megtudni az emberekről, még akkor is, ha ezek nem szó szerint jelennek meg az adatokban. Az emberek viselkedését nagyon meghatározza a társadalmi környezetük, az, hogy mit tartanak helyes viselkedésnek, és mi mindent tanulnak el egymástól.

Így az adatok sokaságának elemzése elsősorban a kapcsolatok megtalálásáról szól. Adott emberek kapcsolatairól és a viselkedési módok közötti összefüggésekről beszélünk most. Erre mindenütt találunk példákat. Az egyik tipikus példa a pénzügyi adatok elemzése. Most nem csak napjaink gazdasági és pénzügyi világválságáról beszélünk, hanem bármilyen kisebb mértékű és időtartamú válsághelyzetről. A válság nem másról szól, mint kapcsolatrendszerekről, kommunikációs formákról és elhibázott döntések soráról. Az adatok rávilágítanak azokra az apró részletekre, kapcsolódási pontokra, melyek a válságot okozhatták. Az adatok segítségével azt is megvizsgálhatjuk, hogy ezek a kapcsolatrendszerek hogyan működnek, és eléggé stabilak-e.

Az elképzelés, miszerint a válság középpontjában emberi kapcsolatrendszerek állnak, nagyon fontos, hiszen a kutatók eddig olyan módszerekkel próbálták értelmezni a pénzügyi krízist, mint a Complexity Science vagy Web Science. Ezek az elavult módszerek éppen az emberi tényezőt nem veszik számításba. A lényeg pedig abban rejlik, hogyan kapcsolódnak egymáshoz az emberek, hogyan képeznek együtt pénzügyi piacot, kormányt, vállalatot vagy bármilyen más társadalmi egységet.

A kapcsolatrendszerek fontosságára tekintettel Asu Ozdaglar és jómagam nemrég létrehoztuk a MIT Connection Science and Engineering központját, mely a MIT valamennyi részlegét összeköti. Ez a központ egyike a MIT újításainak, hiszen az emberek elkezdték megérteni, hogy a problémák gyökere az emberi kapcsolatrendszerekben keresendő, csak így lehet sikeres szállítmányozást menedzselni, hatékony energiahálózatot fenntartani vagy pénzügyi piacot működtetni. A piacok nem egyszerűen szabályokról és algoritmusokról szólnak, hanem emberekről és algoritmusokról együttesen.

A jövő sikeres társadalmi rendszereinek titka ennek megértésében rejlik. Túl kell lépni a komplexitás, az adatelemzés vagy a webes elemzés fogalomkörén, és az embereket is bele kell vonni a megfigyelésekbe. Az óriási adathalmazok ezt ígérik számunkra, betekintést kínálnak a mai technológiai társadalom rendszerébe. Ha az ember sikeresen megérti az összefüggéseket, akkor nekiláthat a hibák kiküszöbölésének és erősebb rendszerek kiépítésének. Talán sikerülhet olyan pénzügyi rendszert létrehozni, amely nem dől össze, olyan kormányt választani, amely működőképes, vagy olyan egészségügyi rendszert, amely tényleg végzi a dolgát.

A jobb, erősebb társadalmi rendszerek korlátai nem az adatok méretében vagy terjedési sebességében rejlenek. A lényeg nem azokban a dolgokban van, amire az emberek általában gondolnának. A kihívás abban rejlik, hogyan elemezzük a kapcsolatrendszereket az özönvízszerű adathalmazban annak érdekében, hogy erősebb rendszereket hozhassunk létre.

Új módszerek a rendszer tervezésére

A rendszerek fejlesztési lehetőségei korlátozottak. Az adatok sokasága oly mértékű, hogy bármilyen típusú kérdésre lesz egy jelentős, statisztikailag alátámasztható válasz. Ez pedig azt jelenti, hogy nem dolgozhatunk ezzel a módszerrel, hiszen majdnem minden adat releváns adatnak számítana! Ennek következményeképpen az évszázados „kérdezz-felelek” módszerünk nem életképes többé, és hanyatlásba is kezdett.

Az adathalmazok és a kapcsolati összefüggések tudománya nem szokványos piackutatási módszerek. Olyan korban élünk, ahol óriási befolyással bírnak az évszázados tudomány ismeretei, a módszerek pedig, amikkel rendszereket, szervezeteket vagy kormányokat alapítunk, eléggé bejáratottak már. Nem sok eredeti ötletről tudunk beszámolni a témában. A Big Data, a nagyméretű adathalmazok elemzési módszerével azonban valami új veszi kezdetét, valami, ami eltér a megszokottól.

A fals összefüggések megállapítása persze nem kerülhető el: „Azok az emberek, akik hétfőn autóval mennek dolgozni, hajlamosabbak elkapni az influenzát.” Ha hagyományos módszerrel elemzünk, akkor ez még igaz is lehet, de a kérdés az, hogy miért történik így? Szokványos dologról van szó? Vagy egyszerű baleset? Nem tudhatod. A hagyományos módszerek nem válaszolják meg ezeket a kérdéseket. Amire szükség van, az a rendszeres kapcsolatok, összefüggések felfedezése, erre pedig korábban nem volt példa. Nem elég többé, ha a laboratóriumi körülmények között született megfigyelésekre alapozunk, a való életet kell górcső alá vennünk.

A másik probléma az új módszer elfogadtatása az emberekkel. Ha működőképes kapcsolatot fedezünk fel, annak használatára szükség lesz az új rendszer kiépítésében, ennek kulcsa pedig az, hogy a szóban forgó emberekkel mindezt megismertessük és elfogadtassuk. A menedzsereknek és a vezetőknek tisztában kell lenniük a kapcsolatrendszer erejével. Folyamatos párbeszédre van szükség az adathalmaz szakemberei és az adott kapcsolatrendszer humán részvevői között, erre pedig nem sok példát látunk manapság. A menedzserek keveset tudnak a Big Data analitikáról, ezek elemzésének módszeréről, azok eredményéről és jelentőségéről.

Sőt mi több, maguk az adatelemzők sem rendelkeznek túl sok intuícióval – ez nagy probléma. Egy becslésben nemrégiben kimutatták, hogy a gépi tanulási módszerekből kinyert adatok – mely egy kulcsfontosságú kutatási terület – 70-80%-a nem megbízható, mert a kutatók nem vették figyelembe, hogy túllépték a megadott korlátokat. Nem figyeltek az ösztöneikre, csak a hagyományos módszer mentén dolgoztak. Elvégezték a munkát, kaptak egy szép eredményt, amit publikáltak is, a kritikusok pedig nem figyeltek fel a hibára. Ez elég nagy probléma, hiszen ha most ennek alapján terveznénk meg bármit is a világban, akkor olyan vonataink lennének, melyek falakba ütköznek, és hasonló irreális dolgok. Az adatok sokaságának elemzése még radikálisan új módszernek számít.

Az elmúlt évben Davosban számos ülést vezettem le vezető vállalatok ügyvezetőivel a témában, és egyértelművé vált, hogy az adathalmaz elemzése egy új, fejlődésben lévő módszer. Néhány cég, mint a Palantir vagy a TIBCO sikeresnek tűnik benne, de a többségnek mindez még nagyon új, és még nem pörögtek fel eléggé hozzá.

Egy másik gond a nagy adathalmazokkal kapcsolatban az, hogy ezek az adatok többnyire embereket takarnak, felmerül hát a magánélet, a személyi adatok védelme és azok ellenőrzése. Az adatok sokaságának használata támadási felületet is jelent, egyfajta „Nagy Testvér mindent lát” pozíciót. George Orwell sem volt ilyen kreatív, amikor az 1984-et írta.

Az utóbbi évek során ugyancsak számos ülést vezettem le a World Economic Forumon a személyi adatok védelme témakörében. A munkánkat sikeresnek értékelem, hiszen megszületett az általam „New Deal on Data”-nak hívott megállapodás. Az amerikai Federal Trade Commission első embere, aki az üléseken is részt vett, tevékeny szerepet töltött be a „Consumer Data Bill of Rights” benyújtásában, míg az Európai Unióban az emberjogi biztos az alapvető emberi jogok szintjére emelte a személyi adatok védelmét.

Mindkét szabályozás nagyobb hatalmat adott az egyének kezébe, ami a személyükről szóló adatokat illeti. Ez a lépés kulcsfontosságú volt az adathalmazok biztonságosabbá és átláthatóbbá tételében, csakúgy, mint annak elérhetőségében, hiszen az emberek most már eldönthetik, mit osztanak meg magukról. A fejlődés óriási azokhoz az időkhöz képest, amikor az adatok egész sora volt elzárva úgy, hogy senki nem is tudott azok létezéséről.

Kié az adat?

Hogyan hívhatjuk hát elő ezeket az adatokat a raktárakból? Az első lépés, hogy megtudjuk, egy adott információ kihez tartozik, ki birtokolja. Vajon a mobiltelefon-szolgáltatóé-e az információ, csak mert képes megfigyelni, merre járunk? Talán valamennyire tényleg az övé. A vita lényege azonban az, hogy az adatok után járó anyagi juttatás kit illet meg? A telefonszolgáltatóknak jogukban áll másolatot készíteni az adatokról, de te, csakis te mondhatod ki a végső szót azokkal kapcsolatban.

Vannak persze bonyolult szituációk. Mi van akkor, ha egy kereskedelmi ügylet adatairól van szó? Akkor bizony a kereskedés mindkét résztvevőjének vannak jogai. Azzal, hogy kijelölöm az adatok tulajdonosát (ez persze más, mint a jogi tulajdonviszony), legitimmé teszem az adatok raktárakból való kiszabadítását. Személyes vagyontárgyat csinálok így az adatból, melynek cseréjéért megfelelő ellenszolgáltatást várhatok. Olyan rendelkezésre álló eszköznek minősülhet így az adat, amely közreműködhet kormányzati, társadalmi, nonprofit rendszerek megalkotásában. Ilyen jövő felé haladunk előre.

Van-e bármilyen ellenvetés? Meglepően kevés. Az internetgeneráció szülöttei lehetnek a legnagyobb ellenzők, hiszen (nem megbántva őket) olyan világban szocializálódtak, ahol a Facebook vagy a Google teljesen szabályozatlan és szabad. Azt képzelik, hogy rendelkeznek az adatokkal, amiket megosztanak, de lassan, nagyon lassan rá kell döbbenniük, hogy ebben a kérdésben kompromisszumokra lesz szükségük.

A legértékesebb adathalmazzal a bankok, a telefonszolgáltatók és a (egészségügyi) biztosítók rendelkeznek, ezek mindegyike erősen szabályozott iparág. Ennek az a következménye, hogy nincsenek olyan befolyással az adathalmazra, mint szeretnének, kivéve, ha a fogyasztók vagy az előírások által betekintést nyernek. A terv a következő: az adatokkal való rendelkezés jogát teljes egészében a fogyasztók kezébe adják, cserébe azért, hogy folyamatosan ajánlatokkal bombázhassák őket az adatok felhasználásáról.

Ily módon ezek a cégek ki tudnak bújni az előírások alól. Ezáltal bekerülnek a jófiú szerepkörébe, hiszen szabad kezet adnak a fogyasztóknak, illetve könnyebben tudnak pénzt csinálni, ami pedig a fő szempont számukra. Úgy tűnik, hogy ha ilyen tisztelettudó módon kezeli egy cég a fogyasztói adatokat, úgy azok sokkal hajlamosabbak lesznek azok megosztására. A személyi adatok védelme szempontjából is nyerő a taktika. A módszer legnagyobb ellenzői azok a cégek, amelyek szabályozatlan piaci környezetből jönnek, vagy éppen a feketegazdaságban próbálnak érvényesülni.

Van viszont példa olyan szolgáltatási ágazatokra, ahol a személyi adatokat már ilyen tiszteletteljes módon kezelik. Ilyenek a jelszó nélküli személyazonosító rendszer vagy a különböző közlekedési és egészségügyi személyi szolgáltatások. Mindezek az ágazatok szerkezeti átalakuláson mennek keresztül. Minél több specifikus adatot tudunk meg az egyes személyekről, annál sikeresebb rendszereket teremthetünk.

Ez az a drasztikus társadalmi átalakulás, amiről korábban szóltam. A mai társadalmak állandó mutatókra és számadatokra épülnek, például ez a társadalmi osztály ezt és ezt csinálja, ez a piac erre és erre mozdul el. Valójában azonban minden társadalmi rendszer interakciók hosszú sorából épül fel, az adathalmaz-elemzés pedig lehetőséget ad számunkra, hogy olyan rendszereket hozzunk létre, melyek működőképesek, ahelyett, hogy a megszokott sémákhoz ragaszkodnánk.

Az információs korlátokkal küzdő szervezetek hanyatlása

Hosszú és göröngyös volt az idáig vezető út. A gépi jelfeldolgozás megfigyelésével indítottam. Pszichológiai háttértanulmányokat is folytattam, mindig is érdekelt, hogy emberek és adatok hogyan alkotnak önálló társadalmi egységet. Így született meg az első hordozható mérési eszköz a piackutatásban. A Google szemüveg projektje is az én csapatomból származik, a volt tanítványaim ötlete az egész. Mindezeket tanulmányozva arra jutottam, hogy a lényeg nem a hordozható eszközökben vagy a felhasználói felületben, hanem az adatok halmazában rejlik. Később, ahogy a mobiltelefonok térhódítása megkezdődött, egyértelművé vált, hogy a világ legnagyobb adatforrásának ők lesznek a hordozói.

Ha a világ összes emberét minden pillanatban megfigyelhetnénk, hol vannak, mit csinálnak, kivel vannak éppen, akkor egy alapjaiban más világot hozhatnánk létre. Ekképpen meg lehetne reformálni a közlekedést, az energia felhasználását vagy az egészségügyet, ezek mind-mind drasztikus javuláson mennének keresztül. A jelek és emberek együttes értelmezésének múltja, az emberek együttműködési formáinak megfigyelése és az emberi viselkedésről rendelkezésre álló adatok tanulmányozása ébresztett rá arra, hogy korszakváltás küszöbén állunk. A társadalmi osztályok és piacok rendszere után az egyéni interakciók és új típusú, az adat megosztására épülő rendszerek felé haladunk.

Ebben az új világban George Orwell egy fantáziátlan kívülálló. Tiszta sor, hogy a személyi adatok védelme, azok tulajdonjoga nem kerülhető meg többé. George Orwell nem tudhatta, hogy ha megfigyeljük az emberek viselkedésmintáit, abból kitalálhatjuk, kire fognak szavazni a következő választáson, vagy éppen hogyan fognak reagálni egy adott szabály megváltoztatására és így tovább. Felépíthetünk egy olyan világot, mely – első ránézésre – az ördög birodalmának tűnik. Bizony lesznek is olyanok, akik rossz célokra használnák fel ezeket az adatokat.

Az új, adatokra épülő világ képe mégis ígéretes. Vegyünk egy példát: a leghatékonyabb, legerősebb építmények azok, amelyek nem rendelkeznek középpontokkal. Átvitt értelemben ez azt jelenti, hogy ha a rendszerben megjelenik egy diktátor, annak nincs lehetősége magához ragadni az irányítást. Az ilyen rendszer megosztja az állami hatalmat és a versenyszféra hatalmát is, hiszen éppen a megosztás teszi lehetővé a hatékonyságot és működőképességet. Mindezt anélkül, hogy a ma létező információs korlátok fennmaradnának.

Ez azt jelenti, hogy egy szolgáltatás-központú kormányzat – ha lenne ilyen – vagy egy szolgáltatást előtérbe helyező szervezet jobb ajánlatokat fog kapni alacsonyabb áron (az emberektől, személyes adataik felhasználására vonatkozóan), mint azok, akik hatalmat akarnak gyakorolni a fogyasztó vagy az állampolgár felett. Arra számítok, hogy az erős információs korlátokkal bíró szervezetek hanyatlásba kezdenek, mert nem bírnak majd versenyre kelni azokkal, akik nem kívánják birtokolni fogyasztóik adatait.

Piackutatás Hírek, www.piackutatas-hirek.hu





Posted by NRC Marketingkutató in : Egyéb,

Kapcsolat

NRC Kft. 1034 Budapest, Kenyeres utca 28. www.nrc.hu

piackutatas@nrc.hu
Facebook Twitter

Küldjön üzenetet nekünk!