Az óriási adathalmazokban rejlő lehetőségek

2012. dec 20.



Egy perc végtelenül sok idő. Ez alatt 204 millió emailt küldenek el, 2 millió keresést futtatnak le, 100 000 bejegyzés születik a Twitteren és 48 órányi videotartalom kerül feltöltésre a Youtube-on, legalábbis a Domo nevű üzleti intelligencia platform felmérése szerint. Mindez azonban csak töredéke az adatok sokaságának. Az IDC és az EMC számításai szerint 1,8 zetabájt adat született az elmúlt évben, ez a szám pedig 2013-ra meg fog duplázódni.

Ez már a „big data” (óriási méretű adatbázisok) világa – és ez az, ami változásokat hoz majd minden cégnél. Miért is? „Az adathalmazok olyan hatalmas mennyiségű insight biztosítását ígérik, melyeket hagyományos módszerekkel nem lehet elérni” – mondja Colin Strong, az egyesült királyságbeli GfK technológiai divíziójának vezetője. Ezek az insightok pedig alapjaiban változtathatják meg a szakmát. A Deciding Factor c. magazinban megjelent Capgemini-féle 2012-es kutatás szerint a vállalatvezetők azt várják, hogy az adathalmaz-elemzés módszere a cégük összteljesítményét 41%-kal növeli majd a következő 3 évben.

A módszer nagyon izgalmasnak tűnik. A Gartner hypeciklus-elemzése (divatos módszerek életgörbéje) a csúcshoz közeli helyre teszi az adathalmaz-elemzés módszerét. Persze az ellenzők tábora is jelen van, ahogy David Pittman, az IBM közösségi média stratégiai szakembere fogalmaz. „Kutatásaink szerint jelenleg a cégek kb. 30-40%-a használja a módszert” – mondja Pittman.

A szakember úgy véli, sok vállalat még a ”vizsgálódás fázisában” tart. Akár igazat adunk ennek, akár nem, az SSI vezetője, Pete Cape szerint „a piackutatók nem tehetik majd meg, hogy elutasítsák az új módszert. Miért is fizetnének az ügyfelek egy kb. ezer embert vizsgáló, szervezett kutatásért, ha fogyasztók millióinak adatai várakoznak elemzésre?”

Digitális melléktermék

A piackutatók a félelem, az irigység és az ármány különleges elegyével fordulnak az új módszer felé. Néhányan fenyegetésnek érzik azt – úgy vélik, az adathalmaz-elemzés a kérdőíves módszert feleslegessé teszi –, mások pedig lehetőséget látnak benne. Cape szerint általánosságban elmondható, hogy „a módszerre gondolni fejfájást okoz mindenkinek”.

Igaza van abban, hogy a módszer túl jelentős ahhoz, hogy figyelmen kívül hagyható legyen. Az is igaz, hogy annak felhasználását tekintve sem lehet teljesen sikeres, hiszen túl sok az adat, túl zavaros és túlságosan szétszórt. Az óriási adathalmazt a McKinsey Global Institute találóan ”digitális melléktermék”-ként jellemezte; az adat a fogyasztói magatartás megfigyelése során születik: weboldalakon való szörfözés, ételrendelés, Facebook- vagy Twitter-posztok során.

Cape szerint az óriási adathalmaz „olyan adatok halmaza, melyeket minden irányból halásztak össze”. Bob Groves, az USA korábbi népszámlálási biztosa a Tree Eras of Survey Research c. írásában „organikus adat”-nak nevezte a halmazt, megkülönböztetve a piackutatás során összegyűjtött „tervezett adatoktól”.

„Az általunk feltett kérdések előre meghatározott adatok megszerzésére irányulnak” – írja Groves. „Ennek értelmében a hasznos információ összes adathoz viszonyított aránya nagyon magas, a legtöbb organikus adathoz képest.”

„Napjaink jelentős változása, hogy az organikus adat mennyisége az internet kiegészítésének köszönhetően nő, míg a tervezett adatok mennyisége folyamatosan csökken. Ezzel exponenciálisan megnő az adatok és az információk összekeverésének esélye.”

A nagyobb nem biztos, hogy jobb is



Sokan egyetértenek Groves megállapításával, miszerint attól, hogy óriási mennyiségű adatod van, még nem biztos, hogy ez nagy mennyiségű fogyasztói insightot is jelent, ami csak arra vár, hogy felfedezd. Danah Boyd, a Microsoft piackutatója a Six Provocations for Big Data c. írásában (társszerzője Kate Crawford a dél-walesi egyetemről) így fogalmaz: „a gond az, hogy az általános vélekedés szerint minél nagyobb, annál jobb, és minél több, annál minőségibb.” Szerinte a valóságban a helyzet az, hogy „az adatok mennyiségének igazodnia kell a kutatási igényekhez: a kevesebb néha több”.

„Divat manapság azzal hencegni, hogy milyen sok adat áll rendelkezésünkre” – mondja David Boyle, az EMI Music és a Zeebox fogyasztói insight szakembere. „Pedig nem éppen ez a sikeres üzlet titka.” A Big Data Insight Group idei konferenciáján Boyle arról beszélt, hogy az adathalmaz-elemzés lefolytatásának első lépése az, hogy megfogalmazzuk, milyen kérdésre keressük a választ, és megtaláljuk az ehhez szükséges adatokat.

„Tudnod kell, mely adatok elérhetőek, melyek lehetnek a jövőben elérhetőek, illetve melyeket szabad felhasználni” – mondja. „Nem fogsz olyan adatot használni, amely a nem megfelelő felhasználóké. Ha tehát a mainstreamet kívánod vizsgálni, jobb, ha nem a Twitter-adatokat böngészed. A Twitter felhasználói ugyanis nem a mainstream, hanem egy speciális csoport részei.”

Mindeközben azt sem szabad figyelmen kívül hagyni, hogy legyen bármekkora az adathalmaz, csak annyit ér, amennyit az adott fogyasztóról elárul számunkra. Doug Edmonds, a 2CV ügyvezetője az adathalmazokat a Google kezdeti napjaihoz hasonlította: „A Google kezdetben arról szólt, hogy borzalmas sok infója volt mindenféléről, amikhez persze csak akkor jutottál hozzá, ha beírtad a szót, és leütötted az entert.”

„Ez az adathalmazok lényege. Nagyon széles körű összefüggéseket is tartalmaz, de a lényeg abban rejlik, hogy a fogyasztók életének legkisebb szegleteiben tapasztalt viselkedést meg tudja-e mutatni?”

Talán a legjelentősebb kritika az adathalmazokkal szemben az, hogy az egész nem más, mint adatok hosszú sora a jelentős részletek hiányában. Akár egy történelemkönyv, ami felsorolja, mi minden történt a múltban, anélkül, hogy megmagyarázná, miért. Vegyük például a fogyasztói hűség kérdését: megmutatja, hogy az adott fogyasztó mi mindent vásárolt évekre visszamenően, de nem tud magyarázattal szolgálni arra, amikor ugyanez a vásárló hirtelen megváltoztatta véleményét.

„Egy Coca-Cola-fogyasztó hirtelen áttérhet a Pepsire különböző okokból anélkül, hogy ezt a múltbeli viselkedése alapján előre jelezhettük volna” – mondja Cape az SSI-től. Talán meg lehet magyarázni a váltást utólagosan a vásárlási mutatók alapján, azaz megfigyelni, mikor kezdett el a fogyasztó új terméket vásárolni vagy váltott olcsóbb változatra (talán új lakótársa lett, vagy éppen elveszítette az állását?), ezek azonban csak találgatások.

Látásmódbeli különbségek

A „mi ez?” sosem ugyanaz, mint a „miért?” – mondja Colin Strong a GfK részéről, aki gyakran világít rá a tartalmi hiányosságra, mint az adathalmazok gyenge pontjára. „Az adathalmazos módszer megközelítésének lényege, hogy meglegyen a bizalom az elemzést végző szervezetek felé. A baj ott kezdődik, hogy az elemzés sokszor nem pontos.”

Példaként említi meg egy adatelemző esetét, aki a legkülönbözőbb emberek közötti kapcsolatrendszert vizsgálta egy adott hálózaton belül. Strong így vélekedik: „Könnyen úgy találhatjuk, hogy a találkozások gyakorisága egyenlő a kapcsolat erősségével. Tudjuk azonban, hogy ez nem igaz. Ha az lenne, akkor a legszorosabb kapcsolat a munkatársainkhoz fűzne minket, ez pedig bizony nincs így.”

Az adathalmaz-elemzés arra is lehetőséget ad a cégeknek, hogy saját fogyasztói körükön kívüli adatokról is tájékozódhassanak – csak egy részükről persze, hiszen jellemző, hogy minden cég foggal-körömmel védi a saját, kereskedelmi szempontból értékes adatbázisát. Valójában Edmonds veszélyt sejt ebben a dologban, hiszen az adathalmaz-elemzés elterjedése elvonhatja a cégek figyelmét a lényegről. „Az adathalmazokban óriási erő rejlik” – mondja – „De emellett képes lehet bizonyos cégeket gyengíteni is.”

David Boyle tisztában van a kockázattal. Az EMI Musicnál végzett munkája során számos adathalmazhoz van hozzáférése, beleértve a Spotify streaming adatait is. „Adatok billióiról van szó, az adatmániás emberek számára ez maga a paradicsom” – mondja. „A gond az, hogy specifikus adatokról van szó. A lényeg abban rejlik, ahogyan használják a Spotifyt a fogyasztók. Extra információk egész sorát lehetne megszerezni ezekről a fogyasztókról azon kívül hogy milyen zenét hallgatnak.”

„Tudni akarjuk, hogy a fogyasztók emberként milyenek, hogyan viselkednek. Valójában ez a módszer sem más, mint egy bő kérdőív, ami a lehető legtöbbet tudja meg a lehető legtöbb fogyasztóról egyazon időben. Számunkra semmi sem képes pótolni a kérdőíves módszernek azt a sajátosságát, ahogy a világot segít megérteni, és ahogy kontextusba helyez minden mást.”

Megválaszolandó kérdések

Doug Edmonds szerint oly korban élünk, amikor egy ún. felvilágosult magatartás új formái vannak születőben. „Nem elég, hogy ma már sokkal pontosabban tudunk elemezni egy-egy adott viselkedést, de a döntéshozatali folyamatokról (akár érzelmi, akár racionális döntés születik) ‒ melyek az alapjai ezeknek a viselkedésmódoknak ‒ is mind többet és többet tudunk. A két dolog kéz a kézben jár egymással.”

Az a vélekedés, miszerint a cégek egyszer eljutnak majd oda, hogy elhagyják a hagyományos kutatási módszereket és csak az adathalmazokban bíznak, egyelőre abszurdnak tűnik. Minden egyes adatforrásnak megvannak a maga erősségei és korlátai. Az adathalmazok és a kérdőíves adatok összehasonlítása tekintetében elmondható, hogy ezek tökéletesen kiegészítik egymást.

Strong szerint a piackutatásban „az adathalmazok korszakának kezdete lehetővé teszi számunkra, hogy oly módon vizsgáljuk az emberi viselkedést, különös tekintettel a közösségi kapcsolatokat, ahogy arra még soha ezelőtt nem volt mód.”

Végtére is minden, az emberi viselkedésről rendelkezésre álló teória igazolására relatíve kevés dolog áll rendelkezésre. Az adathalmazoknak nagy segítségére lehetnek a kérdőívek, melyek olyan attitűdbeli és érzelmi összefüggéseket tárnak fel, melyek segítenek a viselkedésmódok értelmezésében.

Ahhoz, hogy az adathalmaz-elemzésben sikeresek legyünk, szükség van pár dologra – kezdve néhány új képességgel. „A legtöbb szakembernek fogalma sincs róla, hogyan kell óriási adathalmazokat kezelni, sokszor a közepes mennyiséggel sem bírnak” – mondja Boyle. „Pedig ők a kulcsfigurák. A legtöbb adathalmaz-elemzési projekt azért bukik el, mert nem a megfelelő szakemberek ülnek a cégnél. A kérdés az, hogy a piackutatók felkészültek-e a feladatra?”

Az adathalmazok ereje

A McKinsey Global Institute 2011-es riportja öt különböző módot sorakoztatott fel arra, hogyan válhat értékessé egy-egy adathalmaz a cégek számára:

Átláthatóságot biztosít

McKinsey szerint olyan területeken, mint a gyártás, az integrált adatok bevetése jelentősen lecsökkentheti a reklámra fordított időt és javíthatja a minőséget.

Tapasztalatszerzés lehetősége

A valós idejű eredmények és az adatelemzések eredményei egyszerűbb tesztelési módokat kínálnak a cégek számára.

 Testreszabás

Személyre szabott termékek és szolgáltatások nagyon speciális szempontok alapján.

 Automatizált döntéshozatal

A kereskedők például algoritmusokat használhatnak a készletezés és az árazás finomhangolására, a valós idejű értékesítési adatok függvényében.

 Innováció

A részletes termékhasználati adatok segíthetnek az új vagy korszerűsített termékek fejlesztésében.

 

A „big data” használata különböző szakmákban

Az American Express fogyasztói magatartás elemzése kimutatta, hogy azok az emberek, akik jelentős hitelkártya-adósságot halmoznak fel, majd egy ún. szállítási címet adnak meg, jellemzően arra készülnek, hogy csődöt jelentsenek.

Akadémiai kutatók arra használják fel a Google Earth alkalmazást, hogy a tehenek tanulmányozása során azok állítólagos „mágneses” hatodik érzékét vizsgálják. Szatellitfelvételek megmutatták, hogy világszerte a tehenek kétharmada testével északi irányba fordul.

Az USA kereskedelmi lánca, a Target a bevásárlókocsik tartalmát vizsgálta, hogy az abban lévő termékek alapján (mint például testápolók vagy vitaminok) azonosítsa a terhes kismamákat. Egy középiskolás állapotos lány már azelőtt kapott kismamáknak szánt ruhákról ajánlatokat, mielőtt terhességét bevallotta volna a szüleinek.

A Google bizonyos kereső kifejezések segítségével próbálja megállapítani az influenza terjedésének útját. Az adatok lefedik a hivatalosan közölt adatokat, de azoknál sokkal gyorsabban és egyszerűbben elérhetőek.

Piackutatás Hírek, www.piackutatas-hirek.hu





Posted by NRC Marketingkutató in : Egyéb,

Kapcsolat

NRC Kft. 1034 Budapest, Kenyeres utca 28. www.nrc.hu

piackutatas@nrc.hu
Facebook Twitter

Küldjön üzenetet nekünk!