Könyves-Tóth Előd: Meg van már 21?

2013. máj 18.



Nincs? Akkor még tovább lehet lépni, nem csak a 21-es kártyajátékban. Az SPSS Statistics minden újabb verziója tartalmaz olyan újdonságokat, amelyeket a felhasználók nagyon hiányoltak a korábbiakból. Az alábbi kis ízelítő néhány SPSS Statistics 15 után bevezetett lehetőségről szól. Érdemes ellenőrizni a saját változatot, ha valami nagyon hiányzik, lépni kell, a jelenleg legújabb verzió az IBM SPSS Statistics 21.

A program ma már Mac és Linux rendszereken is korlátozások nélkül elérhető. Végre megvalósult a Base modul részeként a .NET, R, Python és Java integráció, ami egyrészt lehetővé teszi az SPSS funkciók kihasználását, illetve vezérlését külső programnyelvekből, másrészt az SPSS szintax parancsnyelv tartalmazhat külső programnyelvű részleteket. Az R nyelvű applikációkat az interneten elérhető sok statisztikai rutin miatt szeretik az SPSS környezetben is használni, a Python és .Net szkriptekkel főleg az output formáját és sorsát vezérlik, a Java integrációval pedig leggyakrabban az SPSS funkcióinak egyéb vállalati rendszerekbe integrálását biztosítják. Az SPSS-ben saját műveletek, pontosabban dialógusok és parancsok alkotása is lehetséges, ehhez szintén kihasználható a külső programnyelvek integrációja.

A felhasználói környezet szempontjából újdonság, hogy külön állítható a kezelő és output nyelv, bár magyar nem, de választható pl. hagyományos vagy egyszerűsített kínai nyelv is. A program támogatja az unikód rendszert az adatok, a címkék és a szintax szintjén is. Végre láthatunk több változót egyszerre, mert átméretezhetőek a dialógusablakok. A változók pedig mozgathatók ’fog-és-rakd’ módon, és a szintax küldése dialógusból már lehetséges az aktuális kurzor pozícióhoz , nemcsak a szintax végére, mint korábban.

A szintax editor teljesen megújult a 15-ös óta. Automatikus parancs-szó kiegészítés, funkciók szerinti színezés, szintax ablak kettévágása, sorszámozás, szintax nyomkövetés töréspontokkal, ugrálás szintaktikai hiba helyenként, külön hiba- és navigációs panel került a felületre.

Az adatok elérése terén is bővültek a lehetőségek, újabb típusú excel fájlokhoz, több sztenderd adatbázishoz férhetünk hozzá, és egyszerre több adatablak is nyitva lehet. Nyelvtani helyesség ellenőrzés kérhető az adatcellákban, sőt a változó- és értékcímkékben is. A már létező változók típusa átállítható már szintaxban is, és lehet szövegváltozók hosszát is átállítani, ami különösen fontos lehet például fájlok összekapcsolása előtti kritériumok teljesítése esetén. Itt érdemes megemlíteni azt is, hogy a fájlok összekapcsolása (merge) előtt már nem szükséges sorba rendezni az adatokat a kapcsoló kulcsok szerint.

Két adatfájl összehasonlítható, részletes riport kérhető az eltérésekről mind az adatok és mind a címkék szintjén, ami pl. a dupla adatrögzítés vagy a javított adatfájlok egyezésének-különbözőségének vizsgálata miatt is hasznos lehet.

A címketár, azaz a változók tulajdonságai, nevei, címkéi, értékcímkéi, szintjei, …, stb. részletesen riportolható a változó típusának megfelelő alapstatisztikákkal és a többfeleletes változócsoport definíciókkal kiegészítve. Mindezt például szokás csatolni az excelbe exportált adatok átadáskor, hogy az átvevő fél tudja értelmezni azokat.

Keres/csere lehetőség van már az adat és output ablakban is, pl. át lehet fogalmazni az spss-statisztikai műszavakat  ’házi’ terminológiák szerint. Az input és output fájlok jelszavas védelemmel védhetők az illegális bepillantásoktól.

Transzformációk esetén hivatkozhatunk nem csak egy változó értékének az előző (lag) eseteire, de a követő (lead) esetekre is. A táblázáskor pedig lehet új kategóriát létrehozni új változó átkódolás/létrehozás nélkül. Új, látványos interaktív ábrakészítési lehetőségek vannak, mini ábrák elhelyezése újfajta földrajzi térképezéssel, ESRI, map-shape fájlok támogatása, konverziója. A táblázatokban végre lehet kérni akár oszlopszázalékok közti szignifikáns eltérések jelölését (’quantum-like’), akár homogén alcsoportok jelzését is (’APA style’). Sőt, a homogén alcsoportok jelölése a közönséges kereszttáblák (Base/Crosstabulation) esetén is kérhető.

Az adat-előkészítést tekintve megemlítendő, hogy külön modulok segítik az adatok logikai ellenőrzését, anomáliák detektálását, mindezek részletes riportolását és javítását. Többféle hiányzóadat-felderítő és -pótló módszer áll rendelkezésre, mint pl. az hiányzó értékek mintázatát látványosan ábrázoló, vagy éppen a hiányzó adatokat többszörös imputációval  helyettesítő eljárás. A prediktív módszerek használata előtt praktikus új lehetőség, hogy a változókból kontrollált módon (a másik változó értékeire asszociálva) automatikusan is képezhetők új kategóriák.

Végül, de nem utolsósorban íme néhány 15 után megjelent újdonság a statisztikai eljárások közül is.

Neurális hálózatelemzés, KNN legközelebbi-szomszéd klasszifikáció. Two-Step klasztererés, amely szegmentáló eljárás javasolja a képzendő klaszterek számát, és működik nominális és ordinális változókkal is. Lehet ordinális célváltozó a General Linear Mixed Modelben. A modellek értékelését újfajta interaktív ’smart-model-viewer’ (’Clementine-like’) nézőke könnyíti. A prediktív modellezések esetén az új esetek besorolásához a ’scoring-wizard’ áll rendelkezésre, ami régebben csak a szerveres változatban működött.

Ahol jelentősége van, ott az algoritmusok ezentúl kihasználják a többmagos processzorok jelenlétét is. A statisztikai módszerek stabilitásának vizsgálatára pedig a Bootstrap és a Monte-Carlo-szimulációs technikákat vezették be az IBM SPSS Statistics frissített kiadásaiban.

Posted by NRC Marketingkutató in : Módszer,

Kapcsolat

NRC Kft. 1034 Budapest, Kenyeres utca 28. www.nrc.hu

piackutatas@nrc.hu
Facebook Twitter

Küldjön üzenetet nekünk!