StoryEditor

Ako sa dostať z lavíny údajov a dát

29.01.2002, 23:00

V súčasnosti sa vrcholní manažéri pre informačné technológie vážne zaoberajú elektronickým obchodovaním. Pre tých, ktorí budú úspešní, to znamená zamyslieť sa nad veľkým množstvom údajov a ich infraštruktúrou. Spoločnosť GartnerGroup odhaduje, že v roku 2004 budú podniky musieť spracovať 30-krát viac údajov ako v roku 1999. Iba tie podniky uspejú v elektronickom obchodovaní, ktoré dokážu efektívne spracovať dostupné údaje. V nasledujúcich riadkoch skúmame problémy, ktoré sa týkajú prívalu údajov vyplývajúcich z aktivít v oblasti elektronického obchodovania, a prinášame možné riešenia.
ČO JE VEĽA
Spoločnosť GartnerGroup odhaduje, že v roku 2004 budú musieť podniky spracovať 30-krát viac údajov v porovnaní s rokom 1999. V roku 2005 bude priemerný podnik schopný úspešne zvládnuť spracovať 100 terabytov údajov. Najpriebojnejšie firmy sa pokúsia o spracovanie 500 terabytov. Čo robia organizácie pre to, aby boli pripravené na očakávanú záplavu údajmi? Budú mať o päť rokov systémy, ktoré budú schopné ľahko zozbierať, uchovať a urobiť použiteľnými 100 (alebo viac) terabytov údajov? Skôr než odpovieme na tieto otázky, sa musíme pozrieť na príčiny takejto explózie údajov.
POTREBA INTEGRÁCIE ÚDAJOV
K riešeniu riadenia údajov potrebuje organizácia integrovať rôzne zdroje podnikových údajov. Operácie elektronického obchodu generujú samotné webové stránky, elektronická pošta, chat a ďalšie. Kontakt so zákazníkom zabezpečený napríklad call centrom poskytuje údaje o správaní zákazníka. Niektoré podniky tiež integrujú demografické údaje s ich internými údajmi o zákazníkoch. Aby sa získal kompletný obraz o finančných a prevádzkových výsledkoch, musia sa taktiež integrovať údaje z interných systémov (ako sú napríklad ERP a systém dodávateľských kanálov).
ELEKTRONICKÝ OBCHOD
Všetky tieto zdroje prispievajú k nárastu množstva údajov, ale hlavným impulzom pre rast množstva údajov je elektronický obchod. Keď sa podniky začnú prezentovať na internete, vznikne úplne nový zdroj zákazníckych a prevádzkových údajov. Vždy keď návštevník internetovej stránky klikne na linku, urobí nákup alebo požiada o viac informácií, zaznamenajú sa určité údaje. Súhrn všetkých pohybov návštevníka webovej stránky sa nazýva clickstream. Clickstream údaje poskytujú záznam správania sa zákazníka na úrovni, ktorá nikdy predtým nebola možná. Je veľmi pravdepodobné, že podnik, ktorý sleduje každý krok svojho zákazníka na webovej stránke, bude zrazu čeliť narastaniu gigabytov (terabytov) údajov.
Činnosti spojené s elektronickým obchodom nie sú jediným zdrojom rastúceho prílevu údajov. Zákaznícke údaje pochádzajú z množstva iných zdrojov, pričom podniková webová stránka je iba jedným z nich. Nákup údajov a získavanie údajov z poštových objednávok musia byť integrované s údajmi z internetu. Aby sa dosiahol komplexný pohľad na správanie zákazníka, musia byť údaje poskytnuté oddelením služieb zákazníkom o sťažnostiach a požiadavkách zákazníkov integrované s údajmi o nákupoch a nákupných návykoch.
VNÚTORNÉ PROCESY
Spolu s údajmi od zákazníkov potrebujú podniky spracovať údaje získané zo svojej činnosti. Takéto údaje pochádzajú zo všetkých vnútorných podnikových aktivít, ako sú napríklad výroba, financie, personálne oddelenie atď. Tieto aktivity sú rozhodujúcimi pre prežitie podniku a výsledné údaje sa musia zozbierať, aby vznikol pravdivý obraz o výsledkoch spoločnosti. Zvyšujúca sa komplexnosť údajov získaných od zákazníkov a z činnosti podniku i rastúci počet zdrojov údajov znamená pre každý podnik nevyhnutnosť mať akčný plán na zber a deľbu informácií. Tí, ktorí ho mať nebudú, premeškajú príležitosť vybudovať silnú konkurenčnú výhodu.
VAROVANIA ANALYTIKOV
Odhady analytikov o raste údajov sú prekvapujúce. Nepochybne však budú mnohé organizácie ignorovať tento problém a zákonito zlyhajú pri zavádzaní nevyhnutných riešení. Možno sa niekde nazdávajú, že už zhromažďujú dostatok údajov a že nestojí za to vynakladať úsilie na začlenenie ďalšieho clickstreamu údajov od zákazníkov. V iných podnikoch si môžu zasa myslieť, že ich existujúci systém zvládne rastúce množstvo údajov, alebo nechajú jednotlivé podnikové útvary rozhodovať, ako spracovať svoje údaje bez toho, aby ich integrovali do údajov na celopodnikovej úrovni.
Nanešťastie, organizácie, ktoré sa strategicky nepripravia čeliť výzve v podobe veľkého množstva údajov, premeškajú príležitosť na vytvorenie veľkej konkurenčnej výhody. Spoločnosť GartnerGroup sa domnieva, že podniky si budú vo zvýšenej miere konkurovať na báze ich schopnosti zúžiť "vedomostnú medzeru", teda rozdiel medzi údajmi dostupnými pre podnik a údajmi, ktoré je podnik schopný efektívne využiť.
AKO ČELIŤ VÝZVE
Vo výbere dátových riešení potrebuje podnik opatrne zvážiť nielen súčasné, ale aj budúce potreby. Ak je riešenie od začiatku projektované na rozširovanie, bude podnik schopný spracovať väčší objem údajov jednoduchým pridaním hardvéru. Nesprávne naprojektované riešenie bude obsahovať skryté limity rozšírenia. Toto riešenie sa bude musieť prepracovať, alebo úplne nahradiť pri vysokých nákladoch v prípade dosiahnutia týchto limitov.
VYSOKÁ VÝKONNOSŤ
Ako keby veľké množstvo údajov nebolo samo osebe veľkou výzvou, budú podniky vyžadovať vzrastajúcu agilnosť a prístupnosť od aplikácií, ktoré sú integrované s ich masívnym dátovým skladom. V prípade analyzovania výkonu podniku, chcú mať organizácie možnosť prístupu k dôležitým údajom takmer okamžite, namiesto čakania na výsledky deň, alebo dokonca týždeň. Webovo založená "samoobsluha" zákazníkov vytvára dopyt po prístupe k údajom v reálnom čase. Techniky personalizácie webovej stránky pracujú na základe analyzovania clickstreamových údajov automaticky s každým kliknutím, ako ďalší z faktorov určujúci nákupnú skúsenosť.
Kým objem údajov v podniku postupom času narastá, dodatočné IT náklady sa znižujú. Podniky chcú využívať nízko nákladové IT hneď, ako je to možné. Často najlepšie výsledky v pomere nákladov na výkonoch v problematike veľkého množstva údajov sa nedosahujú prostredníctvom veľkých, monolitických serverov. Rozložená a paralelná hardvérová skladba ponúka najlepší pomer nákladov na výkone. Podniky musia byť schopné využívať kombinácie nízkych nákladov a vysokej výkonnosti bez strácania nákladovej výhodnosti v oblasti nákladného a komplexného aplikačného úsilia.
Robustnosť
Vo svete obchodu, ktorý dnes pracuje podľa rozvrhu 24 x 7, sú súčasné dátové riešenia neudržateľné. Globálny dopyt po podnikových skladoch údajov robí z vysokej dostupnosti kľúčový komponent každého riešenia. Zamestnanci, zákazníci a partneri na celom svete vyžadujú prístup k podnikovým údajom pri každej príležitosti a riešenie, ktoré spoľahlivo dosiahne tieto požiadavky dostupnosti. Primerané dátové prostredie, robustnosť a dostupnosť sa môžu ľahko uskutočniť. Extrémna prebytočnosť je luxusom, ktorý si podniky v problematike veľkého množstva údajov nemôžu dovoliť, a preto sa musí robustnosť naprojektovať opatrne. Hlavné vzory a mechanizmy, ktoré nakoniec dodajú robustnosť v aplikáciách podnikových údajov, sú koncepčne jednoduché, ale stále neslávne známe v oblasti implementácie, špeciálne v prostredí veľkého množstva údajov. Dobre navrhnutý paralelný systém môže zabezpečiť robustnosť cez tieto bežné vzory v mnohých technicky komplexných, aplikačno-nezávislých komponentoch podnikových systémov.
Integrácia
Integrácia údajov z počiatočných systémov s údajmi z konečných systémov je rozhodujúca pre úspech ktoréhokoľvek strategického technologického podnetu, ktorý organizácia prevezme. Okrem toho podnik nemôže nechať individuálne kanály alebo obchodné úseky, aby sa stali "silom" informácií, pretože podkopú existujúce úsilie plnej synergie všetkých oblastí organizácie. Riešenia riadenia údajov musia obsahovať plán integrovania údajov zo všetkých interných podnikových a zákazníckych systémov.
Tieto systémy sa často líšia v niekoľkých dimenziách: geografii, charakteristike dostupnosti a hardvérovej a softvérovej platforme. Výber a integrovanie údajov z týchto rôznorodých systémov je dnes dvojnásobnou výzvou v prostredí veľkého množstva údajov. Vysoko zdatný a flexibilný ETL systém je absolútnou nevyhnutnosťou.
Nízke náklady vlastníctva
Keď sa k uvedeným typickým znakom aplikácií veľkého množstva údajov pridajú požiadavky na nízke náklady na vlastníctvo, odrazu sa riešenia zdajú nedosiahnuteľné. Bezpochyby, súčasná optimalizácia týchto typických znakov je náročná, ale nie nemožná. Ak si organizácia osvojí filozofiu "vybuduj to raz, vybuduj to dobre" a spojí sa s predajcami s preukázanými záznamami o riešeniach problému veľkého množstva údajov, bude úspora nákladov sprevádzať rozšíriteľnosť, vysokú výkonnosť, robustnosť, a integráciu podnikových údajov. Zavádzaním dátových riešení, ktoré obsahujú tieto typické znaky, bude podnik schopný eliminovať technologické obmedzenia vyplývajúce z jeho rastu. Jeho systémy budú schopné ľahko obsiahnuť viac zákazníkov, viac transakcií a viac užívateľov. Úspešné podniky, ktoré čelia problému veľkého množstva údajov správnym riešením, budú pokračovať v dosahovaní úspechov.

menuLevel = 1, menuRoute = prakticke-hn, menuAlias = prakticke-hn, menuRouteLevel0 = prakticke-hn, homepage = false
25. apríl 2024 11:40