SQL Server 2012 s novou edicí Business Intelligence

Microsoft SQL Server 2012 kromě edicí Standard a Enterprise také přinese novou edici Business Intelligence. Co od ní očekávat popisujeme v našem článku.

Aktuálna verzia SQL Server 2012 (v CTP verzii mal kódové označenie Denali) vychádza z osvedčených funkcií dolovania údajov a analytických, reportovacích a integračných služieb v doterajších verziách. Snaží sa pritom rozšíriť ich dosah na oveľa širšiu používateľskú základňu. Tvorcovia novej verzie sa snažili dosiahnuť čo najväčšiu flexibilitu platformy, aby vyhovovala rozdielnym potrebám BI aplikácií a umožnila zákazníkom lepšie sa vyrovnať so stále narastajúcim objemom údajov, či už v tradičných dátových centrách, alebo v prostredí verejného či privátneho cloudu. O rastúcom význame BI svedčí aj skutočnosť, že okrem klasických edícií Standard a Enterprise pribudne aj edícia Business Intelligence Edition.

Samoobslužný koncept BI

Dátové sklady, dátové tržištia a analytické databázy sú v podnikovom priestore efektívne len vtedy, ak ich môžu čo najefektívnejšie využívať príslušní klienti, napríklad manažéri, analytici apod. Implementácia Business Intelligence vrstvy na platforme SQL Server 2012 pozostáva z integračných, analytických a reportovacích služieb. Nech by tieto služby boli akokoľvek prepracované, pre tvorbu vyvážených systémov je potrebné zabezpečiť k nim optimálny klientsky prístup. Preto sa na moderných databázových a analytických platformách začína presadzovať koncept označovaný ako samoobslužná BI.

Moderné výkonné dátové modely umožňujú flexibilitu pri návrhu a tvorbe obchodnej logiky, vrátane priameho prístupu na podkladové dáta pre analýzu v reálnom čase. Analytické služby na platforme SQL Server 2012 podporujú nový typ sémantického modelu BISM (BI Semantic Model). Model zapuzdruje tri vrstvy: dátový model, obchodnú logiku a prístup k údajom.

Klepněte pro větší obrázek
Komplexný pohlad na BI na platforme SQL Server 2012.

BISM zlepší tvorbu analýz a prístup k výsledkom cez Excel, Power Pivot, Reportovacie služby, SharePoint Insight, prípadne cez aplikácie tretích strán. Microsoft deklaruje, že BISM nie je náhradou za existujúce BI modely, ale skôr alternatívny model. Jednoducho povedané, BISM je relačný model, ktorý zahŕňa BI artefakty, ako napríklad KPI (kľúčové ukazovatele výkonu) a hierarchie. BI sémantické pripojenie poskytuje HTTP koncový bod do analytických služieb, ktoré sú rozmiestnené na samostatnom serveri, alebo koncový bod na prístup k zošitu programu Excel obsahujúci údaje, poskytnuté technológiou PowerPivot.

Dolovanie údajov a prediktivné analýzy

Data mining je momentálne jednoznačne najrýchlejšie rastúci segment Business Intelligence, nakoľko dokáže vykonávať sofistikované prediktívne analýzy. Je to prienik umelej inteligencie do oblasti databáz. Ako vyplýva z názvu, ide v princípe o ťažbu údajov, presnejšie o proces analýzy dát z rôznych perspektív a ich premenu na užitočné informácie. Z matematického a štatistického hľadiska ide o hľadanie korelácií, teda vzájomných vzťahov alebo vzorov v údajoch v kombinácii so štatistikou. Pri prediktívnych analýzach môžete v novej verzii SQL Servera 2012 simultánne vyskúšať niekoľko dataminingových modelov a pomocou skóre na štatistickej báze porovnať ich presnosť a vyhodnotiť ich stabilitu pomocou krížovej validácie.

Rovnaké štruktúry môžete použiť pre viaceré, aj vzájomne nekompatibilné dataminingové modely, môžete aplikovať modely na filtrované údaje či dotazy na štruktúru údajov. Data mining na platforme SQL Server 2012 kombinuje to najlepšie z viacerých oblastí zlúčením výsledkov optimalizovaných pre najbližšie obdobie predpovede ARTXP (Autoregressive Tree Models for Time-Series Analysis) a výsledkov stabilných dlhodobých predpovedí ARIMA (Autoregressive Integrated Moving Average) s lepšou podporou časových radov. Prístup v výsledkom prediktívnych analýz je možný aj z aplikácií Office prostredníctvom doplnku Microsoft SQL Server 2012 Data Mining Add-ins for Microsoft Office 2010.

V podnikovej informatike sa data mining využíva najmä v oblasti marketingu (Direct marketing), v oblasti styku so zákazníkmi (CRM), ale aj oblasti kontroly kvality výrobkov (Quality Control/Quality Management). Používa sa na vytypovanie vhodných zákazníkov pre marketingovú kampaň a podobne. Pomocou dataminingových modelov dokážete z histórie chovania klientov, ktoré máte uložené vo forme údajov v databáze, predpovedať chovanie konkrétneho klienta v danej situácii.

Klepněte pro větší obrázek
Detailný pohled na architekturu BISM.

Napríklad je možné identifikovať, kedy klient zvažuje odísť ku konkurencii, odhaliť pokus o bankový podvod či ohraničiť cieľovú skupinu pre ponuku konkrétneho produktu alebo služieb. Čoraz častejšie sa však výhody tejto technológie využívajú aj v iných oblastiach, napríklad pri analýze laboratórnych vzoriek, v medicíne pri vyhľadávaní skupín príznakov, vyhľadávaní skupín liekov, vyhľadávanie skrytých vzťahov medzi jednotlivými diagnózami, v energetike na predikciu zaťaženia distribučnej siete alebo predikciu odberu elektriny a podobne.

Reportovacie služby

Kvalitné reporty sa vyznačujú vysokým podielom moderných vizualizačných prvkov, ako sú dynamické grafy, obrázky, rôzne ukazovatele, ktoré sú dostatočne, interaktívne a prezentačne bohaté. Jednou z najdôležitejších noviniek vo verzii SQL Server 2012 sú automatické notifikácie o zmene dát pre reporty.

Používatelia budú môcť pri prezeraní reportu definovať pravidlá a limity pre údaje. Pri ich dosiahnutí budú na túto skutočnosť upozornení. Táto funkcionalita zásadne mení tradičnú filozofiu takzvaného „režimu ťahu“, kedy používatelia (napríklad periodicky) zisťujú, či boli nastavené hodnoty dosiahnuté na proaktívny režim, kedy aktivitu preberajú reportovacie služby, čo výrazne zvyšuje produktivitu informačných pracovníkov.

Pod kódovým označením Projekt Crescent Microsoft vyvíjal nový reportovací a vizualizačný nástroj, ktorý bude integrovaný v SQL Server 2012 pod názvom Power View. Nástroj funguje na báze jednoduchého „drag and drop“ ovládania. Jeho súčasťou je výkonný nástroj pre interaktívne dotazovanie a storyboardy, umožňujúce používateľovi zdieľať vizualizácie veľkých objemov údajov.

PowerPivot pre Excel 2010

Technológia Microsoft SQL Server PowerPivot mení pohľad na BI a sprístupňuje nielen výsledky vopred zadaných analýz, ale aj ich tvorbu konečnému používateľovi, teda analytikom a manažmentu, ktorí ich potrebujú pre podporu rozhodovania. Výrazne tak zjednodušuje a zrýchľuje životný cyklus analýz, čo následne prispieva k vyššej efektívnosti. Vďaka tejto technológii môžu aj bežní používatelia bez podrobnej znalosti štruktúr databáz spracovávať a analyzovať veľké množstvo údajov z rôznych zdrojov priamo v tabuľkovom procesore Microsoft Excel a vytvoriť si vlastný model kontingenčných tabuliek bez nutnosti oslovovať analytikov špecialistov či IT oddelenia.

Klepněte pro větší obrázek
Praktický príklad nastavenia automatickej notifikácie o zmene dát z policajnej praxe. Po prekročení stanovenie miery kriminality reportovacie služby vygenerujú upozornenie, že situáciu je potrebné operátivne riešiť.

Modely je možné publikovať a zdieľať viacerými používateľmi prostredníctvom portálu SharePoint. K vysokému výkonu prispieva rozsiahle využívanie operačnej pamäti (tzv. in-memory BI). Aby sa do pamäti vošlo súčasne čo najviac údajov, využíva sa sofistikovaná kompresia údajov. Pre špecifikovanie operácií sa využívajú takzvané DAX výrazy, čiže výrazy, ktoré využívajú syntax Data Analysis Expressions. Sú jednoduchšie ako výrazy MDX jazyka a používajú podobnú syntax ako vzorce aplikácie Excel.

Novinky, ktoré nepriamo zlepšujú kvalitu BI

Jednou z kľúčových požiadaviek na databázovú platformu je vysoká dostupnosť. SQL Server 2012 umožňuje pomocou jednoduchého sprievodcu vytvárať skupiny databáz, ktoré sa automaticky replikujú a v prípade havárie primárnej databázy dôjde k automatickému prepnutiu na databázu replikovanú. Táto technológia nevyžaduje špeciálny hardvér a dokonca je možné replikovanú databázu používať na čítanie, prípadne vytváranie zálohy.

„Samostatná“ databáza(contained database) znamená odstránenie závislosti databázy od konkrétnej inštancie SQL Servera. V praxi to znamená jednoduchú možnosť presúvania databázy medzi inštanciami databázového servera. Navyše vývojár nemusí brať ohľad na konfiguráciu konkrétnej inštancie. Pri pohľade do štruktúry databázy zistíte, že informácie o používateľoch, autentifikačné údaje, úlohy SQL Agenta, nastavenia, metadáta a podobne sú priamo súčasťou každej databázy, čím sa odstránila závislosť od systémovej databázy Master. Táto funkcionalita umožňuje napríklad distribuovať databázu spolu s aplikáciou.

Technológia Columnstore Index mala pôvodne kódové označenie Apollo. Kvôli svojím obmedzeniam pravdepodobne nenájde uplatnenie v relačných OLTP databázach, hlavne preto, lebo neumožňuje aplikovanie operácií Update a Delete. O to užitočnejší bude v dátových skladoch alebo databázach, ktoré sú určené ako zdroj údajov pre analýzu dát a data mining.

Klepněte pro větší obrázek
Príklad interaktivného reportu vytvoreného pomocou technológie Crescent.

V týchto scenároch môže signifikantne zvýšiť výkon spracovávaných dopytov. Ako to funguje. V bežne organizovaných databázach sa jednotlivé záznamy ukladajú po riadkoch. Ak na tabuľku aplikujete Columnstore index, údaje sa budú ukladať po jednotlivých stĺpcoch, čím sa výrazne zrýchľuje prístup k údajom vo vybranom stĺpci. Databázový server v takomto prípade nemusí načítavať údaje z ďalších stĺpcov, ktoré sú pre práve vykonávanú úlohu nepotrebné. Nakoľko dátové sklady sa len plnia a údaje v nich sa nikdynemenia (nebudeme predsa prepisovať históriu obchodovania vlastnej firmy) absencia operácií pre zmenu údajov nie je vôbec na závadu.

Cloud ready

Jeden z najvýstižnejších prívlastkov novej verzie SQL Servera 2012 unifikovanej databázovej aj BI platformy je „Cloud-ready“. Efektívne nástroje na budovanie dátových skladov a sofistikované analytické funkcie umožnia firmám a organizáciám odkryť prelomové poznatky ukrývajúce sa v údajoch a rýchlo vytvárať moderné riešenia.

Jednou z kľúčových oborov funkcionality bude spolupráca so službou SQL Azure, ktorá je súčasťou cloudovej platformy Microsoft Windows Azure. SQL Azure je možné zjednodušene charakterizovať jako relačnú databázu, poskytovanú formou služby. Technologicky sa jedná o rozšírenie funkcionality databázovej platformy SQL Server. Vyznačuje sa vysokou dostupnosťou a jednou z jej základných čŕt podmieňujúcou nasadenie v prostredí cloudu je schopnosť automatickej správy.

Autor je nezávislý publicista a softwarový vývojář.

Váš názor Další článek: Zkuste si pohrát s Kauko, kavárnou ovládanou přes internet

Témata článku: , , , , , , , , , , , , , , , , , , , , , , , ,