V Česku nastává doba datová

V Česku se začíná čím dál více na mnoha úrovních začíná mluvit o datech. Mladé firmy, které se touto oblastí zabývají, patří mezi ty nejúspěšnější.

Zatímco ještě před několika měsíci byly tuzemské startupové a jiné akce a události plné projektů, které znovu objevovaly kolo a klonovaly již fungující služby, nyní se blýská minimálně na zajímavější časy. Česká scéna dostala několik impulzů a čím dál více se mluví o datech. Nemusí to zrovna být ta opravdová big data, analyzuje se toho ale poměrně dost.

„Do nadcházejícího ročníku StartupYard se přihlásilo kolem 60 týmů, nyní vybíráme z těch nejlepších,“ popisuje generální ředitel Seznamu Pavel Zima. Právě jeho společnost po dva roky smíchovský technologický akcelerátor z části sponzorovala a snažila se do ekosystému začínajících firem investovat peníze. Pavel Zima byl nicméně z posledních dvou ročníku StartupYardu zklamán, zejména kvůli kvalitě velké části projektů, a vyhlásil poslední šanci: aktuální kolo bude o datech a jejich zpracování a Seznam na to vyčlení část svého vyhledávacího robota.

StartupYard se při hledání kandidátů zaměřil na celou Evropu a kolem 60 přihlášených týmů je podle Zimy velice dobrým a příjemným výsledkem. „Potěšila mě kvalita, to je velký obrat,“ tvrdí produktový šéf Seznamu. Hodně přihlášek přišlo ze zahraničí, mezi prozatím neveřejnými kandidáty je ale údajně také dostatečné množství velmi zajímavých českých týmů.

Češi data umí

O data, ať už jsou velká nebo naprosto normální, je v současné době zájem, protože se ukazuje, že pro firmy a organizace mohou mít veliký význam. „Jsme na přelomu ekonomiky. V té budoucí bude rozhodovat blesková analýza dat,“ tvrdí například šéf pražského výzkumu umělé inteligence IBM Watson Jan Kleindienst. Svět už se o projekty s tímto rostoucím fenoménem zajímá delší dobu, v Česku se ale data do hlavního proudu prokousávaly poměrně dlouho.

Klepněte pro větší obrázek
Pohyb v budově v podání senzorů iBeacon.

Přitom pokud jsou zdejší technologické firmy v nějakém oboru poměrně úspěšné, jsou to vedle kybernetické bezpečnosti právě data. Například Socialbakers zpracovávají informace ze sociálních sítí a celkově už získali investice 34 milionů dolarů. S daty z těchto sítí pracují také Brand Embassy, ti nyní hlásí investici milion dolarů

Olomoucko-ostravský tým Futurelytics získal 800 tisíc dolarů a o GoodData a jejich více než 75 milionech dolarů už se dávno mluví po celém světě. Semantic Visions patří mezi oblíbence SAPu (využívají in-memory databázi HANA), mají velké světové zákazníky a umožňují „predikovat budoucnost“ či odhalovat rizika v dodavatelském řetězci a podobně.

Nejen data shromažďovat, ale umět v nich číst

V podstatě všechny tyto společnosti potvrzují tvrzení IBM, že data a informace postupně mění ekonomiku. GoodData například zákazníkům umožňují zpracovat hromady různorodých dat a z nich pak vytvořit přehledné výstupy. Futurelytics pokračují tam, kde GoodData končí a na těchto informacích staví prediktivní modely a dokáží poradit, jak s informacemi zobrazenými ve výstupech dále nakládat, třeba kde více investovat, jak zlepšit zásobování a podobně.

Samotná data nejsou samospasitelná a pověstné koláčové grafy samy o sobě v podstatě nemusí být k ničemu. Důležité je vyčíst, jak se na základě těchto údajů rozhodovat. A právě zde je jedno z velkých polí, kde lze s novými nástroji uspět. „Oblast dat je tak široká a veliká, že je na ní prostor pro nemalé množství konkurence,“ vzkazuje Jan Kleindienst z IBM.

Zákazníci mají v případě dat největší problémy s tím spojit informace z více zdrojů, očistit je a smysluplně využít. Z toho těží česká společnost Keboola, jež se právě tímto zabývá a ve své cloudové platformě umožňuje data propojit. Podporovány jsou služby jako SAP, sociální sítě, Google Analytics a AdWords, Sklik.cz od Seznamu, Salesforce.com, Dynamics CRM a přes API je možné napojovat další.

Pohyby přes iBeacon

Studie či podrobnější čísla o tom, kolik lidí se v Česku počítačovými daty zabývá, neexistuje, dobří lidé jsou ale poměrně nedostatkové zboží. „Odborníci se mi hledají těžce,“ říká třeba Adam Kurzok, který se snaží rozjet službu Daty.cz, jež si klade za cíl na základě dat graficky zmapovat vlastnické struktury zdejších firem.

Klepněte pro větší obrázek
Plný dům vývojářů přes data a technologií jako Hadoop, Elasticsearch, BigQuery, GoodData a dalších. Data hackathon v Node 5.

Kurzok a asi 70 dalších lidí se o tomto víkendu sešli ve smíchovském technologickém komplexu Node5 na takzvaném data hackathonu, kde celkem 8 týmů mělo za necelé tři dny vytvořit projekty postavené na datech, které s sebou účastníci přinesli.

Mladá společnost Abdoc, která ve světě uspěla díky svým zásuvným modulům do Photoshopu, už delší dobu právě z těchto pluginů sbírala informace. „Nijak jsme je ale prozatím nevyužívali, takže jsme se je rozhodli na hackathonu zpracovat,“ nastiňují zástupci Abdoc. Výsledek je podle nich dobrý – díky zpracování v Elasticsearch nyní bude možné jejich produkty personifikovat podle toho, jak s nimi jednotliví uživatelé pracují, a dojít má také na další zlepšování produktů.

Společnost Sinfin.cz zabývající se vývojem webů a aplikací zase v prostorách Node5 rozmístila po dobu trvání hackathonu několik snímačů iBeacon a skrze ně sledovala pohyb velké části účastníků. Výsledkem byla zajímavá „heatmapa“ a lepší naučení se s technologií, která je například Applem považována za budoucnost navigace v budovách.

Zástupci Futurelytics zase na hackathonu vzali data od policie a pomocí BigQuery a SQL hledali podobné clustery, díky čemuž vznikla mapa kriminality. Tento projekt nastiňuje to, jak moc by se mohla zdejší oblast postavená na datech rozvitou, až stát přijme za svá otevřená data, na kterých budou moci vývojáři stavět.

Datový filozof

V zejména těch velkých datech vidí značný potenciál například mobilní operátoři. Miloš Mastník z T-Mobilu v pořadu Connected hovořil o tom, jak se pomocí sítě mapuje dopravní dostupnost a je možné předcházet zácpám a tak dále. Jde o první reálné projekty, které mají poměrně značný význam.

Klepněte pro větší obrázek
Třídíme data. Data hackathon v Node 5.

Do fyzického prostředí přímo vstupuje také česká společnost Click2stream. To je platforma, do které je možné napojit streamy z bezpečnostních videokamer a na základě obsahu obrazu provádět analýzu, třeba heatmapy pohybu automobilů, počítání lidí a podobně. Vyvinout je možné také vlastní aplikace. Click2stream sbírá nemalé počty zákazníků a prezentoval se také v prestižním světovém akcelerátoru Y Combinator.

Velká data začínají pronikat také do tuzemského univerzitního prostředí. V Brně na VUT už se delší dobu snaží na serverovém clusteru na základě machine learningu rozpoznávat řeč. ČVUT zase získalo od IBM grant na výuku předmětu big data. Jan Šedivý se s týmem několika studentů propojuje také se soukromou sférou, od které získává jejich data a na nich se učí algoritmy a vyvíjí aplikace, které pak přenáší zpět do byznysu.

S tím, jak by data měla skutečně začít proměňovat firmy a ekonomiku, se postupně zřejmě začnou objevovat také nové důležité pracovní posty. Do nejvyššího vedení by měl zamířit také takzvaný Chief Data Officer (CDO), který by stál po boku tradičních obchodních, IT a další ředitelů. V současné době je nicméně v Česku poměrně problém vysvětlovat, k čemu mohou být data tak důležitá. To v Connected vysvětluje Filip Doušek, který v této oblasti společnostem radí. Doušek si například myslí, že se brzy objeví role jakéhosi korporátního filozofa, jenž bude umět číst z dat.

Diskuze (13) Další článek: DirectX i OpenGL budou po vzoru AMD umožňovat nízkoúrovňový přístup

Témata článku: , , , , , , , , , , , , , , , , , , , , , , , ,