V Praze vzniká slibný databázový a big data projekt

Bývalý zaměstnanec pražského Skypu rozjíždí firmu, která tvoří databázové clustery nad PostgreSQL. Zajímavá se o 100 TB a více dat a chytá trend internetu věcí.

Tahle firma se od mnoha dalších českých začínajících technologických projektů v mnoha ohledech hodně liší. Prozatím totiž netouží po žádné velké publicitě a všeobecné slávě. „Stejně teď nemáme kapacity na to obsloužit další zákazníky,“ vysvětluje zakladatel a šéf asi čtvrt roku starého podniku Shards.io Aliaksandr Aliashkevich. To jeho firmu také odlišuje od jiných: od začátku vydělává slušné peníze.

Aliaksandr Aliashkevich nějakou dobu působil v pražské vývojové centrále Skypu, kde jako programátor stavěl velké databázové clustery, které tento komunikační nástroj pro svůj chod využívá. Asi čtyři měsíce nazpět se ale na Smíchově přesunul o pár desítek metrů vedle. Nyní obývá prostory technologického centra Node5 a databázové zkušenosti ze Skypu chce překlopit do poměrně ambiciózního podniku.

„Jsme v podstatě konkurence pro technologie jako HP Vertica, Oracle Exadata, EMC Greenplum nebo pro firmy, které staví projekty nad Hadoopem,“ popisuje mladý Rus, který už se usadil v Česku a solidně hovoří zdejším jazykem. Shards.io tedy začíná stavět velké databázové clustery pro firemní zákazníky. Rozdíl ovšem je v tom, že si jako základ vybírá databázi PostgreSQL, s níž pracoval právě ve Skypu.

100 TB a více

Aliashkevich si dal poměrně významný cíl. Hned od začátku se totiž nechce soustředit na malé zákazníky, ale jenom ty skutečně velké a na ty, kteří skutečně mohou mluvit o tom, že mají „big data“. „Zajímají nás databáze 100 TB a více,“ říká. „Stavíme tedy privátní cloudy na velká data a jejich analýzu.“ Z toho tedy plyne, že hlavním cílem jsou firmy v zahraničí, nikoliv v Česku.

Klepněte pro větší obrázek
V Node5 se usadil další slibný projekt. Pracuje v tichosti a o publicitu zatím moc nestojí.

Ukázkovými zákazníky Shards.io tedy mohou být například automobilky, které pomocí všemožných senzorů sbírají čím dál větší množství informací o každém automobilu. Technologie by mohla zajímat také operátory v rámci jejich povinností s uchováváním dat (data retention) a podobně. „Zatímco Hadoop umožňuje zpracovávat nestrukturovaná data, my se hodíme na ta strukturovaná. Typicky tedy na informace ze senzorů a tak dále,“ vysvětluje programátor a podnikatel.

To by nemusel být vůbec špatný byznys. „Oživených“ zařízení s čipy, čidly a tak vůbec s nástupem internetu věcí stále přibývá a objemy strukturovaných (ale i těch nestrukturovaných) dat rychle rostou. Zásadní otázkou ovšem je, zda se Shards.io dokáže prosadit v hromadě již zmiňované i nezmíněné konkurence, která rovněž cítí příležitost. Zavedení giganty navíc mají silné obchodní a partnerské sítě.

„Konkurovat chceme zejména díky dvěma věcem – ceně a tím, že jsme nad PostgreSQL postavili MapReduce,“ vysvětluje Aliashkevich. Cena se dá mimo jiné srazit tím, že Shards.io samozřejmě není Oracle nebo HP, ale také tím, že chce software stavět nad levným komoditním hardwarem, který se dnes už běžně v datových centrech usazuje.

Příležitost pro zájemce

Shards.io je nyní v začátcích a firma ještě nestihla vyvinout finální model. Ten do budoucna počítá s tím, že její databázové clustery budou – zjednodušeně řečeno – univerzální a bude možné je dodávat rovnou s hardwarem (a samozřejmě potřebnými úpravami podle zákazníků). Výsledek by mohl být podobný třeba tomu, co dělá Red Hat či nově Cloudera běžící nad Hadoopem.

 

Shards.io aktuálně pracuje na druhé velké instalaci s tím, že každá zabere až několik měsíců. Výsledkem má být ale model podobný třeba Red Hatu.

 

Tak daleko projekt ale ještě není a Shards.io projekty buduje jednotlivě. „Aktuálně pracujeme na druhé velké instalaci s tím, že na každou máme až několik měsíců,“ popisuje. Zákazníků, kteří by se o připravené PostgreSQL mohli zajímat, je podle něj hodně. Je pravda, že si mnohé velké firmy právě nad touto technologií staví vlastní řešení. Příkladem budiž Avast, jenž si PostgreSQL cluster budoval sám.

Aliashkevich v současné době dodává do domovského Ruska, kde navázal vztahy s tamním velkým obchodním partnerem. Do budoucna se chce ale dostat přímo k zákazníkům a nyní i v Česku i jinde hledá lidi, kteří by byli schopní mu s tím pomoci.

V Shards.io mají práce hodně a počítají tak s tím, že přijmou nové lidi také na technické pozice. Firma má otevřené pozice na databázové a DevOps inženýry, finálně by je chtěla zaměstnat ale až tak na podzim. „Máme teď plné ruce práce se zakázkami a vývojem a nezbývá moc času na zaučování a vysvětlování,“ říká Aliashkevich.

Velká část technologií, se kterou mladá společnost aktuálně pracuje, a na kterých svůj produkt staví, je open source. Základ pro chod prozatím na serveru tvoří Ubuntu, do budoucna se ale počítá s mnoha dalšími systémy.

Mnozí si slibovali, že podobné „big data and analytics“ projekty představí letošní ročník StartupYardu, který se za podpory významných firem zaměřil právě na tuto oblast, nakonec se ale takové projekty rodí jinde. Takže kdo ví, třeba o Shards.io ještě bude hodně slyšet.

Témata článku: Byznys, Cloud, Startupy

8 komentářů

Nejnovější komentáře

  • langpa 14. 5. 2014 0:29:19
    100TB relačních dat, která jsou dobře strukturovaná, je paráda. 10PB...
  • milan123 12. 5. 2014 13:50:29
    Použít know-how bývalého zaměstnavatele a rozjet si díky tomu vlastní...
  • rkrama 12. 5. 2014 11:46:11
    100 TB je vela? To asi skor zalezi od celkovej struktury databazy, alebo...
Určitě si přečtěte