Seznam vás chce. Třeba do Českých Budějovic

Zaklínadla jako Hadoop či Apache Giraph. V Seznamu pracují s novými technologiemi a na robotovi dělá třeba v podstatě neznámá pobočka v Českých Budějovicích.

Marek Gizela dává dopředu svým týmům vědět, kdy se za nimi staví. Není to tak, že by je potřeboval hlídat, má pod sebou hodně zkušených lidí, se kterými je běžně v kontaktu přes Skype či Polycom. Prostě se v pravidelných termínech dostaví na pobočku, celý den tam pracuje a je svým kolegům k dispozici. Šéf fulltextového vyhledávání v Seznamu takto z Prahy dojíždí do Brna a Českých Budějovic.

„Marek si většinou objedná běžné denní meníčko jako předkrm a pak si ještě z jídelního lístku vybere hlavní chod,“ usmívají se dva mladí vývojáři vyhledávacího robota při tradičním obědě v indické restauraci v centru Českých Budějovic. Marek Gizela svojí objednávkou jejich slova potvrzuje a nic nenasvědčuje tomu, že by sem přijel z centrály na šéfovskou obhlídku.

 

Seznam v tichosti po akvizici otevřel mapovou pobočku také ve Žďáru nad Sázavou. Je v ní pět lidí.

 

Dva mladí programátoři jsou v podstatě polovina vývojového týmu, kterou Seznam v Budějovicích zaměstnává, druzí dva jsou zrovna na dovolené. „Teď k nám přibyde pátý člověk. Hledali jsme ho asi půl roku, a to by se dalo ještě mluvit o štěstí,“ vypráví vývojáři za svými monitory. Největší tuzemská internetová firma by měla zájem v tomto jihočeském městě zaměstnat další kvalifikované lidí, nemá ale odkud brát.

Stěhování poboček za dobrými zaměstnanci

České Budějovice rozhodně nemají takovou kvalitu a tradici v technologickém a IT vzdělávání, na rozdíl od některých jiných českých měst. Mnoho lidí tak za studiem těchto oborů odchází především do relativně blízké Prahy. Zde pak studenti často ještě při škole získají stáž a zpátky do rodného města už se příliš nevrací.

Klepněte pro větší obrázek
Na pobočce Seznamu v Českých Budějovicích je k vidění i první SCRUM při vývoji fulltextu.

To však není případ zmiňovaných dvou vývojářů ze Seznamu. I ti nějakou dobu pobývali v Praze, nakonec se ale rozhodli vrátit. Tou dobou už byli zaměstnaní u zdejšího internetového lídra, který o ně po jejich přestěhování nechtěl přijít. „Každá firma je o lidech a dobré lidi je třeba si udržet,“ říká Marek Gizela a poukazuje tak na to, proč za programátory do Budějovic přešla i část vývoje a vznikla nová pobočka.

„Mnoho lidí ani neví, že tady nějakou pobočku máme,“ krčí ramenou lokální zaměstnanci, i když jejich sekce zde funguje už asi pět let. Reakce na příspěvek autora těchto řádků na Twitteru jim dávají za pravdu – přicházejí údivné reakce, že něco takového jako budějovická pobočka existuje. Na přítomnost nijak zásadně neupozorňuje ani samo prostředí. Seznam v Budějovicích sídlí v budově poblíž autobusového a vlakového nádraží, do které se vchází z nenápadného podchodu.

To nicméně neznamená, že by mělo jít o nějakou druhořadou centrálu s levnou pracovní silou. „Všechny naše pobočky by si měly být rovnocenné. Ani platy podle lokalit neodlišujeme,“ říká Gizela za přikyvování zaměstnanců.

To, že v Jižních Čechách není úplně lehké sehnat programátora, je zřejmě dáno i tím, že jich zde není tolik skutečně špičkových. „Nevíme, kolik přihlášek na poslední pozici neprošlo přes naše personální oddělení, na stůl se nám každopádně dostaly tři životopisy,“ konstatují vývojáři.

Když robot a Hadoop chroustají velká data

V Českých Budějovicích, stejně jako v Praze a Brně, totiž pracují v rámci vyhledávacího robota s technologiemi Java a Hadoop. Dobří lidé na Javu jsou firmami dobře střežení, jde o vysoce konkurenční prostředí. A Hadoop je velice mladá technologie, se kterou v Česku umí poměrně málo lidí. „Sehnat někoho, kdo umí dobře programovat a ještě k tomu umí Hadoop, to je princ na bílém koni,“ říká Gizela. „Dle mého by se mladí lidé měli zaměřit na tyto nové technologie kolem velkých dat, v tom je jasná budoucnost.“

Klepněte pro větší obrázek
Nenápadné místo, kde stojí o kvalitní lidi.

Hadoop je nový typ databázového systému, do kterého je možné ukládat velké množství nestrukturovaných informací (takže i obrázky a podobně), a ty prak velice rychle zpracovávat. Seznam si s Hadoopem začal hrát na přelomu let 2009 a 2010, kdy začal vývoj nového vyhledávacího robota, a teď je to v podstatě databáze celého vyhledávače.

„Dnes si robot do Hadoopu ukládá v podstatě všechno, co vidí,“ popisuje Gizela. Seznam zpočátku experimentoval s asi pěti různými technologiemi, dokonce byl ve hře i vývoj vlastního systému, Hadoop ale nakonec všechny ostatní překonal. „I přes porodní bolesti to byla dobrá volba, přínos Hadoopu je značný.“

Začátky ale nebyly úplně nejlehčí. V dobách nasazování a experimentování totiž v Česku v podstatě neexistovali lidé, kteří by takové produkční nasazení měli za sebou, a ani v zahraničí se tento fenomén ještě tolik neusadil. Vývojářům se tak „podařilo“ například smazat jednu celou databázi robota, takže si musel data nasbírat znovu. „Nakonec to nebylo na škodu, údaje se vyčistily,“ vzpomínají programátoři.

Je třeba dalších lidí

Seznam počítá s tím, že si nové lidi na Hadoop zaškolí, nehledá proto přímo „hotové“ odborníky. Vývojáři se přitom nemusí zajímat pouze o technologie vyhledávání, Hadoop se postupně dostal do mnoha dalších produktů společnosti, třeba reklamní platformy Sklik nebo webové analytiky. „V podstatě se to jako pomocná technologie používá všude, bez toho by to ani nešlo,“ konstatuje Gizela.

 

Hadoop dnes v Seznamu běží na více než tří stovkách serverů. Nové rychle přibývají, počítají se na racky.

 

Hadoop už v Seznamu běží v produkčním nasazení na více než třech stovkách serverů rozdělených do dvou clusterů – na jednom fungují rychlé a aktuální operace, na druhém se pak ukládají a zpracovávají dlouhodobější věci. Strojů na tuto technologii navíc rychle přibývá. „Dnes už nákupy serverů počítáme na racky, na jednotlivé kusy,“ usmívají se technici.

Vyhledávacímu týmu tuzemského webového obra stále více pomáhá také další mladá a progresivní technologie – Apache Giraph. Pomocí ní je mimo jiné možné zpracovávat data v paměti (in-memory), díky čemuž se reálně zkrátilo zpracování dat ze 14 dnů na čtyři hodiny.

Marek Gizela proto na vývoj robota hledá další schopné lidi a ve hře je právě i rozšiřování poboček v Brně a Českých Budějovicích. „Dává mi smysl rozrůstat se tam, kde už máme lidi. Nerad bych sice otevíral centrálu v dalším městě, ale pokud by tam byl dostatek odborníků, i to by teoreticky dávalo smysl.“ Fulltextový tým má aktuálně kolem stovky zaměstnanců a více než 15 z nich dělá na robotovi.

Seznam se rozhodně dalším oblastem nebrání. Minulý rok například otevřel vývojářskou pobočku v Ostravě, kde se prozatím pracuje na službě Mapy.cz. Na mapách dělá i pět lidí ve Žďáru nad Sázavou. Seznam tam v tichosti koupil část jedné kartografické společnosti a zaměstnance si tam ponechal.

Diskuze (27) Další článek: Prezident PayPalu odchází do Facebooku

Témata článku: , , , , , , , , , , , , , , , , , , , , , , , ,