Seznam: Google je dobrý díky nám a my díky němu

Česko je jedna ze čtyř zemí na světě, kde trhu s vyhledávači nedominuje Google. U nás se dělí o pozici se Seznamem, což vede ke konkurenčnímu boji a rychlým inovacím.

Seznam hodlá i nadále investovat do vývoje vlastního webového vyhledávače a zároveň s tím posílí tým, který na něm pracuje. K současné zhruba sedmdesátce lidí, kteří na fulltextovém vyhledávání pracují, mají během následujících měsíců přirůst další posily zejména do oblasti výzkumu a vývoje. Seznam si totiž i v budoucnu hodlá udržet výsadní postavení, které kromě něj už mají jenom další 3 země a firmy na celém světě, a sice že operuje na trhu, kde internetovému hledání jednoznačně nedominuje Google.

Seznam ve vyhledávání v současné době ovládá zhruba polovinu trhu, ta druhá pak patří rivalovi, který v Praze na Smíchově sídlí o ulici vedle. Podobně rozložené síly jsou už jenom v Rusku, kde stále vládne se Seznamem spřízněný Yandex, Číně, odkud se Google kvůli sporům skrze cenzuru stáhnul a vyklidil pole tamní jasné jedničce Baidu, a Koreji, kde si prvenství drží tamní Naver.

Oslabená pozice Googlu je v těchto zemích, mimo hromadu jiných faktorů, dána také tím, že se v nich píše jinou sadou znaků než je latinka, což vyžaduje jiný přístup ke tvorbě vyhledávacích mechanismů. Česká republika je tak jedinou zemí na světě, která píše latinkou a které nevládne Mountain View.

Oba sobě prospěšní

Vysoce konkurenční stav podle šéfa Seznamu Pavla Zimy zdejšímu internetovému trhu jenom prospívá a těží z toho především uživatelé. „S Googlem si vzájemně hlídáme kvalitu vyhledávání a dalších služeb, jako jsou třeba mapy,“ popisuje situaci. Zima tento fakt demonstruje na příkladu Turecka. „Když se podíváte na výsledky Googlu v této zemi, zjistíte, že jsou poměrně špatné,“ říká. „To, že Google hledá dobře v češtině, je díky Seznamu. A to, že Seznam hledá dobře, je díky Googlu.“

Klepněte pro větší obrázek
Konkurence nás pohání. Zprava: Štěpán Škrob a Marek Gizela.

„Google s češtinou pracuje minimálně stejně dobře jako Seznam,“ konstatuje Zima. Vyhledávač Seznamu aktuálně pracuje ve své třetí verzi, přičemž za poslední půlrok podle zástupců společnosti prošel nejvýraznějším posunem v historii. Od loňského roku například zvládá strojové učení a nově funguje také na technologii Java, která údajně celému systému dává nové možnosti jak pracovat s daty.

Pro tuzemskou internetovou jedničku je vyhledávání stále důležitý produkt. V roce 2011, kdy Seznam vygeneroval příjmy ve výši 2,68 miliardy korun, tvořil 30 procent z nich kontextový reklamní systém Sklik, jehož motorem jsou právě výsledky hledání. Neustálé investice a inovace jsou tak strategickou záležitostí. „Musí se neustále vyvíjet a zkoumat. Jakmile bychom přestali, brzy bychom ve vyhledávání skončili,“ dodává ke konkurenčnímu prostředí Štěpán Škrob, který stál u zrodu Seznamu, kde v roce 1997 spustil první jeho kontextový vyhledávač Kompas a dodnes se práci na vyhledávání věnuje.

Samotný Seznam se nicméně jako čistokrevný vyhledávací systém neprezentuje. Zažitý slogan „najdu tam, co hledám“ v sobě samozřejmě fulltextové hledání zahrnuje, firma jako celek chce ale nabízet kompletní služby na webu. „Když uživatel přijde na domovskou stránku Seznamu, dáváme mu kompletní servis,“ popisuje strategii Zima a poukazuje také na zpravodajství, počasí, e-mail, mapy, nakupování a mnohé další služby. „Ve chvíli, kdy mu všechny umístěné služby nestačí, je hned vedle nich hlavní vyhledávání.“

Nezneužívat data uživatelů

Seznam chce svůj vyhledávač udržet ve hře, na poslední trendy ale reaguje opatrně, nebo úplně po svém. Google například experimentuje se sémantickým vyhledáváním, spouští svůj Knowledge Graph, na něm postavené mobilní Google Now, a masivně doluje sociální data díky Google+ a nespočet informací, třeba geolokačních, ze služeb a aplikací Androidu. Všechny tyto zdroje dat mu pak mají dát lepší, podrobnější a uživateli přesně na míru šité informace.

Klepněte pro větší obrázek
Od podzimu v novém sídle a s plány dál vylepšovat hledání.

Personalizaci hledání se však na Andělu brání. „Nechceme to dělat, protože ta služba musí být stejná pro všechny,“ říká Zima. V Seznamu jsou toho názoru, že aby se uživatelé služby nebáli, musí se chovat předvídatelně a všude stejně. Zásadní roli v tom ale hrají data uživatelů. „Je to kvůli našemu přesvědčení, že nechceme zneužívat uživatelská data,“ doplňuje šéf Seznamu a směje se, že to není kvůli tomu, že by jeho společnost chtěla šetřit za právníky kvůli soudním sporům o ochraně osobních údajů.

I když Seznam například údajně nikdy nebude skenovat e-maily svých uživatelů kvůli datům a kontextové reklamě, sbírání nových dat se rozhodně nebrání. V masivnější míře je chce dostávat především ze svých vlastních služeb. „Data z našich produktů prozatím nevyužíváme tak, jako bychom mohli,“ tvrdí produktový manažer vyhledávání Marek Gizela.

Prioritou české jedničky je v současné době co nejvyšší kvalita dat. „V současné době jsme se zaměřili především na maximální relevanci dat. Maximálně jdeme po kvalitě,“ popisuje Gizela. Seznam podle jeho slov nemá tak dalekosáhlé globální ambice jako Google a bude zásadně posilovat především v tom, co dělá teď. „Budeme se zaměřovat především na specializované databáze, které jsou přínosné pro českého uživatele.“ Firma například před letošními hrami v Londýně začala do výsledků hledání umisťovat aktuální odkazy na zpravodajské články týkající se hledaného slova. „Funguje to výborně,“ libuje si Zima.

Data ze sociálních sítí jsou v současné v současné době podle jeho slov nápomocné, stále však ještě nehrají zásadní roli. V čem nicméně Seznam vidí budoucnost, jsou mobilní zařízení. Mobilní vyhledávání, stejně jako ostatní služby společnosti, na chytrých zařízeních rychle rostou, i když společnost konkrétně v případě mobilního hledání čísla prozatím nezveřejnila.

Až 500 dotazů za sekundu

Seznam je nicméně v mobilní oblasti oproti Googlu a Applu ve značné nevýhodě, nemá totiž vlastní mobilní platformu, se kterou by mohl srůst. I to je důvod toho, proč je například na prodávaných telefonech s Windows Phone na českém trhu Seznam nastavený jako výchozí vyhledávač a proč se firma angažuje ve tvorbě mobilních aplikací na všechny možné platformy. Aktuálně například chystá aplikace pro Windows 8.

Seznam chce na mobilním vyhledávání vydělávat podobně, jako na klasickém – přes bannerovou a kontextovou reklamu. Firma odhaduje, že ještě letos příjmy z mobilních zařízení narostou na 10 milionů korun.

U uživatelů rovněž roste zájem o sémantické vyhledávání. V tomto ohledu je ale podle zástupců Seznamu nutné postupovat opatrně, protože není lehké skládat relevantní data z mnoha zdrojů. „Je to obrovské množství dat, ze kterých není úplně lehké vybírat to nejdůležitější,“ upozorňuje Škrob.

Na fulltextovém vyhledávání největší internetové firmy v Česku se kontinuálně pracuje od roku 2008, kdy zároveň s tím začaly narůstat počty zaměstnanců divize a technika, která hledání pohání. Zatímco ještě v roce 2007 na vyhledávání pracovalo 5 lidí, dnes už to je kolem 70 a plánuje se další růst. Tento malý počet zaměstnanců doprovázelo pouhých 50 serverů, zatímco aktuálně jich firma jenom pro tyto účely provozuje kolem 500. „Dříve jsme servery přidávali po jednotkách kusů, dnes po desítkách,“ usmívá se Gizela.

Každý takový server pracuje s 24 procesorovými jádry, 32 GB operační paměti a všechny dohromady při běžné zátěži vyhledávání zpracují kolem 350 dotazů za sekundu, ve špičce až 500. Indexovací robot v průměru stáhne tisíc stránek za sekundu. Databáze robota v současné době činí zhruba 35 TB dat, které běží na platformě Hadoop. Seznam už indexuje 700 milionů stránek.

Na vyhledávači pracuje nejvíce programátorů (v Seznamu se jim říká „prgači“) z Prahy, Brna a Českých Budějovic a velkou část týmu tvoří také výzkumníci a kalibrátoři.

Témata článku: Web, Byznys, Seznam.cz

43 komentářů

Nejnovější komentáře

  • Martin Pokorný 17. 8. 2012 18:54:22
    Je pravda, že vzájemná konkurence jim jedině prospívá, o tom žádná… jinak...
  • Naith (novy) 17. 8. 2012 17:07:31
    Kdyby nebyl Seznam tak služby Google v ČR budou asi na takové úrovni, jako...
  • mroyko 17. 8. 2012 16:55:17
    ale to ze se v cr google diky seznamu snazi se poprit neda. Kdyby byl...
Určitě si přečtěte