Prototyp hledače je hotov, je prý o 20 % lepší než Google

Revoluční dílo moravského programátora prý výrazně zlepší vyhledávání na internetu. Cení si ho na dvě miliardy dolarů. Ovšem výsledky roční práce tomu moc neodpovídají.

Už jsou to téměř dva roky, kdy se na v programu České televize vysílala epizoda investorské reality show Den D s Petrem Hejlem. Moravský programátor tehdy po investorech žádal milion korun na vývoj algoritmu vyhledávače, který by později prodal za miliardy dolarů. Svou investici v pořadu nezískal, ovšem později zajistil potřebný milion od 23 drobnějších investorů a před rokem začal pracovat. Nyní už prý dospěl ke kýženému výsledku.

Podivín z Moravy svou práci loni rozplánoval tak, že v lednu 2012 očekával dokončení prototypu, na kterém by mohl prezentovat schopnosti svého revolučního vyhledávání za účelem prodeje nápadu. Plán se nakonec podařilo splnit a prototyp tzv. Nového hledače je hotov. Hledá prý o 20 % lépe než Google, což předčilo očekávání.

Tajemné jiné objekty

Genialitu Nového hledače autor vysvětluje tím, že na rozdíl od běžných vyhledávačů nehodnotí jenom webové stránky, ale tzv. jiné objekty. Těmi mají být tematicky spojené množiny dílčích částí webových stránek, jako jsou obrázky, videa, skripty, či dokumenty.

 

Existující hledače hodnotí WWW stránky. Já hodnotím něco jiného.

 

Podle Petra Hejla hodnotí tradiční vyhledávače relevanci nalezených webů pouze podle výskytu klíčových slov na stránce a výsledky jsou pak natolik těsné, že pořadí nalezených stránek není korektní. Nový hledač hodnotící „jiné objekty“ má prý daleko větší rozlišovací prostor a poskytne proto daleko přesnější výsledky.

Vliv „jiných objektů“ na hledání si ale sami nevyzkoušíme, veřejná demoverze stále hledá pouze slovo Lednice a zhodnotit se dají pouze autorem uložené výsledky pokusného hledání pro 30 českých a 30 anglických testovacích slov.

Správné je to, co určím

V obsáhlém vyhodnocení se dozvíte, jak moc je Nový hledač před konkurencí. Autor tvrdí, že dává o 20 % lepší výsledky než Google, o 30 % než Bing a o 17 % ve srovnání se Seznamem. Hodnotí přitom relevanci řazení nalezených výsledků. Jak? Tím, že sám určí, které odkazy jsou správné a které špatné. K tomu si stanovil váhu kritérií podle toho, na které stránce vyhledávání se slovo vyskytne.

Celé hodnocení tak pozbývá smyslu z důvodu možné zaujatosti a autor bude zřejmě muset najít jiný způsob, jak přesvědčit o svém úspěchu. Vzhledem k tomu, že u výsledků uvádí i odkazy na uložené výsledky hledání, můžete si vytvořit vlastní hodnocení.

Vyhodnoceni1.png  Vyhodnoceni2.png  Vyhodnoceni3.png
Vyhodnocení výsledku pro Google, Bing a Seznam. Český vyhledávač si ve srovnání s novým hledačem vedl podle Petra Hejla nejlépe.

Vyzkoušel jsem vyhodnotit relevanci výsledků například u obecného slova „jídlo“, kde je podle výsledků autora Google výrazně poražen, protože našel jen čtyři relevantní výsledky. Osobně jsem však spokojen s dvojnásobkem, tedy s osmi nalezenými stránkami Googlu.

A takto bychom mohli pokračovat u každého slova. Leckdy nelze upřít lepší výsledky novému hledači, ovšem pokud výsledky hodnotí jen sám autor, jsou subjektivní a mohou být značně ovlivněné.

Poznámka: původně jsem zde uváděl příklad se slovy „lednice“ a „cars“. Byl jsem však upozorněn, že jednou z inovací hledače je rozeznávání velkých a malých písmen ve hledání. Autor na to upozorňuje drobnou poznámkou pod tabulkou, které jsem si nevšiml, za což se mu tímto omlouvám a původní hodnocení na výše uvedená slova, kde má velikost prvního písmene své opodstatnění, jsem odstranil. Ale jak ukazuje příklad se slovem „jídlo“, problém to neřeší.

Steve dvě miliardy zatím nedal

Docela bláznivě působí roční vývoj hledače. Autor chtěl původně stáhnout celý český internet, aby jej mohl analyzovat. Nakonec na 24TB diskové pole dostal jen milion webových stránek a našel na nich milion slov. Na 60 z nich pak demonstroval výsledky podle svého hodnocení.

Bude taková ukázka Microsoftu stačit, aby nápad za dvě miliardy dolarů koupil? V to doufá Petr Hejl, který si myslí, že by jeho nápad mohl výrazně pomoci vyhledávači Bing v boji proti konkurenčnímu Googlu a dvě miliardy dolarů je odpovídající částka, kterou by Microsoft podle dřívějších investic mohl za nový hledač nabídnout.

Moravský programátor neváhal ještě před započetím vývoje prototypu oslovit přímo Steva Ballmera, šéfa Microsoftu. Z kanceláře vedení se mu dostalo doporučení, že bude vhodné rozjet fungující startup, na kterém bude možné demonstrovat výsledky v praxi. To bylo impulsem k tvorbě prototypu hledače.

Pohádky z jiného světa

Pokud nebude stávající prototyp Microsoftu či jinému zájemci stačit a miliardový obchod neproběhne, hodlá Petr Hejl spustit nový veřejný vyhledávač, na kterém už budou jeho kvality demonstrovány přímo v praxi. Nikoho asi nepřekvapí, že si to vyžádá další nutnou investici, opět jeden milion korun.

Hlodac.png
Demoverze nového hledače nazvaná „Hlodač“ umí stále hledat pouze slovo lednice. Více než testovací vyhledávač je to zmatený web s odkazy.

Nový hledač by měl ukrajovat z vyhledávacího podílu především Seznamu. Plán na první tři roky provozu je strukturovanou pohádkou, ve které je na konci místo svatby princezny 15% podíl v českém vyhledávání a příjmy 24 milionů korun.

Úsměvně působí struktura příjmů, Petr Hejl prostě prodá 1000 bannerů á 12 tisíc korun, což dá dohromady 12 milionů, dalších 12 milionů získá prodejem reklamy na prokliky – 10 tisíc kliknutí za dvanáct set. V té době už budou ve firmě zaměstnáni tři ředitelé, programátor, administrátor fulltextu, marketingový specialista, dva obchodníci, účetní a sekretářka. Čistý zisk bude činit 13 milionů korun, z čehož si 4 miliony nechá Petr Hejl a zbytek půjde investorům.

Rozpočet.png
Plánovaný rozpočet provozu nového hledače

„Předpokládané rozdělení trhu hledačů na Internetu v České republice ve třetím roce činnosti Nového českého hledače bude: Google 65%, Seznam 20%, Nový český hledač 15%“, tvrdí na svém webu Petr Hejl. Vychází z předpokladu, že za pět let získal Google 50% podíl, což vychází na 10 % za rok. V dalších třech letech by tedy dalších 30 % získal na úkor Seznamu. Jenomže do hry zasáhne Nový hledač a polovinu si vezme, tj. oněch 15 %.

Zdroj svých věšteckých schopností Petr Hejl neuvádí, ani tak relevantní analýzu toho, jak se trh s vyhledávači v posledních pěti letech v Česku mění. Český Google před pěti lety rozhodně nestartoval od nuly a jeho růst není přímý. V lednu 2007 už měl 25% podíl, což přiznává přímo Seznam. Srovnání by se spíše hodilo s vyhledávačem Jyxo, které bylo lokální alternativou pro náročnější, ale přesto se nedostalo nad jedno procento. Nedá se očekávat, že by si nový hledač vedl jinak.

Ze snu utopie

Když se ani po třech letech nepodaří hledač prodat, bude podle snu Petra Hejla fungovat prostě dál a ukrajovat z českého vyhledávacího trhu. Kromě prodeje bannerů a placených odkazů bude prý vydělávat zřízené SEO oddělení, kde se bude radit, jak optimalizovat stránky pro nový hledač. Dalším zdrojem peněz má být platba za „expres“ indexaci – kdy se změna webu v novém hledači zaindexuje do 24 hodin. Pro srovnání dodejme, že Google změny na webu Živě indexuje v řádech jednotek minut a zdarma.

Zpočátku se zdál projekt nového vyhledávače sice poněkud bláznivý, ovšem s jistou nadějí, že by na tom možná mohlo něco být. To také jistě bylo inspirací pro investory, kteří Petru Hejlovi poskytli první potřebný milion. Obávám se, že dále už zůstane jen nenaplněným snem jednoho naivního moravského snílka.

Diskuze (194) Další článek: Nejlepší virtuální tiskárna pro Windows

Témata článku: , , , , , , , , , , , , , , , , , , , , , , , ,