Philip Young je vládce dat londýnské dopravy. Prozradil, jaké vychytávky s nimi lze dělat

  • Londýnský dopravní podnik, to jsou desetitisíce stanic a miliony cestujících
  • Ohromné množství dat se musí zpracovávat, analyzovat a zprostředkovat dalším aplikacím
  • Vyzpovídali jsme šéfa online sekce londýnského dopravního podniku Philipa Younga. Do Česka ho pozval Fond Otakara Motejla

„Dám si čaj a můžeme začít,“ vymínil si před ranním rozhovorem Philip Young, šéf online větve londýnského dopravního podniku Transport for London. Na brněnské radnici jsme s ním mluvili o zveřejňování dopravních dat, sběru dat o uživatelích i plánované spolupráci s Googlem.

Před šesti lety jste začali vydávat data z londýnské dopravy. Byli jste jedna z prvních institucí, která se zveřejněním dat přišla. Co za tím stálo?

Už kolem roku 2006 jsme zahlédli něco podobného v BBC. Měli tehdy experimentální pořad, BBC Backstage. V jednom z dílů přišli se zajímavou novinkou, zveřejnili televizní a rozhlasové programy jako data. Pozvali si několik mladých vývojáři, aby ukázali, co s tím dovedou udělat. Byl to takový raný hackathon.

Klepněte pro větší obrázek
Philip Young z londýnského Transport for London

Měl jsem tehdy v TfL malý tým, nějakých jedenáct dvanáct lidí, kteří se starali o web. Dívali jsme se na ten pořad a říkali si, že máme mnohem zajímavější data: příjezdy metra v reálném čase, plánovač tras, jízdní řády, brzy budeme mít data o aktuální pozici autobusů. Pokud dokáže BBC něco vymyslet nad televizním programem, určitě to půjde s dopravními daty.

 

Londýn v číslech

  • V Londýně žije 8,6 milionu lidí, do roku 2030 má podle prognóz počet obyvatel překonat 10 milionů
  • Transport for London, londýnský dopravní podnik, zaměstnává 27 tisíc lidí
  • Jen autobusových zastávek je v Londýně 20 tisíc, osmitisícová flotila autobusů denně přepraví 6 milionů pasažérů
  • Online sekce, kterou řídí Philip Young, má 140 zaměstnanců
  • Web tfl.gov.uk navštěvuje 80 % Londýňanů, měsíčně jej – včetně mimolondýnských – navštíví 11 milionů lidí
  • 42 % obyvatel města využívá mobilní aplikace k plánování cesty nebo sledování aktuálních časů příjezdu
  • Aplikací nad daty TfL bylo loni v říjnu 462
  • Podle analýzy Deloitte ušetří data TfL ročně Londýňanům čas za 15-58 milionů liber
  • Ekosystém vývojářů nad daty TfL má přes šest tisíc lidí
 

Vy jste už v roce 2006 ukazovali data o aktuální pozici dopravních prostředků?

Data o reálné pozici vozů metra byla dostupná dávno předtím. V každé stanici už tehdy visely cedule, které ukazovaly, za jak dlouho souprava přijede. Dlouho byla tahle data uzavřená v systému, ale postupně jsme je dokázali dostat ven a nabídnout ostatním.

Jak jste začínali?

Našli jsme programátora, Maďaroaustralana jménem Balázs Boros. Dokázal vydolovat data z našeho webu přes screen scraping a vytvořit z nich pro Mac widget, který ukazoval skutečné příjezdy metra. Byli jsme nadšení, přesně tohle jsme chtěli.

S Balászem jsme tedy vytvořili widget, který ukazoval stav jednotlivých linek metra. Dnes ho můžete vidět všude v Londýně a napodobují ho i další města všude po světě. Původně měl sloužit hlavně k tomu, aby si ho Londýňané umístili na svoje stránky. Chtěli jsme se dostat na weby fotbalových klubů. Nabídli jsme ho tehdy na iGoogle a NetVibes, jestli si na tyhle webové služby ještě vzpomínáte.

Ještě jsem nezmínil motivaci. Tou pro nás byli naštvaní zákazníci. Stávalo se, že přišli na stanici metra, zjistili, že je zavřená, a byli velmi hrubí. O víkendech totiž probíhaly technické práce a často byly zavřené dvě nebo tři linky najednou. Chtěli jsme, aby se právě tihle lidi před cestou podívali na naše informace. Proto widget kromě aktuálního stavu všech tratí ukazoval, co chystáme na víkend.

Kdy jste se od widgetu posunuli k datům?

Widget byl první krok. Hned vzápětí se ovšem ozvali vývojáři, že si chtějí widget nastylovat sami, že se jim hodí jen část, rádi by widget lokalizovali nebo personalizovali. Řekl bych, že tohle byl skutečný začátek. Začali jsme přemýšlet nad tím, jak jim tohle umožnit.

Klepněte pro větší obrázek
Widget, který nastartoval cestu londýnského dopravního podniku k otevřeným datům

Vývojáři tedy chtěli otevřená data, jak jim říkáme dnes?

Neznal jsem tehdy principy otevřených dat. Zaslechl jsem někde to spojení, ale to tak všechno. Spíš jsme opravdu jen reagovali na to, co po nás někdo chce. Měli jsme malý tým a museli jsme rozmýšlet, čemu se věnovat. Samozřejmě jsme chtěli, aby Londýňané chodili na náš web, věnovali jsme mu hodně úsilí. Ale taky nám bylo jasné, že dopravní informace budou lidi hledat i na jiných stránkách, a s těmi musíme spolupracovat. Na aplikace jsme tehdy nemysleli, byl rok 2007 a nikdo netušil, jak budou dominantní.

Vlastní aplikaci nevyvíjíme, rozbili bychom ekosystém

Dnes váš web navštěvuje 80 procent obyvatel Londýna. Zároveň ale říkáte, že jsou pro vás klíčové aplikace, které vaše data využívají.

Náš web i cizí aplikace se doplňují, nejde je stavět proti sobě. Snažíme se, aby kdokoliv, kdo se někam chystá, dostal veškeré informace. Příliš neřešíme, kde je vezme. Chápeme, že lidi využívají různé zdroje. Nepovažujeme svůj web za konkurenci k aplikacím, které dělají soukromé firmy.

Vlastní aplikaci ale nechcete, abyste ostatním nesebrali vítr z plachet …

Samozřejmě bychom mohli spustit svou aplikaci, ale dáváme si pozor, abychom nepoškodili ekosystém vývojářů nad našimi daty. Navíc dovedou být v některých věcech kreativnější než my nebo rychleji reagovat na nová data. V současnosti na našich datech staví téměř pět stovek aplikací a přes šest tisíc vývojářů se zaregistrovalo k odběru našich dat.

Je ale pravda, že občas nám tenhle přístup způsobuje problémy. Raději bych měl říct výzvy. Hlavní důvod je ten, že přes cizí aplikace ztrácíme přímý kontakt s cestujícími. Přitom jim občas potřebujeme něco sdělit přes push notifikace nebo naopak zjišťovat něco o nich: kde jsou, jak naše služby využívají. S tvůrci některých aplikací se na tom lze snadno domluvit, protože máme podobnou motivaci. Pro nás je klíčové zařídit plynulost a snadnou přístupnost dopravy. S některými se ovšem naše motivace rozcházejí, někteří nás považují za konkurenci. Tam je to těžší.

V Česku je otevírání dopravních dat komplikované i kvůli soukromým firmám, které spravují nebo vlastní část dat. U vás ne?

Staráme se o všechny dopravní uzly v Londýně, včetně silnic. Obvykle zadáme veřejnou zakázku na vybudování systému, někdy i jeho provozování. Třeba linku Docklands Light Railway provozuje nasmlouvaná společnost, ale její vozy nesou naše jméno a my máme práva na data, spojená s provozem.

Takže si dáváte pozor, aby byla data vždycky vaše.

Ano, patří nám. To ale neznamená, že je vždy snadné se k nim dostat. Provozovatel třeba nemusí mít dostupné API a musíme hledat řešení. Vyžadovat otevřená data v nových zakázkách je jednoduché; roubovat je na existující systém naopak bývá komplikované.

Ale i to se nám podařilo. Naše autobusy používaly velmi moderní systém pro sdílení aktuálních časů příjezdu. Ty se ukazují na zastávkách a na našem webu. Přesto na otevřená data nebyl připraven. Problém nastal přesně v tom okamžiku, kdy jsme nový systém v autobusech spustili. Zjistili jsme, že potřebujeme otevřená data. Takže jsme museli pět minut po dvanácté upravit smlouvu a systém upgradovat.

 

„Díky tomu, že ukazujeme skutečné příjezdy autobusů na zastávky, mají miliony cestujících autobusem denně několik minut navíc. Můžou si tak v klidu dojíst toust.“

 

Jako průkopníci otevřených dat máte určitě příklady, kdy se něco vyloženě nepovedlo?

Velmi rychle jsme se naučili, že otevřením dat zvýšíme jejich kvalitu. Okamžitě po uveřejnění některých datasetů se nám ozvali vývojáři s tím, co se jim nezdá. Tahle zastávka má být jinde, u téhle zase v jízdním řádu některý spoj chybí. Neříkáme, že všechno, co vydáváme, je dokonalé. Nejlepší, co můžeme udělat, je zveřejnit data a počkat, co se bude dít dál.

Tohle byl ostatně silný argument úplně na začátku, kdy se řešilo, jestli vůbec data otevírat. Někteří lidi v úřadě se báli, že se ukážou naše chyby. Další se zase ptali, jestli bude naše data vůbec někdo používat. Vzhledem k tomu, že v roce 2005 u nás došlo k teroristickému útoku, byly i bezpečnostní obavy, ale ty spíš v menší míře.

Myslím, že dobrá odpověď jsou čísla. Analýza Deloitte před časem tvrdila, že čas, který lidem každý rok ušetříme, má hodnotu 15-58 milionů liber. Počet návštěvníků webu a aplikací se mezitím zdvojnásobil, takže tohle číslo taky. Naše náklady na otevřená data jsou přitom menší než milion liber.

Bezpečnostní rizika tedy neřešíte?

Nemáme pocit, že bychom ohrožovali město, jsme docela v klidu. Na to, abyste věděl, že na Kings Cross bude v pondělí ráno dav lidí, nepotřebujete zkoumat data. Na to stačí selský rozum. Otevřená data nedělají z Londýna o nic nebezpečnější město.

Klepněte pro větší obrázek
Za tři minuty mi to jede. Web TfL ukazuje časy reálných příjezdů autobusů.

Pro nás je důležité, že každý den šetříme čas svým zákazníkům. Například díky tomu, že ukazujeme skutečné příjezdy autobusů na zastávky, mají miliony cestujících autobusem denně několik minut navíc. Můžou si tak v klidu dojíst toust.

Zveřejňujeme data o pohybu lidí, od Googlu chceme přesnější

Jaké chystáte novinky? Mluvil jste o tom, že chcete nafotit stanice londýnského metra kvůli lepší orientaci …

Naši zákazníci si jistě rádi virtuálně projdou stanicemi metra. Zejména ti s nějakým postižením, pro které jsou jakékoliv schody nebo překážky důležité.

Chcete prý také získat data o pohybu lidí od Googlu.

Rádi bychom měli data od firem, které provozují mobilní operační systémy nebo mobilní sítě. Mají velký objem poměrně detailních dat o tom, kde se lidé pohybují.

K čemu je potřebujete?

Ke zpřesnění svých dat. Mohli bychom lépe plánovat, lépe řídit provoz, přesněji zhodnotit data z minulosti, lépe pracovat s těmi aktuálními. Samozřejmě jde o anonymizovaná data.

Vy sami data o pohybu lidí sbíráte?

Při do metra vstupu můžete označit papírový lístek, obvykle se ale platí kartou, často bezdotykovou. Z té poznáme, kde jste z metra vystoupili. Tahle data shromažďujeme, analyzujeme a do jisté míry i zveřejňujeme. Předtím je samozřejmě anonymizujeme. Nad těmito daty pak může kdokoliv provádět vlastní analýzy, hledat v nich vzorce nebo z nich vytvářet pěkné vizualizace.

U autobusů je to složitější. Dnes se v nich už dá platit pouze kartou – papírové peníze ani mince nepřijímáme – takže zjistíme, kde jste nastoupili. Už ale nepoznáme, kdy vystoupíte. Pomůže nám, když přestoupíte na metro nebo další autobus. Pak dokážeme obě cesty spojit.

Tohle je jeden z důvodů, proč bychom chtěli bohatší data. Existuje několik způsobů, jak se k nim dostat. Mají je například právě mobilní operátoři. Ale jsou komerční, stojí miliony liber. My naštěstí můžeme nabídnout protihodnotu pro barter, například reklamu.

Poslední otázka. Vy jste na počátku devadesátých let chvíli žil ve Znojmě. Teď, když jste se vrátil, jaké jsou největší změny?

Nevrátil jsem se po dvaceti letech, jezdím sem pravidelně. Sleduju, jak se v Praze pomalu rozvíjí síť metra. Taky ten vlak, kterým jsem přijel, byl pěkný, rychlý a s wi-fi. Takže z dopravní perspektivy se věci dost zlepšují.

A kromě dopravy?

Vždycky si návštěvu Česka dost užívám. Mám rád Prahu, mám rád cesty na Moravu. Máte krásnou zemi – to platilo v polovině devadesátých let a platí to i dnes.

Autor je datový novinář Českého rozhlasu.

Diskuze (6) Další článek: Hry ve Windows Store si nekupujte, přijdete o důležité funkce

Témata článku: , , , , , , , , , , , , , , , , , , , , , , , ,