GoodVision: jak český startup využívá umělou inteligenci pro analýzu videa

  • Český startup GoodVision se specializuje na analýzu videa pomocí umělé inteligence
  • Dokáže velmi přesně snímat pohyby objektů v čase
  • Hlavní předností je využití v dopravě a následné analýzy, kterou nemusí počítat lidé

V Česku stále vznikají startupy s globálním potenciálem a jedním takovým je i GoodVision s jehož zakladateli – šéfem Danielem Štofanem a technickým šéfem Lukášem Hrubým jsme udělali podrobný rozhovor. Co všechno obnáší analýza obrazu a systém, který vyhodnocuje statistiku dopravy? V čem jsou napřed oproti konkurenci a jaké mají plány? To vše se dozvíte v článku.

Umělá inteligence se pomalu stává základem takřka každého oboru a k tomu se před nějakou dobou vyjádřil i šéf samotné Nvidie, která dostala specializovaná tensor jádra pro akceleraci umělé inteligence dokonce i do nových domácích herních grafických karet GeForce RTX 2000. Díky umělé inteligenci lze nahradit spoustu lidských činností a urychlit zpracování věcí, které trvaly měsíce třeba na pouhé hodiny. A to přesně je případ i společnosti GoodVision.

Zpracování videí z kamerových záznamů

GoodVision se nyní soustředí na velmi specializovanou oblast – zpracovávání videozáznamů z kamer, které jsou namířené na křižovatky, silnice nebo chodníky. V rámci sledovaných objektů dokáží správně rozpoznat, co je auto, co autobus, tramvaj, kolo nebo třeba člověk.

Klepněte pro větší obrázek
Ukázka z webového rozhraní

Ale zatímco jiné systémy to dokážou rozpoznat jen z určitého úhlu nebo ve statickém obraze, systém GoodVision pracuje na bázi pohybu a je schopen vyhodnocovat, jak konkrétní objekt projel nebo prošel v rámci celého záběru a tím pádem i počítat, kolik daných objektů a v jaké trase putuje skrze danou sledovanou oblast. Jakou rychlost měly dané objekty, jak dlouho se v obraze vyskytovaly a další metriky.

Vtipná ukázka toho, s čím si systém musí poradit:

Jak lze vidět na obrázcích, ale i z videa, lze díky tomu velmi snadno vyhodnocovat hustoty dopravy v daném místě s velmi přesnými počty, které jsou pak důležité třeba pro posílení infrastruktury, úpravy či budoucí návrhy silnic, křižovatek a další infrastruktury.

Konkurence: člověk

Hlavní konkurencí GoodVision jsou vlastně jen lidé, protože většina současných společností, které dělají podobné analýzy obrazu z kamer, spoléhá na lidskou sílu a ideálně tu nejlevnější (Indie, Mechanical Turk a další). Ve výsledku to vypadá tak, že se jeden záznam z kamery pošle dvěma či třem lidem, kteří ho celý prohlédnou a během toho pečlivě spočítají počet dopravních prostředků nebo lidí, kteří danou trasou projeli nebo prošli. Protože člověk dělá chyby, výsledné počty jsou průměrem získaných dat od všech zainteresovaných „počtářů“.

Tento proces je pochopitelně velmi nákladný, neškálovatelný a časově náročný, což neplatí o GoodVision, který na vše používá chytré algoritmy a umělou inteligenci, která má velmi malou chybovost a navíc se neustále učí k lepšímu.

Škálovatelný cloud

Tvůrci GoodVision už mysleli dopředu a stavěli systém tak, aby byl snadno škálovatelný. Je tak postavený celý na cloudu v Amazonu, kde vše běží. Při zpracování záznamů z kamer se používají grafické výpočetní karty Nvidie a platforma cuda s TensorFlow, díky čemuž je vše rychlé a spouští se jen na konkrétní úlohy. Firma má tak zjednodušeně „náklady“ jen když skutečně „vydělává“ - zpracovává nahrané video.

Proces funguje rychle a jednoduše – zákazník si v rámci webového rozhraní nahraje videozáznam jakéhokoli charakteru – různé rozlišení i kvalita. Do jedné hodiny od nahrání má pak k dispozici na stejném místě podrobně zpracovaný report i analýzu, se kterou může dále pracovat a zjišťovat další podrobnosti o objektech.

Samozřejmostí jsou přehledné heatmapy a další prvky. Zákazník tak dopředu nezadává, co chce zjistit a co zpracovat. Video se zpracuje kompletně a pak až ve zpracovaném videu si sám v reálném čase vybere, co vše chce vědět za informace, třeba jen v konkrétním výřezu obrazu a podobně.

GoodVision už má předem spočítané náklady, takže i zákazník už předem ví, kolik ho zpracování bude stát (dle délky a informací, které chce). Díky strojovému zpracování navíc nedochází k narušení soukromí, protože po zpracování videa už se v systému pracuje pouze s analytickými daty a nikoli videozáznamem samotným.

Hlavní předností jsou modely pro umělou inteligenci

Systém GoodVision je založen na chytrých algoritmech, které si tvůrci sami vytvořili. Tou největší hodnotou jsou pro ně ale modely. Zatímco algoritmy lze vymyslet a nějaký chytrý programátor by je mohl ve sklepě u maminky vymyslet a uvolnit jako open source, v případě modelů už to tak jednoduché není. K jejich tvorbě je totiž nutné mít obrovské množství dat.

GoodVision vycvičil umělou inteligenci na záběrech z více než 10 tisíc různých scén. I to je jeden z důvodů, proč si systém poradí s různou kvalitou, různým počasím a dalším problémy v obraze, který nikdy není ideální a jednotný.

Zakladatelé táhnou firmu z vlastních zdrojů a někteří z týmu GoodVision pracovali na produktu ještě při škole. V současnosti tým tvoří už 13 lidí a firma hledá investora pro expanzi do světa hlavně z obchodního pohledu.

Cílem jsou chytrá města i marketing

Hlavní cílovou skupinou tohoto řešení jsou chytrá města, kde je analytické vyhodnocování dopravní infrastruktury jednou z klíčových částí. Zatímco manuálně by něco takového nebylo možné dělat za rozumné peníze a v použitelném čase, s GoodVision lze například automaticky nechat posílat videozáznamy ke zpracování a mít tak pravidelně k dispozici informace o dané lokalitě.

Klepněte pro větší obrázek

Dalším trhem jsou například analýzy toho, kolik lidí projde v rámci konkrétní ulice - zajímavé třeba pro podniky, které plánují postavit třeba pobočku. Do budoucna se počítá i s tím, že by systém dokázal zpracovávat i videozáznamy uvnitř budov – například v hypermarketech se spoustou obchodů a podobně. I zde se analytická data určitě hodí.

Spuštění už příští měsíc

GoodVision spolupracuje s dalším českým startupem – AngelCam, který se stará především o získávání videozáznamů do cloudu. GoodVision je tak z tohoto pohledu skvělým doplňkem, který může AngelCam nabídnout svým zákazníkům, kteří si u něj ukládají a archivují videozáznamy.

GoodVision má byznys model postavený na speciálních kreditech, které si člověk předplácí podle toho, kolik hodin záznamu chce zpracovat. Základní cena za jednu hodinu videa je 15 eur, při pravidelném měsíčním plánu se ale lze dostat až na úroveň 4 eur za hodinu zpracovaného videa. K dispozici je ale i veřejné demo, na kterém si lze zpracování vyzkoušet a stejně tak ovládací webové rozhraní.

V současnosti už má GoodVision za sebou přes 30 projektů, na kterých se testoval a upravoval celý systém dle odezvy prvních zákazníků. V této fázi startupu se počítá s tím, že obchod bude fungovat online, čemuž je přizpůsobené i jednoduché webové rozhraní. Díky cloudovému škálovatelnému řešení si navíc už v této fázi poradí s takřka „neomezeným“ počtem zákazníkům, což je hlavní výhoda cloudu a paralelnímu zpracování na spoustě instancí v AWS.

Klepněte pro větší obrázek
Tým GoodVision

V nejbližší budoucnosti je kromě zahraniční obchodní pobočky v plánu například spojování oddělených videí, kdy chybí záznam například z jednoho dne nebo big data analýzy velkých časových úseků - například ukaž všechny čtvrtky za poslední čtvrtletí a podobně. Možnosti pro další rozšiřování jsou ale obrovské.

Diskuze (4) Další článek: Nákupní tip: 27" monitor s panelem IPS, rozlišením 4K a solidním stojanem za 7 990 Kč

Témata článku: , , , , , , , , , , , , , , , , , , , , , , , ,