Microsoft se pochlubil nejlepším rozpoznáváním lidské řeči s nejnižší chybovostí v historii

Rozpoznávání lidské řeči pomocí počítačových systémů se v poslední době velmi rychle zlepšuje hlavně díky použití hlubokých neuronových sítí v kombinaci s velkým množstvím dat. Microsoft se pochlubil, že jeho systém rozpoznání řeči má nejnižší chybovost ze všech.

Na oficiálním blogu Microsoftu jsou k dispozici i konkrétní výsledky testů, které se používají jako měřící standard schopnosti systému rozpoznat lidskou řeč.

V rámci chybovosti (WER – word error rate) se Microsoft pyšní pouze 6,3 %, což je dle tvrzení zatím nejnižší hodnota, která byla při těchto testech dosažena. IBM nedávno představilo vlastní systém, který má chybovost 6,6 %, což je velmi blízko.

Klepněte pro větší obrázek
Vývoj chybovosti v průběhu historie (Zdroj: Microsoft)

Jak je vidět na obrázku, pokrok v této oblasti oproti minulosti je značný – chybovost před dvaceti lety byla 43 %, což je pochopitelně i značně nepoužitelné pro reálné nasazení, když polovina slov není správně rozpoznaná.

Inženýři mohou nyní cvičit systémy umělé inteligence velmi rychle a mnohem přesněji. Cílem je posunout schopnosti rozpoznávání lidské řeči na stejnou nebo lepší úroveň, než kterou má i sám člověk.

Aby ale bylo možné dosáhnout perfektního rozpoznávání řeči třeba u Cortany, Siri, Alexy a dalších hlasových systémů, je nutné počítat se zahrnutím i dalších dat, které se netýkají samotného hlasu. Aby bylo možné rozpoznat vyšší úrovně, je nutné chápat větší souvislosti a vědět co nejvíce informací o samotném uživateli jak v reálném čase, tak i z pohledu minulosti a budoucnosti.

Microsoft v tomto směru již dříve představil Caap (Conversation as a Platform), který se skládá právě z těchto částí nejen u chytrých asistentek, ale i chytrých chatbotů a podobně.

Díky tomu, že všichni hlavní technologičtí hráči jako Microsoft, IBM, Apple nebo Google vyvíjí systémy na bázi hlubokých neuronových sítí, konkurenční předností je co největší množství dat a rychlost, se kterou se umělá inteligence učí vše rozpoznávat.

Z pohledu celosvětového nasazení pro různé jazyky má jistě nejvíce navrch hlavně Google, který si pro rychlé a efektivní zpracování dat vytvořil i vlastní hardware v podobě procesoru TensorFlow.

Zdroj obrázku: Flickr (CC BY-SA 2.0)

Diskuze (13) Další článek: Facebook chce zrychlit vývoj vlastního modulárního hardwaru, koupil startup Nascent Objects

Témata článku: Technologie, Microsoft, Umělá inteligence, Výzkum, Strojové učení, Cortana, Neuronová síť, Počítačový systém, Rozpoznávání, HIS, Největší množství, Nejlepší, Nejnižší úroveň, Reálné nasazení, Chytrý asistent, Řeč, Milestone, Google Photos, Oficiální blog, Nejnižší hodnota, Chybovost, Rate, REC, M/s, Efektivní zpracování



Konec českého poskytovatele internetu v přímém přenosu. Připomíná to krachující energetické firmy
Lukáš Václavík
CETINPoskytovatelé internetuPřipojení k internetu
Tuto českou základnu plnou satelitů nesmíte vidět. V Mapy.cz je každá anténa pečlivě vyretušovaná

Tuto českou základnu plnou satelitů nesmíte vidět. V Mapy.cz je každá anténa pečlivě vyretušovaná

** Zapomeňte na rozčtverečkovaná místa, kterých si každý všimne ** Mapy.cz musely dokonale zakrýt desítky parabol ** Základnou se přitom na webu chlubí i její majitel. Kocourkov

Jakub Čížek
ČeskoMapy.czMapy
Starlink překvapivě zlevňuje. I v Česku teď satelitní internet stojí o polovinu méně
Karel Kilián
StarlinkPoskytovatelé internetuPřipojení k internetu
Za WhatsApp se bude platit! Za předplatné dostanete funkci, která je u konkurence zadarmo

Za WhatsApp se bude platit! Za předplatné dostanete funkci, která je u konkurence zadarmo

** Bylo to jen otázkou času ** Už i WhatsApp nabízí prémiové předplatné ** Za poplatek dostanete funkci, která je u konkurence zadarmo

Martin Chroust
předplatnéWhatsAppMobilní aplikace
Facebook má nejspíš vaše telefonní číslo, i když jste mu ho nikdy nedali. Tímto tajným nástrojem ho můžete smazat

Facebook má nejspíš vaše telefonní číslo, i když jste mu ho nikdy nedali. Tímto tajným nástrojem ho můžete smazat

**Meta poskytuje nástroj na vymazání telefonních čísel a e-mailových adres z Facebooku a Instagramu **V minulosti Mark Zuckebrg popřel, že by Facebook vytvářel stínové profily **Metě teď můžete sebrat klíčové iddentifikátory, pořád o vás ale nejspíš ví mnoho dalšího

Petr Urban
MetaSledováníSociální sítě
Google není jen vyhledávač: 15 užitečných funkcí, o kterých možná ani nevíte

Google není jen vyhledávač: 15 užitečných funkcí, o kterých možná ani nevíte

** Google umí kromě vyhledávání i spoustu dalších věcí ** Vybrali jsme více než 15 užitečných funkcí a schopností ** Stačí zadat do vyhledávače ta správná klíčová slova

Karel Kilián
TipyVyhledávačeGoogle
Nvidia jde za hranice možností. Technologické pozadí kouzel skrytých za zkratkou DLSS 3.0

Nvidia jde za hranice možností. Technologické pozadí kouzel skrytých za zkratkou DLSS 3.0

S novou generací GeForce představila Nvidia další evoluci DLSS pro zvyšování výkonu. Umělá inteligence se naučila generovat rovnou celé snímky.

Adam Vágner
Nvidia
Nový hit. Tahle appka vám udělá profilovku jako od pouličního ilustrátora

Nový hit. Tahle appka vám udělá profilovku jako od pouličního ilustrátora

** Aplikace NewProfilePic se na Androidu stala hitem ** Můžete si v ní vytvořit profesionálně vypadající profilovky ** Pozor ale na agresivní cenovou politiku za Pro verzi

Martin Chroust
FotografieUmělá inteligenceMobilní aplikace
Máte rádi malé telefony? Pak si oblíbíte tohoto třípalcového drobečka, který není větší než platební karta

Máte rádi malé telefony? Pak si oblíbíte tohoto třípalcového drobečka, který není větší než platební karta

** Dnešní telefony se předhánějí v tom, který z nich bude větší ** Malé telefony na trhu skoro vyhynuly... ** Čínská značka si připravila telefon do dlaně s třípalcovým displejem

Martin Chroust
InfraportKompaktní velikostSmartphony