Microsoft | Umělá inteligence | Strojové učení

Microsoft se pochlubil nejlepším rozpoznáváním lidské řeči s nejnižší chybovostí v historii

Microsoft se pochlubil nejlepším rozpoznáváním lidské řeči s nejnižší chybovostí v historii

Rozpoznávání lidské řeči pomocí počítačových systémů se v poslední době velmi rychle zlepšuje hlavně díky použití hlubokých neuronových sítí v kombinaci s velkým množstvím dat. Microsoft se pochlubil, že jeho systém rozpoznání řeči má nejnižší chybovost ze všech.

Na oficiálním blogu Microsoftu jsou k dispozici i konkrétní výsledky testů, které se používají jako měřící standard schopnosti systému rozpoznat lidskou řeč.

V rámci chybovosti (WER – word error rate) se Microsoft pyšní pouze 6,3 %, což je dle tvrzení zatím nejnižší hodnota, která byla při těchto testech dosažena. IBM nedávno představilo vlastní systém, který má chybovost 6,6 %, což je velmi blízko.

Klepněte pro větší obrázek
Vývoj chybovosti v průběhu historie (Zdroj: Microsoft)

Jak je vidět na obrázku, pokrok v této oblasti oproti minulosti je značný – chybovost před dvaceti lety byla 43 %, což je pochopitelně i značně nepoužitelné pro reálné nasazení, když polovina slov není správně rozpoznaná.

Inženýři mohou nyní cvičit systémy umělé inteligence velmi rychle a mnohem přesněji. Cílem je posunout schopnosti rozpoznávání lidské řeči na stejnou nebo lepší úroveň, než kterou má i sám člověk.

Aby ale bylo možné dosáhnout perfektního rozpoznávání řeči třeba u Cortany, Siri, Alexy a dalších hlasových systémů, je nutné počítat se zahrnutím i dalších dat, které se netýkají samotného hlasu. Aby bylo možné rozpoznat vyšší úrovně, je nutné chápat větší souvislosti a vědět co nejvíce informací o samotném uživateli jak v reálném čase, tak i z pohledu minulosti a budoucnosti.

Microsoft v tomto směru již dříve představil Caap (Conversation as a Platform), který se skládá právě z těchto částí nejen u chytrých asistentek, ale i chytrých chatbotů a podobně.

Díky tomu, že všichni hlavní technologičtí hráči jako Microsoft, IBM, Apple nebo Google vyvíjí systémy na bázi hlubokých neuronových sítí, konkurenční předností je co největší množství dat a rychlost, se kterou se umělá inteligence učí vše rozpoznávat.

Z pohledu celosvětového nasazení pro různé jazyky má jistě nejvíce navrch hlavně Google, který si pro rychlé a efektivní zpracování dat vytvořil i vlastní hardware v podobě procesoru TensorFlow.

Zdroj obrázku: Flickr (CC BY-SA 2.0)

Diskuze (13) Další článek: Facebook chce zrychlit vývoj vlastního modulárního hardwaru, koupil startup Nascent Objects

Témata článku: Technologie, Microsoft, Umělá inteligence, Výzkum, Strojové učení, Cortana, Neuronová síť, Nejnižší úroveň, Chybovost, Reálné nasazení, Rozpoznávání, Nejnižší hodnota, Rate, Efektivní zpracování, Google Photos, Oficiální blog, M/s, Flickr.com, Milestone, Chytrý asistent, Hlasový systém, REC, Počítačový systém, Řeč, Největší množství


Určitě si přečtěte

Lék na oteplování planety: Dokázali bychom posunout Zemi dál od Slunce?

Lék na oteplování planety: Dokázali bychom posunout Zemi dál od Slunce?

** Aktuální změny klimatu jsou marginální ve srovnání s tím, co čeká Zemi za pár miliard let. ** Slunce se začne v budoucnu rozpínat a zvyšovat svou zářivost. ** Dokázali bychom Zemi posunout dál od Slunce a zachránit ji?

Petr Kubala | 56

Co zabírá nejvíce místa na disku? Těchto 10 nástrojů odhalí největší žrouty dat

Co zabírá nejvíce místa na disku? Těchto 10 nástrojů odhalí největší žrouty dat

** Je vhodné jednou za čas zanalyzovat, co vám leží na disku ** Poradíme vám nástroje, kterými zjistíte, jaká data uchováváte ** Podle výsledků můžete optimalizovat svá data či úložiště

Karel Kilián | 47

Lektvar z války Severu proti Jihu zabírá i tam, kde selhávají moderní antibiotika

Lektvar z války Severu proti Jihu zabírá i tam, kde selhávají moderní antibiotika

** Američtí farmakologové hledali inspiraci pro vývoj nových léků v brožuře z americké občanské války ** Jižanští felčaři podle ní připravovali rostlinné extrakty chránící rány před zánětem ** Výluhy ze tří dřevin zabírají i proti bakteriím rezistentním k antibiotikům

Jaroslav Petr | 2

Zranitelnost platebních karet Visa umožňuje zločincům obejít limit při bezkontaktních platbách

Zranitelnost platebních karet Visa umožňuje zločincům obejít limit při bezkontaktních platbách

** Odborníci přišli na to, jak obejít limit bezkontaktních plateb ** Stačí zařízení, ovlivňující komunikaci mezi kartou a terminálem ** Stahují se nad bezkontaktními platbami mračna?

Karel Kilián | 71

Mac Pro: Apple nehraje na kompromisy a postavil počítač bez ohledu na cenu

Mac Pro: Apple nehraje na kompromisy a postavil počítač bez ohledu na cenu

** Apple uvedl nový modulární počítač s vysokým výkonem ** Vrátil se k rozšiřitelnosti a standardnímu formátu ** Cena se může vyšplhat až k milionu

Karel Javůrek | 140