Google již před časem zveřejnil odborné veřejnosti svůj systém strojového učení TensorFlow a nyní přidává další aplikaci „Show and Tell,“ která nad ním staví. Jedná se o automatický popisný systém fotografií. TensorFlow se nejprve na vzorku fotografií s popisky naučí, jak vypadají různé věci, a pak mu můžete předložit cizí snímek, který se pokusí pospat vlastními slovy. Jde mu to poměrně dobře s úspěšností nad 90 %.
Google se na základě člověkem popsaných fotografií naučil přidávat vlastní popis scény. Nyní technologii zveřejnil jako open-source
Show and Tell (im2txt) je k dispozici na GitHubu, ale jedná se skutečně o jen o surový základ. Zájemci, kteří si budou chtít vycvičit vlastní neuronovou síť, budou potřebovat mašinu s pořádným výkonem a cvičební data. Google doporučuje vzorek 300 000 fotografií COCO.
Google se chlubí, že svoji technologii za poslední dva roky výrazně zlepšil. Fotografie v pozadí odpovídá první verzi, ta v popředí pak té aktuální. Firma v minulosti pokořila ostatní technologie rozpoznávání v soutěži MSCOCO.
A jak dlouho to bude trvat? Na počítači s GPU Nvidia Tesla K20m zabere jen první kolo výcviku až dva týdny a celé učení se pak roztáhne asi na měsíc. Na pomalejších hardwarových konfiguracích to tedy raději ani nezkoušejte.