Diit.cz - Novinky a informace o hardware, software a internetu

Rozpoznávání hlasů la Microsoft

MS Vista Voice Recognition logo
Pokud sledujete IT i byť jen obecně, jistě vám v minulých letech neunikla jedna z vizí Billa Gatese, ovládání PC hlasem (a z toho plynoucí nutnost rozpoznávat mluvené slovo). Windows Vista budou tuto schopnost obsahovat, již aktuální build 5472 si nevede zrovna špatně. Microsoftu sice jeho vlastní nedávná předváděčka skončila totálním fiaskem, ale to bylo jen chybným nastaveným zvukového systému. Rozpoznávání hlasu v současné podobě je totiž značně citlivé na kvalitu signálu z mikrofonu. Jakékoliv přebuzení pošle veškeré rozpoznávací algoritmy „do kytek“, protože v signálu zkrátka chybí potřebné amplitudy. A jak k tomu došlo?...

Na videu můžete, byť lehce nejasně, vidět, že mikrofonní vstup je docela „vymaxován“ a amplitudy hlasu prostě končí v červených částech. A jak už to v případě přebuzení bývá, amplitudy v červených částech jsou ořezány, protože se prostě nevejdou do úrovně na mikrofonním vstupu. Samozřejmě to není chyba člověka, to by si Microsoft na předváděčce dovolil jen stěží. Za problémem s přebuzením mikrofonního vstupu stojí drobný bug ve zvukovém subsystému programu pro rozpoznávání hlasu. Ten se zkrátka v tu nejméně vhodnou chvíli choval tak, že ignoroval požadované změny v nastavení mikrofonního vstupu které mu posílal rozpoznávací program a stále jel zatvrzele „naplno“.

V aktuální interní verzi Visty již mají tuto chybu v Microsoftu opravenu. Ve finální verzi Visty byste tak tento problém již neměli potkat. Ale zajímá vás, jakto že lidé z Redmondu narazili na tento bug až při ostré prezentaci?

Sám předváděč a tým okolo inkriminovaného PC o tomto bugu věděli již dříve, ale protože do dne prezentace nebyl opraven, činili vše možné, aby mu předešli. Vše si několikrát dopředu vyzkoušeli, aby byla jistota, že to proběhne hladce. Speciálně se věnovali právě i přesnému nastavení záznamové úrovně na mikrofonním vstupu, aby vybuzení bylo optimální a rozpoznávací program tak dostával co nejkvalitnější signál k analýze. Celou prezentaci si několikrát prošli a nenastal žádný problém. Problém onoho bugu byl totiž v tom, že se projevoval zcela náhodně. A (Murphy se nyní doma jistě dáví smíchy) projevil se zrovna v okamžiku, kdy se to nejméně hodilo. Ale což, lidé, kterým bylo rozpoznávání hlasu prezentováno, se alespoň pobavili zhruba stejně jako před lety nabitý sál, jemuž Bill Gates předváděl USB scanner pod Windows 98 vyústivší v BSOD :-).

Nicméně, pokud se nezadaří Microsoftu, přijde na záchranu chrabrý rytíř. V tomto případě je jím 18letý Long Zheng, který ve své pětiminutové demonstraci předvádí na Tablet PC Toshiba Portege M400 Tablet PC, že Vista umí hlas rozpoznávat velice slušně. Takže, až si někdy budete s rozpoznáváním hlasu ve Vistě hrát, tak kromě svého akcentu si ohlídejte i nastavení vybuzení mikrofonu.

David "David Ježek" Ježek

Bývalý zdejší redaktor (2005-2017), nyní diskusní rejpal.

více článků, blogů a informací o autorovi

Diskuse ke článku Rozpoznávání hlasů la Microsoft

Pátek, 23 Říjen 2009 - 21:33 | Anonym | Kdo mi pomůže s jednoduchou aplikací na...
Pondělí, 3 Srpen 2009 - 11:45 | Anonym | no, na přepínání písniček ve WMP by to stačílo...
Úterý, 15 Srpen 2006 - 14:53 | WIFT | No, tak jsem si rozpoznávání řeči na vlastní hubu...
Neděle, 13 Srpen 2006 - 21:34 | Anonym | Cloveku k domluveni se staci stejne rozpoznavat...
Neděle, 13 Srpen 2006 - 13:15 | Mo Jaaa | Nalim: Presne tak, na opravdove rozpoznavani...
Pátek, 11 Srpen 2006 - 21:52 | Anonym | Mo Mě stačí jaká je podpora pro MS...
Pátek, 11 Srpen 2006 - 19:15 | Anonym | Nalim: No prave, v tom Warpu neslo jen o povely,...
Pátek, 11 Srpen 2006 - 14:25 | Anonym | Nalim >> presne tak, tu v diskusii...
Pátek, 11 Srpen 2006 - 11:18 | Anonym | Ako cely MS, raz to ide a inokedy ani prd....
Pátek, 11 Srpen 2006 - 11:04 | Anonym | Povely koneckonců umí i kdejaký mobil....

Zobrazit diskusi