Převod řeči do textu; systémy ASR a V2T
NEWTON Dictate 2.5
 Tisk

NEWTON Dictate je systém rozpoznávání hlasu (ASR - Automatic Speech Recognition) a převod řeči (pro český jazyk) do textové podoby (Voice to Text, někdy označován v2t). Aplikace vznikla za spolupráce mezi vědecko-výzkumným týmem SpeechLab na Technické univerzitě v Liberci a společností NEWTON Technologies, a.s.

Aplikace je určena zejména pro diktování v oblasti:

Uvádí se, že aplikace pro převod řeči do textu Newton Dictate pracuje s nejrozsáhlejším slovníkem pro spojité diktování (běžnou, plynulou řečí) v České republice.

Cena jedné licence NEWTON Dictate v základní verzi je 24 600 Kč bez DPH.

Tuto aplikaci můžeme používat díky laskavosti firmy NEWTON Technologies, a.s.

Na následujícím obrázku vidíte okno aplikace:

Hlasové diktování v programu NEWTON Dictate se provádí pomocí mikrofonu připojeného ke zvukové kartě počítače.

Před začátkem diktování je nutné ověřit, zda hlasový profil zobrazený v horní liště aplikace odpovídá vašemu pohlaví nebo profilu, který jste si vytvořili adaptací na svůj hlas.

V případě potřeby lze profil změnit v menu Nastavení > Parametry přepisu...

V aplikaci je vždy uloženo poslední nastavení.

Úspěšnost přepisu řeči po provedení adaptaci zvýší a rozpoznávací proces a tím i odezva systému se zkrátí.

Důležité jsou různá nastavení vyvolávaná z nabidky Nastavení.

Nastavení parametrů přepisu:

Diktují se čárky, tečky a další interpunkční znaménka. I „nový odstavec“.

Mikrofon by měl být umístěn asi 5 cm před ústy, spíše při dolním okraji úst či dokonce pod ústy.

Editovat a opravovat text je možné i během poslechu diktátu.

Po určitém čase, až se uživatel seznámí s aplikací, si může vytvořit svůj hlasový profil.

Doporučuje se provádět hlasovou adaptaci až poté, co si uživatel osvojí pravidla diktování:

Nastavení kopírování:

Nastavení přídavných ovládacích zařízení:

Nastavení klávesových zkratek:

Nastavení ukládání a kvality:

Nastavení vzhledu:

Pokud aplikace opakovaně není schopna rozpoznat nějaké slovo, typicky například jméno příjmení či název, je možné ho přidat do uživatelského slovníku pomocí hlasového makra (jednou z možností je označit v editačním okně text, který chceme přidat jako nové makro a po umístění ukazatele myši pravým tlačítkem vybrat volbu Přidat jako hlasové makro.

Nastavení klávesových maker:

Nabídka Soubor a Úpravy:

   

Nabídka Formát a Diktát:

   

Nabídka Úroveň záznamu:

Nabídka Nápověda:


Aplikace pracuje ve dvou režimech:

•      režim diktování,

•      režim editace.

Diktování je možné zahájit dvěma způsoby:

Menu: Diktát > Start

Stiskem příslušného tlačítka Spustit diktát v nástrojové liště.