Hlavní Inovace Google AI nyní umožňuje uživatelům okamžitě překládat text ve 27 jazycích pomocí telefonních kamer

Google AI nyní umožňuje uživatelům okamžitě překládat text ve 27 jazycích pomocí telefonních kamer

Jaký Film Vidět?
 
(Gif: Google)

(Gif: Google)



Díky umělé inteligenci nebylo cestování do zahraničí nikdy jednodušší.

Aplikace Překladač Google umožňuje uživatelům okamžitě překládat text. V aplikaci namířte fotoaparát na text, který chcete přeložit, a uvidíte, že se promění v požadovaný jazyk naživo přímo před vašimi očima - není třeba připojení k internetu ani data mobilního telefonu. Tato užitečná funkce je k dispozici již nějakou dobu, ale byla kompatibilní pouze se sedmi jazyky. Nyní , díky strojovému učení Google upgradoval aplikaci na okamžitý překlad 27 jazyků.

Až tedy příště budete v Praze a nebudete si moci přečíst nabídku, máme tu záda, napsal o výzkumu společnosti Otavio Good, softwarový inženýr společnosti Google. Blog .

Google také právě použil AI, aby snížil své chyby rozpoznávání řeči na polovinu.

Od dnešního dne lze kromě překladu mezi angličtinou, francouzštinou, němčinou, italštinou, portugalštinou, ruštinou a španělštinou překládat v reálném čase také následujících 20 jazyků: bulharština, katalánština, chorvatština, čeština, dánština, holandština, filipínština, Finština, maďarština, indonéština, litevština, norština, polština, rumunština, slovenština, švédština, turečtina a ukrajinština. A pokud se rozhodnete pořídit snímek místo sledování živého překladu textu, je podporováno celkem 37 jazyků.

Jak tedy Google dokázal zvýšit počet dostupných jazyků? Nejprve získali Word Lens, dříve aplikaci pro překlad rozšířené reality, a ke zlepšení schopností aplikace použili strojové učení a konvoluční neuronové sítě. Klíčový byl pokrok v rozpoznávání obrazu.

Pokud jste před pěti lety dali počítači obrázek kočky nebo psa, měl problém zjistit, který to je. Díky konvolučním neuronovým sítím mohou počítače nejen rozlišovat mezi kočkami a psy, ale dokonce dokážou rozpoznat různá plemena psů, řekl pan Good. Ano, jsou dobré pro víc než jen trippy umění —Pokud překládáte cizí nabídku nebo se podepisujete pomocí nejnovější verze aplikace Překladač Google, nyní používáte hlubokou neuronovou síť.

Krok za krokem

První Přeložit musí odstranit nepořádek na pozadí a najít text. Když vyhledá objekty BLOB pixelů stejné barvy, určí, že se jedná o písmena. A když jsou tyto objekty BLOB blízko u sebe, chápe, že je třeba číst souvislou linii.

Další, aplikace musí rozpoznat, co je to každé jednotlivé písmeno. Tady přichází hluboké učení.

Používáme konvoluční neuronovou síť, trénujeme ji na písmena i jiná písmena, aby se mohla naučit, jak různá písmena vypadají, čte příspěvek na blogu.

Vědci museli trénovat software pomocí nejen čistě vypadajících písmen, ale také špinavých. Dopisy ve skutečném světě jsou poznamenány odrazy, špínou, šmouhami a všelijakými podivnostmi, napsal pan Good. Takže jsme postavili náš generátor dopisů, abychom vytvořili všechny druhy falešných nečistot, abychom přesvědčivě napodobovali hluk skutečného světa - falešné odrazy, falešné šmouhy, falešné podivnosti všude kolem. Některé z

Některá špinavá písmena používaná k tréninku. (Foto: Google)








The Třetí krok vyhledá rozpoznaná písmena ve slovníku a získá překlady. A pro další pokus o přesnost jsou vyhledávání slovníků přibližná v případě, že je S chybně přečteno jako 5.

Nakonec přeložený text je vykreslen na originál ve stejném stylu.

Můžeme to udělat, protože jsme již našli a přečetli písmena na obrázku, takže víme přesně, kde jsou. Můžeme se podívat na barvy obklopující písmena a použít je k vymazání původních písmen. A potom můžeme překreslit překlad pomocí původní barvy popředí, přečte příspěvek na blogu.

Aby byl tým co nejefektivnější a umožnil dokončení všech těchto kroků v reálném čase bez připojení k internetu nebo datům, vytvořil tým Google velmi malou neurální síť s horní hranicí hustoty informací, které dokáže zpracovat. Protože generovali vlastní tréninková data, bylo důležité zahrnout správná data, ale nic navíc, takže neurální síť nepoužívá příliš mnoho své hustoty informací na nedůležité věci. Příkladem může být to, jak potřebuje rozpoznat písmeno s mírnou rotací, ale ne příliš.

Nakonec uživatelům zbývá dalších 20 jazyků, ale stejně vysoká rychlost.

VIZ TÉŽ: Tým AI společnosti Google nám poskytl snížení nákladů na jejich výzkum strojového učení

Články, Které Se Vám Mohou Líbit :