Google jest twórcą nowego systemu konwersji tekstu na mowę – Tacotron 2. Działa on ns tyle dokładnie i trudno odróżnić go od głosu prawdziwego człowieka. Tacotron 2 składa się z dwóch głębokich sieci neuronowych, z których jedna przekształca tekst w specjalny spektrogram, a druga – WaveNet odczytuje wykres i interpretuje go jako prawdziwy głos. Tacotron 2 jest obecnie przeszkolony tylko do pracy w języku angielskim, z jednym kobiecym głosem. Jest on w stanie poradzić sobie z niewielkimi błędami w pisowni. Potrafi również odczytać niektóre słowa z odpowiednim akcentem. Sprawdź na dole, która sentencja została wytworzona przez Tacotron 2. Google udostępnia również próbki możliwości sztucznej inteligencji. Jedna z próbek jest wygenerowana przez Tacotron 2, a druga fraza jest wypowiedzią narratora. System potrafi też wypowiadać zdania zgodnie z interpunkcją i podkreślić znaczenie ważnych słów w zdaniu, które zaczynają się wielką literą. Tacotron 2 radzi sobie także z trudnymi nazwami i złożonymi zdaniami z trudną składnią. (druga próbka została wygenerowana przez Tacotron 2)
Źródło: Quartz