Nevralt Nettverk Ble Lært å Kopiere Den Menneskelige Stemmen Nesten Perfekt - Alternativ Visning

Video: Nevralt Nettverk Ble Lært å Kopiere Den Menneskelige Stemmen Nesten Perfekt - Alternativ Visning

Video: CS50 2015 - Week 9 2024, April

2024 Forfatter: Keith Bush | [email protected]. Sist endret: 2023-12-16 14:37

I fjor delte kunstig intelligensfirma DeepMind detaljer om det nye prosjektet WaveNet, et dypt lærende nevralt nettverk som brukes til å syntetisere realistisk menneskelig tale. Nylig ble det gitt ut en forbedret versjon av denne teknologien, som skal brukes som grunnlag for den digitale mobilassistenten Google Assistant.

Et stemmesyntesesystem (også kjent som en tekst-til-tale-funksjon, TTS) er vanligvis bygd rundt en av to grunnleggende metoder. Den konkatenative (eller samlingen) metoden innebærer konstruksjon av fraser ved å samle individuelle stykker innspilte ord og deler som tidligere er spilt inn med involvering av en stemmeskuespiller. Den største ulempen med denne metoden er behovet for å stadig erstatte lydbiblioteket når det oppdateres eller endres.

En annen metode kalles parametrisk TTS, og funksjonen er bruken av parametersett som datamaskinen genererer ønsket setning med. Ulempen med metoden er at oftest resultatet manifesterer seg i form av urealistisk eller såkalt robotlyd.

WaveNet produserer derimot lydbølger fra bunnen av ved hjelp av et konvolusjonelt nevralt nettverkssystem der lyd genereres i flere lag. For det første, for å trene plattformen for å syntetisere "live" tale, blir den "matet" en enorm mengde prøver, mens den legger merke til hvilke lydsignaler som virker realistiske og hvilke ikke. Dette gir stemmesyntesen muligheten til å reprodusere naturalistisk intonasjon og til og med detaljer som smacking lepper. Avhengig av hvilke taleprøver som kjøres gjennom systemet, lar dette det utvikle en unik "aksent", som på sikt kan brukes til å skape mange forskjellige stemmer.

Skarp på tungen

Den største begrensningen av WaveNet-systemet var kanskje at det krevde en enorm mengde datakraft for å kjøre, og selv når denne betingelsen ble oppfylt, skilte den seg ikke i hastighet. For eksempel tok det omtrent 1 sekund tid å generere 0,02 sekunder lyd.

Etter et års arbeid fant DeepMind-ingeniører fremdeles en måte å forbedre og optimalisere systemet slik at det nå er i stand til å produsere en rå lyd på ett sekund på bare 50 millisekunder, noe som er 1000 ganger raskere enn dets opprinnelige evner. Spesialistene klarte dessuten å øke lydsamplingsfrekvensen fra 8-bit til 16-bit, noe som hadde en positiv effekt på testene som involverte lyttere. Disse suksessene har banet vei for WaveNet å integrere seg i forbrukerprodukter som Google Assistant.

Salgsfremmende video:

For tiden kan WaveNet brukes til å generere engelske og japanske stemmer gjennom Google Assistant og alle plattformer som bruker denne digitale assistenten. Siden systemet kan lage en spesiell type stemmer, avhengig av hvilket sett med prøver som ble gitt det til trening, vil Google i nær fremtid sannsynligvis introdusere støtte for å syntetisere realistisk tale i WaveNet på andre språk, inkludert å ta hensyn til dem. lokale dialekter.

Talegrensesnitt blir mer og mer vanlig på et bredt utvalg av plattformer, men deres utpregede unaturlige karakter av lyden slår av mange potensielle brukere. DeepMinds innsats for å forbedre denne teknologien vil helt sikkert bidra til en bredere bruk av slike talesystemer, samt forbedre brukeropplevelsen fra deres bruk.

Eksempler på engelsk og japansk syntetisert tale ved å bruke det nevrale nettverket WaveNet kan du finne ved å følge denne lenken.

Nikolay Khizhnyak

Anbefalt:

I USA Ble Det For Første Gang Dyrket En Nesten Fullstendig Kopi Av Den Menneskelige Hjerne Fra Celler - Alternativt Syn

Forskere ved Ohio State University sa at de var i stand til å vokse en nesten fullstendig kopi av den menneskelige hjerne. En melding om dette dukket opp på universitetets offisielle nettside

Roboten Ble Lært å Kopiere Ansiktsuttrykk Til En Person - Alternativt Syn

En japansk ingeniør har skapt en robot med et menneskelignende hode som er i stand til å uttrykke følelser gjennom bevegelsene i øynene, øyelokkene og øyenbrynene. I tillegg vet han hvordan han skal følge ansiktsuttrykkene til en person og gjenta det på ansiktet hans, samt rette blikket mot en person

Forskere Har Trent Et Nevralt Nettverk For å Lage En Serie Av Tegneserien &Quot; The Flintstones &Rdquo; Etter Tekstbeskrivelse - Alternativt Syn

Algoritmen var lastet med 25 tusen tre-sekunders scener fra serien, som hver besto av 75 bilder

Russiske Forskere Har Opprettet Et Nevralt Nettverk Med "menneskelige" øyne - Alternativt Syn

Forskere fra Institute of Mathematical Problems of Biology of the Russian Academy of Sciences har opprettet et nevrale nettverk som styrer "blikket" og søker etter objekter i det oppfattede bildet på nesten samme måte som synsorganene og den menneskelige hjerne gjør, ifølge en artikkel publisert i

Forskere Har Skapt Et Nevralt Nettverk Med Evnene Til En Psykisk - Alternativt Syn

En av Clarks lover sier: Enhver tilstrekkelig avansert teknologi kan ikke skilles fra magi

Nevralt Nettverk Ble Lært å Kopiere Den Menneskelige Stemmen Nesten Perfekt - Alternativ Visning

Innholdsfortegnelse:

Video: Nevralt Nettverk Ble Lært å Kopiere Den Menneskelige Stemmen Nesten Perfekt - Alternativ Visning

Skarp på tungen

Anbefalt:

I USA Ble Det For Første Gang Dyrket En Nesten Fullstendig Kopi Av Den Menneskelige Hjerne Fra Celler - Alternativt Syn

Roboten Ble Lært å Kopiere Ansiktsuttrykk Til En Person - Alternativt Syn

Forskere Har Trent Et Nevralt Nettverk For å Lage En Serie Av Tegneserien &Quot; The Flintstones &Rdquo; Etter Tekstbeskrivelse - Alternativt Syn

Russiske Forskere Har Opprettet Et Nevralt Nettverk Med "menneskelige" øyne - Alternativt Syn

Forskere Har Skapt Et Nevralt Nettverk Med Evnene Til En Psykisk - Alternativt Syn

Fra Hukommelsesnedsettelse Til Hallusinasjoner: Tegn På Schizofreni Som Er Verdt å Kjenne - Alternativ Visning

Forskere Har Laget Kart Over Emosjonelle Sensasjoner Hos Schizofreni - Alternativ Visning

Forskere Har Kommet Til Konklusjonen: Mennesket Er En Naturfeil - Alternativ Visning

Hvordan "slette" Schizofreni? - Alternativ Visning

Barndoms Schizofreni Eller Noe Annet? Det Uvanlige Tilfellet Av Januari Schofield - Alternativ Visning

Burning Australia, Endrer Noen Jordens Klima - Alternativ Visning

Mystiske Sibirske Kigilyakhs - Gjenstander Av Den Arktiske Sivilisasjonen? - Alternativ Visning

Ingen I Verden Tror Australia Er I Brann Av Seg Selv. Hvor Det Fører? - Alternativ Visning

Battle For The Weather: Fires In Siberia - USAs Håndverk? - Alternativ Visning

Jente Fra Sibir Spådde Hennes Død I En Brann? - Alternativ Visning

En Hotline Har Dukket Opp I Storbritannia For UFO-vitner - Alternativ Visning

Fra Rasputin Til Putin: Den Eldste Kvinnen På Planeten Bor I Nærheten Av Astrakhan - Alternativ Visning

En Kvinnemagnet Bor I Chelyabinsk - Alternativ Visning

Mystery Of Burnt Bor - Alternativ Visning

Mount Vottovaara - Alternativ Visning