Kunstig Intelligens Har Lært å Gjenkjenne Tale Riktig Blant Støy - Alternativ Visning

Kunstig Intelligens Har Lært å Gjenkjenne Tale Riktig Blant Støy - Alternativ Visning
Kunstig Intelligens Har Lært å Gjenkjenne Tale Riktig Blant Støy - Alternativ Visning

Video: Kunstig Intelligens Har Lært å Gjenkjenne Tale Riktig Blant Støy - Alternativ Visning

Video: Kunstig Intelligens Har Lært å Gjenkjenne Tale Riktig Blant Støy - Alternativ Visning
Video: Kunstig Intelligens - Behandling af sygdomme 2024, Kan
Anonim

Virtuelle assistenter og stemmegjenkjenningssystemer har lært å "gjenkjenne" hva en person sier til dem og å følge kommandoene hans. Men for riktig drift av samme Siri og Cortana, kan ekstern støy være et stort problem. Å takle denne tekniske feilen kan bli hjulpet av eksperter fra Mitsubishi Electric, som presenterte en ny teknologi for å skille en persons tale fra den generelle støyen.

Teknologien til det japanske selskapet kalles Deep Clustering, og funksjonen er bygget på prinsippene for maskinlæring. For en begynnelse lærte kunstig intelligens å uavhengig skille talen til en person fra den generelle strømmen av forskjellige lyder og lyder. Nevralt nettverk skiller innkommende lyddata i forskjellige elementer og analyserer hver for seg, hvoretter den allerede kan behandle den menneskelige stemmen. Tilsvarende arbeid blir observert når to eller flere samtalepartnere er "koblet sammen".

Under en demonstrasjon av teknologien fra et japansk selskap, klarte systemet å skille talen til to personer som snakket den samme setningen på forskjellige språk, til en mikrofon. All prosessering ble utført i sanntid, og forsinkelsen oversteg ikke tre sekunder. Anerkjennelsesnøyaktigheten var 90 prosent, og da tre personer begynte å snakke inn i mikrofonen, falt prosentandelen "treff" til 80, noe som også er et godt resultat. I følge forfatterne av prosjektet Anthony Vetro og Yohei Okato,

"I motsetning til å skille tale fra bakgrunnslyder, er det en veldig vanskelig oppgave å skille tale fra en person fra" stemmestøy "fra folk som snakker samtidig, siden lydene til forskjellige menneskers stemmer har mange særegenheter. I de fleste systemer løses problemet med stemmeseparasjon ved å installere to eller flere mikrofoner, men i tilfelle av bare å bruke en mikrofon, er det kun kunstig intelligens som kan takle oppgaven med stemmeseparasjon. Denne teknologien kan brukes der det er nødvendig med høy nøyaktighet når det gjelder anerkjennelse av talemeldinger. For eksempel i stemmestyringssystemer for biler, heiser, husholdningsapparater og andre elektroniske enheter."

VLADIMIR KUZNETSOV

Anbefalt: