Forskere Har Trent Et Nevralt Nettverk For å Bestemme Kjønn Til En Person Fra Den Skrevne Teksten - Alternativ Visning

Forskere Har Trent Et Nevralt Nettverk For å Bestemme Kjønn Til En Person Fra Den Skrevne Teksten - Alternativ Visning
Forskere Har Trent Et Nevralt Nettverk For å Bestemme Kjønn Til En Person Fra Den Skrevne Teksten - Alternativ Visning

Video: Forskere Har Trent Et Nevralt Nettverk For å Bestemme Kjønn Til En Person Fra Den Skrevne Teksten - Alternativ Visning

Video: Forskere Har Trent Et Nevralt Nettverk For å Bestemme Kjønn Til En Person Fra Den Skrevne Teksten - Alternativ Visning
Video: Exposing the Secrets of the CIA: Agents, Experiments, Service, Missions, Operations, Weapons, Army 2024, Kan
Anonim

Et team av forskere fra National Research Nuclear University "MEPhI", National Research Center "Kurchatov Institute" og Voronezh State University har utviklet en metode som lærer en datamaskin å gjenkjenne en persons kjønn fra en tekst skrevet av ham med en nøyaktighet på 80 prosent. Vitenskapelig utvikling tilhører feltet beregningsspråklighet. Forskningen ble utført med et tilskudd fra Russian Science Foundation. Resultatene er publisert i tidsskriftet Procedia Computer Science.

Tallrike vitenskapelige studier viser at en skrevet tekst uunngåelig gjenspeiler egenskapene til forfatteren - kjønn, psykologiske egenskaper, utdanningsnivå. Tale er et verdifullt psykodiagnostisk verktøy brukt av menneskelige ressursspesialister fra store selskaper, så vel som sikkerhetstjenester.

Basert på analyse av tale er det mulig å diagnostisere tilstedeværelsen av visse sykdommer hos en person (demens, depresjon) og en tendens til selvmordsatferd. Behovet for å fastslå egenskapene til forfatteren av teksten vokser også med utviklingen av Internett-kommunikasjon: det er viktig for selskaper å vite hvilke grupper mennesker som liker sine produkter og tjenester.

Forskere som jobber i denne retningen (lingvister, psykologer, spesialister innen informasjonsteknologi), bygger på de numeriske verdiene for forskjellige parametre i teksten, og bygger matematiske modeller for å diagnostisere visse personlighetsparametere.

Et team av eksperter analyserte effektiviteten til forskjellige maskinlæringsteknologier ved å bruke nevrale nettverk for tekstanalyse.

I løpet av studien sammenliknet de nøyaktigheten med å løse problemet med kjønnsidentifisering av tekster basert på to tilnærminger til databasert modellering: På den ene siden maskinlæringsalgoritmer (støttevektormaskin og gradient boosting), på den andre siden dyp læring nevrale nettverk (convolutional nevrale nettverk og tilbakevendende nevrale nettverk med langt korttidsminne).

Vi har oppnådd høye resultater når det gjelder å bestemme kjønnet til forfatteren av teksten takket være avanserte nevrale nettverksmodeller, under forhold der forfatteren ikke skjuler sitt kjønn. Den neste oppgaven er å bestemme kjønnet i forhold til det med hensikt å skjule det, sier Alexander Sboev, førsteamanuensis ved NRNU MEPhI.

Så i de følgende tekstene, som opprinnelig ble lagt ut på en datingside, finner nevrale nettverk lett en fangst i ti av ti tilfeller. Forfatteren setter dessuten bevisst navnet på det motsatte kjønn i signaturen.

Salgsfremmende video:

Teksten ble skrevet av en jente: “Jeg er en kjekk, muskuløs mann på 30 år. Jeg jobber for et stort olje- og gasselskap i en god stilling med en anstendig lønn. Jeg bor i min egen leilighet i Moskva. Eiendommen har også et lite, men pent hus i en av landsbyene i Italia. Jeg er glad i sport, spesielt fotball. Jeg elsker å dra ut til helgen, jeg hater opphold hjemme. En jente som ville passe for meg, skal ha en beskjeden disposisjon, godt utseende og en attraktiv figur etter moderne standarder. Hun skulle dele interessene mine, ikke være sjalu og ikke prøve å få meg til å bli sjalu. Jeg har ikke tenkt å forsørge jenta, fordi jeg mener at begge burde jobbe i familien. Jeg foretrekker også å holde budsjettet separat. Jeg tåler ikke forræderi."

Teksten ble skrevet av en mann: “Hallo! Jeg er ekstremt ulykkelig, ekstremt! Hvorfor oppfører du deg slik med oss ?! Vi er mennesker også, vi er alle like! Er du sexist? Jeg vil ikke ta dette lenger! Jeg vil ødelegge bilen din overalt, male den. Vent, umenneskelig. Jeg vil fullføre på denne måten."

Resultatene fra denne studien viste at en tilnærming basert på bruk av innviklede nevrale nettverk og dype læringsmetoder for å gjenkjenne kjønn til personen som skrev teksten, er den mest optimale.

Nå jobber en gruppe forskere med problemet med aldersgjenkjenning.

Anbefalt: