FOR UMIDDELBAR UTGIVELSE nr. 3259

Denne teksten er en oversettelse av den offisielle engelske versjonen av pressemeldingen, og den er kun ment som et praktisk referanseverktøy. Du finner detaljene og spesifikasjonene i den originale engelske versjonen. Dersom tekstene ikke stemmer overens, er det den originale engelske versjonen som gjelder.

Mitsubishi Electric utvikler flerspråklig talegjenkjenningsteknologi som automatisk identifiserer hvilket språk som snakkes

Vil bidra til å realisere talegrensesnitt som er meget godt egnet for en lang rekke situasjoner, ved å bruke selskapets kompakte AI Maisart til å samtidig identifisere og forstå talespråk, selv når flere mennesker snakker

PDF-versjon (PDF:210.4KB)

TOKYO, 13. februar 2019Mitsubishi Electric Corporation (TOKYO: 6503) kunngjorde i dag at de har utviklet det selskapet mener er verdens første teknologi som er i stand til svært nøyaktig flerspråklig talegjenkjenning uten å bli informert om hvilket språk som snakkes. Den nye teknologien, Seamless Speech Recognition, omfatter Mitsubishi Electrics merkevarebeskyttede kompakte AI-teknologi Maisart®* og er bygget på et enkelt system som kan identifisere og forstå talespråk samtidig. I tester som hver for seg involverte 5 og 10 språk, og som alle ble gjennomført i omgivelser med lite støy, oppnådde systemet gjenkjennelse med nøyaktighet på henholdsvis over 90 % og 80 % uten å bli informert om hvilket språk som ble talt. Teknologien kan også forstå flere personer som snakker enten det samme språket eller forskjellige språk samtidig.

*Mitsubishi Electric's AI creates the State-of-the-ART in technology (Mitsubishi Electrics AI skaper det aller beste innen teknologi)

Seamless Speech Recognition-teknologi

Seamless Speech Recognition-teknologien bruker Mitsubishi Electrics merkevarebeskyttede dyplæringsmetode for enestående fleksibilitet og nøyaktighet. Teknologien, som tar i bruk et ende-til-ende-dyplæringsrammeverk hvor et dypt nettverk læres opp ved hjelp av bare inngangs- og utgangsprøver, bygger ett enkelt system som samtidig identifiserer og forstår talespråk uten å være avhengig av ekspertkunnskap som fonemsystemer og uttalelister. Simultan læring ved hjelp av flerspråklige taledata øker robustheten.

Det nye systemet bruker Mitsubishi Electrics merkevarebeskyttede Hybrid CTC/Attention Method for ende-til-ende-talegjenkjenning, som forbedrer nøyaktigheten til talegjenkjenningsprosessen betydelig. Metoden er bygd på to representative metoder for ende-til-ende-talegjenkjenning – CTC (Connectionist Temporal Classification) og oppmerksomhetsbasert dekoding – noe som kombinerer fordelene med dem samtidig som det reduserer ulempene ved dem. Hybridmetoden drar spesielt fordeler av evnen som CTC har til å spå nøyaktige justeringer mellom inngående talesignaler og genererte tegn, og oppmerksomhetsmetodens evne til å vurdere gjensidige avhengigheter over tid for akustikk- og språkegenskaper for tale.

Talegjenkjenningsnøyaktighet

  Fungerer uten at talespråket angis 5 språk 10 språk
Ny teknologi Ja > 90 % > 80 %
Konvensjonell teknologi** Nei 87 % 72 %
  • Merk: Forutsetter ideelle opptaksforhold
  • ** Kombinasjon av flere systemer som er bygd og opplært separat for hvert språk, med manuelt valg av talespråk på forhånd

Talegjenkjenningsteknologi har gjort det mulig å betjene enheter som smarttelefoner og bilnavigasjonssystemer ved hjelp av tale. Men siden konvensjonelle talegjenkjenningssystemer utvikles separat for hvert språk, må brukere velge språket de vil snakke, på forhånd. Det er mulig å bruke en språkidentifiseringsmetode før talegjenkjenningen, men dette fører til en reduksjon i brukervennligheten på grunn av forsinkelsen som er nødvendig for språkidentifisering, og en økning i gjenkjenningsfeil på grunn av språkidentifiseringsfeil og ikke-optimale talegjenkjenningssystemer som er opplært med utilstrekkelige enspråklige data. Nøyaktigheten til konvensjonelle talegjenkjenningssystemer reduseres også i stor grad når de behandler overlappende tale fra flere personer, noe som begrenser anvendbarheten.

Mitsubishi Electrics Seamless Speech Recognition-teknologi forventes å bidra til å realisere talegrensesnitt som er meget godt egnet til en lang rekke situasjoner, for eksempel en flerspråklig familie som bruker det samme husholdningsapparatet, eller utenlandske turister som stiller spørsmål til veiledningssystemet på en flyplassterminal på sitt eget språk. I tiden fremover kommer Mitsubishi Electric til å arbeide for å ytterligere forbedre nøyaktigheten til og anvendbarheten av automatisk talegjenkjenning i reelle miljøer, inkludert biler, boliger, offentlige anlegg m.m.

Merk at pressemeldingene er riktige på publiseringstidspunktet, men de kan endres uten varsel.