vrijdag 11 mei 2012

Spraakherkenning & Vertalers

Spraakherkenning & Vertalers
Door Cas Jamin

Vertalingen, e-mails, brieven, blogposts en de administratie, allemaal typewerk. Dat is soms best afzien voor handen en polsen. Met spraakherkenning kun je de last verlichten en ook wat tijd winnen.

Kwaliteit van spraakherkenning
Dicteren met spraakherkenning is een serieuze optie geworden. Als je een goede, correct afgestelde microfoon gebruikt en vanaf het begin alle fouten van het programma corrigeert, kun je al vrij snel dicteren met relatief weinig fouten (tussen de 90%–98% correct) 1 2 . Dan kun je er daadwerkelijk tijd mee winnen en RSI voorkomen.

Hoe werkt spraakherkenningssoftware?
Spraakherkenningssoftware herkent de losse klankeenheden (fonemen) waarmee wij woorden vormen. Aan de hand van statistische modellen en kansberekeningen raadt het programma welke reeks fonemen je uitspreekt en welke woorden uit het lexicon je daaruit waarschijnlijk wilt vormen. Hierbij is de context van meerdere fonemen en woorden samen in een bepaalde volgorde heel belangrijke informatie om de kansberekeningen te laten slagen. Volledige zinnen worden daarom ook het beste herkend.

Spraakprofiel
Een programma voor spraakherkenning leert je stem, uitspraak en woordkeuze steeds beter kennen. Dit gebeurt naarmate je de software langer gebruikt, herkenningsfouten corrigeert en voor het programma onbekende woorden toevoegt. Hierbij worden in feite het akoestische spraakmodel, het lexicon en de daarmee verweven statistische modellen verfijnd voor jouw manier van dicteren. Voor elke combinatie van gebruiker, microfoon en dicteertaal is dus een ander spraakprofiel nodig.

Dragon NaturallySpeaking (Windows) kan je documenten ook analyseren op schrijfstijl en voor het programma nog onbekende (vak)termen. Dit kan veel herkenningsfouten schelen.

Een goede microfoon
Een goede, ruisonderdrukkende (noise-cancelling) microfoon is een vereiste om productief met spraakherkenning te kunnen werken 2. Een headset is waarschijnlijk de beste keuze, aangezien de microfoon liefst altijd in dezelfde positie moet staan, met dezelfde afstand tot de mond. Een model met een lange, ruim verstelbare microfoonsteel heeft de voorkeur. Dit geeft de beste mogelijkheden om de microfoon goed voor de mond te plaatsen.

Bij een pakket voor spraakherkenning wordt soms een headset meegeleverd. Verwacht er geen wonderen van, maar over het algemeen werken ze prima in een stil kantoor. Bij twijfel kun je de ervaringen van anderen nalezen op het internet.

Alleen al voor het draagcomfort loont het om zelf op zoek te gaan naar een goede headset, want niets is zo frustrerend als een headset die klemt of steeds afglijdt.

Een headset heeft altijd de voorkeur, maar een goede tafelmicrofoon kan ook werken. Het is dan belangrijk om altijd dezelfde afstand en hoek tussen mond en microfoon aan te nemen. Kies voor een ruisonderdrukkend model, dat alleen geluid oppikt van recht voor de microfoon.

In de vertaalpraktijk
Afhankelijk van hoe je spraakherkenning gebruikt en wat je typesnelheid is, kan spraakherkenning je zeker tijd opleveren. Een ruwe eerste vertaling staat sneller op het scherm, een brondocument is zo overgenomen voor efficiënt vertalen in een CAT-tool en die tien niet al te formele e-mails zijn ook zo geschreven. Handig is ook dat lange woorden met een onmogelijke spelling meteen correct worden overgenomen.

Hoewel je de computer ook grotendeels met de stem kunt aansturen, is dit niet bijzonder handig. Als je (tijdelijk) niet goed met toetsenbord en muis kunt werken is het zeker een uitkomst, maar efficiënter is een combinatie van dicteren, toetscombinaties gebruiken, muizen en kleine aanpassingen gewoon typen.

Even wennen
Werken met spraakherkenning is ook wennen. Omdat de herkenning het beste is bij volledige zinnen, zul je waarschijnlijk wat langer nadenken voordat je wat opschrijft. Dat is wat minder spontaan, maar het kan je ook dwingen om beter na te denken. Het ligt aan je manier van werken of je dit als storend ervaart. In het begin is het misschien ook vreemd om alle leestekens te dicteren, maar dat went snel.

Onhandig bij meerdere talen in één document
Voor elke taal waarin je wilt dicteren is een apart gebruikersprofiel nodig, met een eigen lexicon en akoestisch model voor die taal. Je kunt in twee talen dicteren in hetzelfde document, maar dan moet je steeds wisselen van profiel. Even een anderstalige term of uitdrukking dicteren is dus niet zo gemakkelijk.

Brondocumenten overnemen
Als je een brondocument aangeleverd krijgt in een (obscuur) alleen-lezen bestandsformaat, kost het veel tijd om het over te typen voor gebruik in een vertaaltool. Door het brondocument redelijk monotoon en met duidelijke articulatie voor te lezen aan de spraakherkenningssoftware, heb je de tekst, afgezien van opmaak, toch in een mum van tijd in een bewerkbare vorm.

Ook voor het overnemen van brondocumenten op papier kan spraakherkenning handig zijn, maar bij een gedrukte tekst is OCR (optical character recognition) meestal sneller. Een OCR-programma zet de drukletters die aanwezig zijn in een gescand document om in bewerkbare tekst. Handgeschreven tekst of een onduidelijke afdruk kan een OCR-programma echter niet lezen, en dan is spraakherkenning de snelste manier om een brondocument van papier over te nemen.

Back-up
Het is erg verstandig om regelmatig je gebruikersprofielen te exporteren, om ze te bewaren op een back-up-schijf. Het zijn grote bestanden, maar als je jarenlang geïnvesteerd hebt in het trainen van het programma en het bijwerken van het lexicon, is het niet prettig als je na een computercrash of verandering van computer opnieuw mag beginnen.

Geschikt voor mijn besturingssysteem?
 
Windows
De versies ‘Premium’ en ‘Professional’ van de Nederlandse Dragon NaturallySpeaking ondersteunen Nederlands, Engels, Frans en Duits. De ‘Home’- en ‘Basics’- versies ondersteunen alleen Nederlands. Voor andere talen, zoals Spaans of Italiaans, ben je aangewezen op versies van het programma zonder ondersteuning van de Nederlandse taal. In sommige gevallen is het echter mogelijk om losse versies in verschillende talen te combineren. Zie hiervoor deze hulppagina op de Nuance-website.

Voor de talen Engels, Frans, Spaans, Duits, Japans, vereenvoudigd Chinees en traditioneel Chinees heeft Windows 7 ingebouwde spraakherkenning. Deze is heel redelijk, maar eigenlijk niet goed genoeg als taal je vak is 4.

Mac OS X
Voor de Mac is er op dit moment in de meeste talen geen programma voor spraakherkenning. Vooralsnog zijn er alleen een Engelse en een Franse Dragon Dictate. Dit is een afgeslankte Mac-versie van ‘Dragon NaturallySpeaking’.

Als alternatief kun je Windows op je Mac installeren als virtueel besturingssysteem dat je tegelijk met OS X kunt draaien. Hierin kun je vervolgens Dragon NaturallySpeaking en elk ander Windows-programma gebruiken. Een virtuele Windows-installatie werkt precies hetzelfde als een normale installatie, alleen is Windows nu in zijn geheel zichtbaar als een apart programmavenster op je Mac. De virtualisatiesoftware maakt een vloeiende uitwisseling van randapparatuur, klembord (geheugen van wat je knipt en plakt) en bestanden tussen beide besturingssystemen mogelijk.

Je kunt kiezen uit drie virtualisatieprogramma’s om Windows virtueel te installeren op een Mac: Parallels, VMware en het gratis programma Virtual Box. Met name de eerste twee maken het erg gemakkelijk om Windows te installeren op je Mac.

Linux
Voor Linux geldt ook dat je Dragon NaturallySpeaking voor Windows kunt draaien binnen een virtuele Windows-installatie. Het gratis virtualisatiepakket Virtual Box is hiervoor een goede keuze.

Systeemeisen
Spraakherkenningssoftware, zeker in combinatie met openstaande CAT-tools en andere software, vraagt aardig wat van de computer. Kijk voor aanschaf of je computer met enige marge voldoet aan de aanbevolen systeemeisen.

Noten
1. Diskidee test van Dragon NaturallySpeaking 11
2. TopTenREVIEWS Dragon NaturallySpeaking 11 review
3. Macworld buying guide: Microphones for speech recognition
4. ars technica - Win 7’s built-in speech recognition: a review

Bronnen
http://www.howstuffworks.com/gadgets/high-tech-gadgets/speech-recognition.htm
http://www.codeguru.com/cpp/g-m/multimedia/audio/article.php/c12363/How-Speech-Recognition-Works.htm
http://www.pcworld.com/article/16276/how_it_works_speech_recognition.html
http://www.explainthatstuff.com/voicerecognition.html
http://www.diskidee.be/2011/02/08/een-praatje-met-een-draak/18618/
http://www.proz.com/translation-articles/articles/1178/1/Using-Dragon-Naturally-Speaking-in-translations
http://www.catherinetranslates.com/talk-dont-type-translating-via-dragon-dictate-and-dragon-naturally-speaking/
http://arstechnica.com/microsoft/reviews/2010/05/win–7s-built-in-speech-recognition-a-review.ars/

Geen opmerkingen: