La 20 de ani dupa ce primul computer a recunoscut sunetul vocii umane, comenzile vocale vor fi folosite la scara industriala. Microsoft Corporation a anuntat ca, la inceputul anului viitor, va lansa un program pentru servere (Speech Server) care va permite computerelor sa stea de vorba cu oamenii. Deocamdata, cei de la Microsoft au pus pe piata o versiune beta, preliminara a Speech Server. Aceasta permite companiilor sa-si infiinteze servicii similare sistemelor actuale de telefonie automata. Utilizatorii acestui sistem pot sta de vorba cu un computer pentru a face rezervari la companiile aeriene, feroviare, agentiile de turism s.a. In plus, cei care vor apela un numar la informatii, vor avea posibilitatea sa navigheze prin optiuni cu ajutorul comenzilor vocale, fara sa mai auda clasicul -Pentru limba romana, apasati tasta 1-. In loc de aceasta, automatul telefonic de la celalalt capat al firului li se va adresa cu: -Buna ziua! Sunt computerul de serviciu, cu ce va pot ajuta?-
Informatii pentru clienti
Lansarea Speech Server va reprezenta un pas inainte foarte important pentru companiile care sunt nevoite sa intre in contact direct cu sute de mii sau milioane de clienti. In cazul agentiilor de turism, de exemplu, pana acum era imposibil ca rezervarile sa fie facute de un automat telefonic. Chiar daca exista posibilitatea de navigare automata prin meniu, pana la urma, apelul clientului trebuia sa fie preluat de un operator, din cauza variabilelor foarte numeroase: ora, tara de destinatie, aeroportul, clasa, locurile disponibile s.a.m.d. Atunci cand un server conectat la o centrala telefonica poate sa recunoasca vocea, el poate sa ia foarte usor locul unui dispecer uman. Acelasi lucru este valabil si in cazul cotatiilor la bursa, care variaza permanent. Din aceasta cauza, este imposibil ca un robot telefonic sa dea aceste informatii unui client, asa ca este nevoie de personal specializat, care sa le citeasca de pe display.
-La ora actuala, pe piata tehnologiei vorbirii exista solutii de tipul cutiilor negre, care sunt foarte scumpe-, a declarat James Mastan, director de marketing la grupul Microsoft Speech Technologies, cu ocazia lansarii versiunii beta a lui Speech Server. El a adaugat ca acest Speech Server va sprijini foarte mult companiile aeriene, de sanatate, financiare si alte companii de servicii, oferindu-i posibilitatea sa dezvolte modalitati mai ieftine de interactiune cu clientii. Nu numai utilizatorii vor putea sa beneficieze de serviciile vocale automate prin telefon, ci si informatia va putea fi comutata intre audio si text, in functie de context, a mai spus Mastan.
Produse de referinta
Tehnologia de recunoastere a vorbirii este integrata deja in unele produse de referinta ale Microsoft, care a demarat cercetarile in acest domeniu inca de acum un deceniu. Recunoasterea vocala este inclusa in unele aplicatii Office, precum si in cea mai recenta versiune a Windows XP.
La ora actuala, programele folosite pentru recunoasterea vocii au o acuratete care oscileaza intre 95% si 99%, cu mult mai mult decat pot dactilografia majoritatea oamenilor, iar computerele au devenit destul de puternice pentru a putea rula aceste programe fara prea mari probleme. Cu cativa ani in urma, produsele pentru recunoasterea vorbirii erau scumpe, prezentau o acuratete scazuta si erau dificil de utilizat. Expertii de la Microsoft sustin ca tehnologia vorbirii s-a maturizat pana la punctul in care interfata vocala va fi parte integranta a urmatoarei generatii de servere, PC-uri de birou sau dispozitive mobile.
Evolutie
In ultimii cinci ani, calitatea sistemelor bazate pe recunoasterea vocii a crescut spectaculos. Modul de dictare permite introducerea rapoartelor, referatelor si mesajelor e-mail. Posibilitatea de a recunoaste un anumit cuvant este limitata de dimensiunea dictionarului fonetic inclus in program. Majoritatea programelor care suporta dictarea sunt dependente de vorbitor, deoarece acuratetea variaza in functie de caracteristicile vocii fiecarui utilizator, cum ar fi timbrul si accentul. Pentru a mari acuratetea, computerele pot crea baze de date, numite profiluri de vorbitor, care stocheaza modelul de vorbire al fiecarui utilizator. De la o rata medie de recunoastere de 85% (15 cuvinte incorecte din 100) s-a ajuns la 95%-97%, iar in prezent are loc o competitie acerba pentru ultimele procente. In 1997, sistemul avea nevoie de cateva ore pentru a se acomoda cu particularitatile vocii fiecarei persoane, in prezent este nevoie de doar cateva secunde pentru a recunoaste persoana care vorbeste.
Primul pas in acest domeniu a fost facut in anul 1984, cand a devenit functional primul sistem de recunoastere a vocii umane. Pentru acea vreme, masinaria respectiva era un supercomputer. Din 1997, primele produse de recunoastere vocala au fost disponibile pe piata.
Informațiile transmise pe www.curentul.info sunt protejate de dispozițiile legale incidente și pot fi preluate doar în limita a 500 de caractere, urmate de link activ la articol.
Sunt interzise copierea, reproducerea, recompilarea, modificarea precum și orice modalitate de exploatare a conținutului publicat pe www.curentul.info












