Home Cultură Tehnologii lingvistice – performanțe și perspective

Tehnologii lingvistice – performanțe și perspective

DISTRIBUIŢI

Convorbire cu acad. Dan Tufiș, Directorul Institutului de Cercetări pentru Inteligență Artificială „Mihai Drăgănescu“

Cu câteva zile în urmă s-a desfășurat workshop-ul exploratoriu „Tehnologii lingvistice în cercetarea românească din țară și din diaspora“, eveniment reper al vieții noastre științifice, organizat de Institutul Dvs. împreună cu Univer­sitatea „Alexandru Ioan Cuza“. Cum Institutul de Cercetări pentru Inteligență Artificială „Mihai Drăgănescu“este prea puțin cunoscut, propun să începem cu o scurtă prezentare.

Institutul a fost înființat în 1994, inițial ca un mic centru de cercetare avansată, la inițiativa acad. Mihai Drăgănescu, cu eforturile conjugate ale acad. Gh. Tecuci și ale noastre. De la început, am gândit Centrul ca o instituție cu personalitate juridică, implicând autonomia financiară și, imediat după înființare, ne-am asigurat dotarea și pot spune că am fost prima instituție din Academia Română cu acces la Internet. Apoi, am inițiat o serie de cursuri gratuite pentru toți cercetătorii din rețeaua academică.

Când vorbiți de autonomie finan­ciară, pe ce vă bazați?

Pe calitatea cercetătorilor noștri, nucleul de opt cercetători de prima mână, pe rezultatele obținute, pe recunoașterea internațională pe care o dobândisem până atunci.

?ê?£i unde ați ajuns după aproape… 20 de ani?

În prezent suntem o instituție de referință a Academiei Române, respectată și apreciată în comunitatea de profil, cu rezultate de vârf în cercetarea internațională, cu peste 35 de proiecte internaționale la activ și multe propuneri de colaborare viitoare, prea multe chiar pentru resursele actuale de personal. În anul 2002, tocmai datorită acestor rezultate, Centrul a fost transformat în Institutul de Cercetări pentru Inteligență Artificială. Anul acesta am obținut aprobarea oficială ca institutul să poarte numele acad. Mihai Drăgănescu, mentorul nostru pe care l-am pierdut în 2010,ca un gest de minimă recunoștință pentru tot ceea ce a făcut pentru știința românească și în special pentru domeniul informaticii.

Domeniul inteligenței artificiale este foarte atractiv, cu perspective aproape nelimitate. Care sunt direcțiile cerce­tărilor Dvs.?

Cercetările noastre se focalizează asupra prelucrării limbajului natural, unul dintre domeniile cele mai active din inteligența artificială, cu un puternic caracter aplicativ în societatea cunoașterii. În 2001 UNESCO a elaborat și aprobat un document privind accesul la Internet ca drept fundamental al omului.

Ați participat la elaborarea lui.

Da, și sunt mândru de acest lucru. De atunci, comunitatea științifică interna­țională a analizat și identificat problemele de rezolvat pentru împlinirea acestui deziderat întrucât nu toate limbile sunt pregătite pentru folosirea tehnologiilor lingvistice.

Adică?

Prelucrarea limbajului în mediile digitale necesită instrumente specifice limbii și fiecare program are, la rândul său, nevoie de ceea ce se numește resurse lingvistice – corpusuri și dicționare foarte mari, gramatici ș.a. Ei bine, prin prisma acestor resurse și instrumente specializate se definește un nivel tehnologic al unei limbi, al pregătirii ei spre a fi utilizată în spațiul virtual.

Când vom comunica cu tot ce ne înconjoară…

Pentru a ne apropia de lucrările workshop-ului, care e potențialul econo­mic al acestor tehnologii?

Tehnologia limbajului are un potențial economic extraordinar. Se estimează, de pildă, că în 2015, Europa piața acestor tehnologii va ajunge la peste 15 miliarde Euro cu o creștere constantă de 10%.

Unde întâlnim aceste tehnologii?

La orice pas. De la editoarele de text inteligente care fac corecții ortografice și chiar sintactice, la căutarea pe Internet, până la sistemele de traducere automată. ?ê?£i așa cum se apreciază în prognozele științifice, ne așteptăm să le folosim în comunicarea cu tot ceea ce există în jurul nostru. Se vorbește de case inteligente în care poți vorbi cu tot ce se găsește în ele. Sunt proiecte foarte ambițioase deja în curs de realizare ale așa-numitelor orașe inteligente, care au senzori capabili să furnizeze informație deținătorilor de tehnologie adecvată.

?ê?£tiu că Dvs. personal aveți niște performanțe notabile în traducerea automată, din păcate mai puțin cunoscute în țară…

Da, este domeniul meu preponderent de activitate în ultimii ani. În istoria de peste 60 de ani a traducerii automate, progresele au fost, mult timp, dezamă­gitoare, dar în ultimii zece ani am asistat la o adevărată revoluție determinată de o schimbare de paradigmă. Cercetările de traducere automată bazate pe învățare au înlocuit în mare măsură efortul specia­liștilor în limbă de a scrie gramatici, dic­ționare ș.a. Această abordare a transferat efortul uman în direcția colectării unor texte care să fie traduceri reciproce și a dezvoltării de sisteme de învățare auto­mată capabile sa-și extragă cunoștințele necesare din date. Pentru unele perechi de limbi, generic numite „limbi mari“, asemenea date există în cantități suficiente, dar pentru cele mai multe perechi de limbi, datele necesare sunt deficitare, cu directă consecință asupra calității traducerilor automate. Conclu­dente în acest sens, sunt diferențele mari de calitate a traducerilor realizate de Google, între cele mai mult de 60 de limbi.

Workshop-ul care abia s-a încheiat a fost un succes, fapt reflectat, aproape surprinzător, și de mass-media. El a fost prefațat de un comunicat de presă care atrăgea atenția că 21 de limbi europene din cele 30 analizate sunt în pericol în spațiu digital.

Da, este vorba de comunicatul dat de consorțiul european Meta-Net, rezultatul unei analize a 30 de limbi privind exploatarea la maximum a spațiului virtual în fiecare din limbile respective. Rezultatul este îngrijorător. Cu excepția a nouă limbi, celelalte sunt la un nivel alarmant de „echipare tehnologică“.

?ê?£i limba română?

Studiul Meta-Net o plasează printre cele 21 de limbi în pericol, dar opinia mea este că limba română este pregătită să iasă din această zonă de pericol. Cu condiția ca factorii politici responsabili cu problemele cercetării să înțeleagă și să se implice în sprijinirea acestei direcții de cerce­tare/dezvoltare.

Recunoaștere internațională

Care e contribuția românilor din diaspora?

Românii din diaspora, specialiști în tehnologia limbajului, au o prezență deosebit de activă și productivă, apreciată de întreaga comunitate științifică. De altfel la workshop-ul nostru, pornind de la rezultatele foarte competitive pe care le-am obținut pentru perechea de limbi română-engleză, s-au avansat propuneri concrete de realizare în colaborare de sisteme de traducere pentru limba română, franceză și germană.

Câți dintre ei vă sunt discipoli?

Mulți, foarte mulți, ai mei sau ai prof. Dan Cristea de la Iași. Mă bucur foarte mult de fiecare dată când aud de ei, când îi întâlnesc. Avem o legătură permanentă, colaborăm.

Până unde se poate merge ca perfor­manță? Mă gândesc la poezie.

Există așa-numitele sisteme mixte de traducere asistată de om. Calculatorul oferă mai multe variante și omul face opțiunea. Traducerile din literatură și poezie vor rămâne în competența oame­nilor de specialitate și/sau a sistemelor mixte. Traduceri complet automate de bună calitate se obțin în domenii tehnice, juridice și chiar jurnalism.

Omul rămâne încă de neînlocuit…

Cel puțin în faza actuală, dar în perspectiva anilor 2020 se prevede că se va ajunge, pentru anumite tipuri de texte și pentru anumite perechi de limbi, la un nivel apropiat de calitatea traducerilor specialiștilor umani.

Există programe adaptate pentru cei cu dizabilități?

Sunt preocupări foarte consistente și la workshop chiar a fost o comunicare pe această temă. Pentru cei care suferă, de pildă, de autism, sunt cercetări care ambiționează să descopere locurile de dificultate în percepția limbajului și să simplifice corespunzător textele. Pentru cei cu deficiențe de auz sunt dezvoltate sisteme de înțelegere și generare a limbajului semnelor.

Sunteți atât de dedicat domeniului și-l prezentați atât de seducător încât pare ar fi perfect. Trebuie să fie și… un călcâi al lui Ahile.

Inteligența artificială cercetează de regulă probleme foarte grele care nu pot fi întotdeauna precis formulate și trebuie să caute soluții funcționale. Tehnologiile de inteligență artificială sunt presărate de numeroase euristici, un potențial „călcâi al lui Ahile“, pentru că pot apărea situații în care acestea să nu funcționeze. Ideea este ca asemenea situații să aibă o probabilitate cât mai mică.

Spre ce năzuiți?

Mi-aș dori ca limba română să fie una dintre cele mai performante limbi în spațiul virtual și există premize în acest sens.

Elena Solunca Moise

POSTAȚI UN MESAJ

Please enter your comment!
Please enter your name here

DISCLAIMER
Atentie! Postati pe propria raspundere!
Inainte de a posta, cititi regulamentul.