VORBEȘTE ROMÂNEȘTE. Povestea informaticianului român, fost angajat al Google, care a făcut DEXONLINE

Publicat: 27 11. 2013, 17:30
Actualizat: 03 04. 2015, 10:52

Gândul vă prezintă o serie impresionantă de povești ale unor adevărați misionari ai limbii române, oameni care reușesc prin harul, talentul și priceperea lor să îi facă și pe alții să înțeleagă frumusețea acestei limbi. Precum Monseniorul Anton Lucaci, omul care l-a învățat pe Papa Ioan Paul al II-lea limba română sau Badea Cârțan, varianta din 2013. Românul care merge în opinci până la Roma ca să ofere cărți de acasă românilor din străinătate. Ori precum MIhnea, copilul pentru care faptul că poate să scrie „La mulți ani, România!” este o minune. Sau ca Mirela Miron, profesoara care a renunțat la un trai călduț într-o corporație pentru a le preda româna copiilor dintr-un sat de munte din Apuseni, ori ca medicii străini veniți în România care nu au învățat un singur cuvânt: șpagă. Veți face cunoștință cu toți, în cadrul campaniei VORBEȘTE ROMÂNEȘTE, care vă invită să ne gândim într-un fel nou la cuvintele pe care le folosim zi de zi, fără se le dăm prea mare importanță. De ce am lansat această provocare puteți citi AICI.


Îl găsim pe Cătălin Frâncu, informaticianul român care a odinioară fost printre primii 500 de angajați ai Google, în casa lui din sectorul 2 al Capitalei, în fața calculatorului. Este o imagine care nu-ți trezește nici cea mai mică urmă de surpriză, însă, dacă te apropii, vezi că pe monitor nu se află un nou limbaj de programare. Ci chiar limbajul, cuvintele limbii române pe care le folosim cu lejeritate zi de zi sau cărora nu le cunoaștem înțelesul. Sunt adunate toate pe platforma dexonline.ro, pe care Frâncu a creat-o în anul 2001. Dacă în sufragerie se află computerul de pe care informaticianul încarcă cele mai noi definiții ale cuvintelor, la demisol sunt adunate dicționarele care stau la baza celor 570.000 de definiții accesate zilnic de sute de mii de români. Serverele pe care se află întreg vocabularul limbii române sunt situate ceva mai departe, la Cluj. Astăzi opt voluntari lucrează la proiectul care a adus marile dicționare ale limbii române pe telefonul mobil sau pe calculatorul oricărui român care beneficiază de conexiune la internet. Printre ei se află și un membru al MENSA, asociația celor mai inteligenți oameni din lume. Însă totul a început de la un singur om, un IT-ist pasionat de limba și literatura română, și s-a dezvoltat în urma unei întâlniri norocoase.

Dispute lingvistice între românii din Sillicon Valley

Din casa sa din București, Cătălin Frâncu își aduce aminte de locul în care se afla în urmă cu 12 ani. Era în SUA, unde venise în ultimul an de facultate pentru a studia informatica la  prestigiosul Massachusetts Intitute of Technology (MIT) și ajunsese în timpul studiilor să lucreze la Google. A fost chiar între primii 500 de angajați ai gigantului IT.  Pe când stătea de vorbă cu românii din Sillicon Valley, și-a dat seama de un lucru: dacă americanii aveau nenumărate dicționare online, noi românii nu aveam niciunul. Iar această lipsă era cu atât mai frustrantă pentru românii aflați departe de casă, care nu puteau intra tam-nesam într-o librăriei sau bibliotecă să-și ia un dicționar și să se lămurească asupra sensului unui cuvânt românesc.

„În Silicon Valley erau mulți români și uneori mai aveam dispute despre sensul cuvintelor: cum se zice la asta? Ce înseamnă cuvântul asta? Atunci am adus cu mine DEX-ul ediția 1998, să-l confruntăm când era nevoie. Apoi am zis de ce n-am avea și noi un dicționar online, accesibil de oriunde?”, își amintește Cătălin de începuturile proiectului său.

Arahnidă și arahnoidă, primele cuvinte explicate pe dexonline

S-a decis să creeze el un dicționar online, la care în primele luni a lucrat singur. După orele petrecute la Google, Cătălin stătea să introducă, într-o variantă primitivă a Dexonline, cuvinte din dicționarul tipărit. Primele  introduse au fost arahnidă și arahnoidă. „Am început cu paronimele. Am pus arahnidă și arahnoidă după o discuție cu alți români despre păienjeni. În primele luni, Dexonline s-a dezvoltat lent și haotic, aveam cam 40 de cuvinte.  Din această cauză, multă lume îmi zicea că această idee n-o să prindă niciodată”, spune Cătălin.

Însă, el își dorea să dezvolte proiectul și a căutat voluntari care să-l ajute să introducă definițiile. „Eu voiam să dezvolt site-uri web. Știam informatică deja foarte bine, dar nu  practicasem prea mult partea de dezvoltare web. În același timp, voiam un proiect care să rămână,  nu numai un proiect didactic la care să nu se mai uite nimeni”, arată Cătălin Frâncu. Recunoaște însă că, la început, site-ul arăta „groaznic”.

Printre voluntari, doi pasionați de Scrabble și un membru MENSA

După șase luni a avut o întânire norocoasă. A fost contactat de cei de la Federația Română de Scrabble, care aveau nevoie de un dicționar care să fie accesat de oriunde, indiferent de locul unde se desfășoară competițiile lor. „Din acel moment am început să lucrez sistematic pentru acest proiect”, spune inginerul. Și astăzi îi are alături pe Matei Gall și Tavi Mocanu, moderatori și membri ai Federației Române de Scrabble. Matei are 60 de ani și trăiește la Brașov, Tavi este cercetător la Universitatea Autonomă din Barcelona. Lângă ei au venit și alții. „Laurențiu Bașchir și Laura Gellner sunt cei mai activi voluntari ai Dexonline. Oamenii ăștia au tastat 23 de milioane, respectiv 17 milioane de simboluri pe Dexonline. Laura trăiește în Germania și este bibliotecară, Laurențiu e voluntar de patru ani și până acum e primul în topul voluntarilor, iar de vreo 4 ani nu îl întrece nimeni”. Opt sunt cei care în afară de Frâncu lucrează constant la adăugarea de noi și noi definiții pe Dexonline. Cel mai des acesta se întâlnește cu Radu Borza, și el programator, și membru al MENSA. Este singurul care locuiește la București. „E la Dexonline din 2003. A dezvoltat componente mari din proiect: toată partea de declinări / conjugări, cuvântul zilei, cuvântul lunii. Este interesat de evoluția limbii și conduce proiecte de digitizare a unor dicționare vechi”, povestește Cătălin Frâncu.

În 2004, tot DEX-ul era online

Cu ajutorul primit a reușit, în 2004, să pună pe net toată ediția din 1998 a Dicționarului Explicativ al Limbii Române. „Dar ne-am dat seama că de abia de acolo a început greul. În aceeași vară din 2004 am pus încă vreo patru dicționare, de sinomine, antonime, ortografic și Nodex-ul basarabean. Astfel, de la 65.000 de definiții în 2004,  am ajuns la 570.000 peste încă 9 ani. Am introdus și dicționare de nișă. Am avut câteva dicționare foarte vechi, de exemplu două dicționare foarte vechi ale lui Șeineanu și Scriban, ieșite din uz”, spune Cătălin.

Dicționarul online, actualizat cu voluntari

Pasionat de limba română române, Frâncu a decis să introducă pe Dexonline și dicționarele vechi . „Cred că evoluția limbii este foarte interesantă, mai interesantă decât forma ei de azi. De asta am și introdus dicționarele vechi. Ele îți arată ce sensuri aveau cuvintele acum 80 de ani. Anumite  cuvinte care astăzi sunt peiorative, pe vremea aia erau absolut normale”, spune Cătălin.

Dexonline a fost îmbunătățit de la an la an. În 2006, a fost lansat subproiectul Dex Flex, prin care Frîncu și echipa lui urmăreau generarea unei liste complete a cuvintelor limbii române împreună cu toate formele lor flexionare, precum declinările și conjugările. Tot atunci, serverul principal al dexonline a fost mutat în România, deoarece cei mai mulți dintre utilizatorii proiectului erau, cum este firesc, de aici.

La trei ani după mutarea serverului în România, Cătălin Frâncu s-a decis să părăsească SUA și să se întoarcă și el definitiv acasă.

Două milioane de vizitatori unici pe lună

De multe ori proiectul Dexonline s-a lovit de opoziția lingviștilor. „Noi nu ne atribuim rolul lingvisților, tot ceea ce facem este să respectăm ad literam dicționarele pe care le introducem. Mergem pe ideea că DEX-ul este un bun făcut din bani publici, e un bun valoros și le-am spus asta și celor de la Institutul Iorgu Iordan care fac dicționarele. Site-ul nostru are o licență permisivă, oricine își poate copia local definițiile”, spune Frâncu.

Pentru DEX Frâncu spune că a încercat să obțină acordul editurii Univers Enciclopedic care îl tipărește. „Am căutat editura din 2001 până în 2004, când încă eram în SUA, dar nu mi-au răspuns nici la email și în niciun fel. Într-un final, după ce proiectul a câștigat popularitate m-au căutat ei printr-un avocat să ne spună să închidem. Le-am explicat că nu facem decât să punem cuvintele online și că nu furăm nimic”, spune Cătălin.

În prezent, site-ul are lunar două milioane de utilizatori unici și 13 milioane de pagini afișate, iar Frâncu susține că printre utilizatori se află inclusiv lingviști. „În 2010, la o conferință despre cum putem folosi tehnologia pentru limba română, organizată de Institutul de Lingvistică Iorgu Iordan, unde mă dusesem un pic cu inima strânsă, toată lumea mi-a spus că folosește dexonline deoarece este mai rapid. Ne-am simțit apreciați”, afirmă programatorul. Spune că și academicienii folosesc Dexonline. „Dar nu au vrut să colaboreze cu noi, le-am spus de multe ori că vrem să intrăm sub oblăduirea voastră. Nu i-a interesat”, arată programatorul

Cum se corectează greșelile

Dicționarul online permite corectarea greșelilor. Dacă un cititor observă o greșeală, atunci el poate semnala acest lucru pe legătura Greșeală de tipar, unde poate descrie problema. „Însă, nu acceptăm corectarea definițiilor, le lăsăm exact așa cum apar în dicționare”, arată inginerul, care spune că nu se subsituie în niciun caz lingviștilor sau academicienilor care se ocupă de limba română. „Noi vrem să fie un dicționar mai bun și oficial dacă se poate. Acum avem în lucru un sistem care să indexeze pagini românești, adică și literatură și articole și câteva bloguri mai răsărite, și să caute cuvinte menționate frecvent  în acele pagini, dar pe care noi nu le avem. Și dacă un cuvânt apare de 50 de ori și noi nu-l avem, este un semn că ar trebui să-l pasăm unui lexicograf și să-l punem apoi în dicționar”, arată Cătălin Frâncu.

Echipa de voluntari nu colaborează însă cu un lexicograf. „În general, tocmai pentru că nu suntem lingviști și pentru că nu avem vreo autoritate în domeniu definițiilor, luăm dicționare de prestigiu, dicționare care au greutatea și recenția unui grup de lexicografi”, arată Frâncu.

Cuvântul lunii august, „torționar”, în urma dezvăluirilor din Gândul

Dicționarul are și un cuvânt al lunii, cel mai căutat de către utilizatori, care este de regulă o dezbatere a celor mai aprinse dezbateri din societate. În luna august, cel mai căutat cuvânt a fost „torționar”, ca urmare a dezvăluirilor făcute de gândul, în parteneriat cu Institutul pentru Investigarea Crimelor Comunismului  și Memoria Exilului Românesc cu privire la cazul Vișinescu și Ficior. „Acum câteva luni, cel mai căutat a fost calorifer, evident din motive care țineau de scandalul din jurul directorului ICR, Andrei Marga. De multe ori, cuvântul cel mai frecvent căutat indică faptul că ceva s-a petrecut în societate. De exemplu, când e căutat cuvântul vocație înseamnă că poate la o emisiune tv s-a vorbit de asta. Și poate s-au contrazis asupra sensului. Acum folosim integral  10 dicționare și mai avem alte 20 de dicționare din care folosim numai părți sau definiții”, mai spune Cătălin Frâncu.

În schimb, în luna septembrie, cele mai căutate sensuri au fost cel pentru eutanasiere și redevență, ca urmare a adoptării legii eutanasierii câinilor fără stăpân și a scandalului privind Roșia Montană. Oricine vrea să contribuie la dexonline cu definiții poate face acest lucru. Există o pagină de constribuții unde definiția poate fi scrisă, apoi cei de la dexonline o preiau, o corectează și apoi o activează. „Dorim ca definițiile trimise să fie cât mai conforme cu dicționarele de unde provin, de aceea acceptăm numai cuvinte din sursele noastre, adică diferitele ediții ale dicționarelor”, spune Cătălin Frâncu.

El spune că nu se substituie în niciun caz lingviștilor sau academicienilor care se ocupă de limba română. Dar consideră că limba evoluează și el nu face decât să  consemneze  toate sensurile. Frâncu susține că românii fac o greșeală atunci când evită cacofoniile. „De multe ori, construcțiile la care ajungem încercând să evităm o cacofonie zgârie urechea mai rău decât cacofonia însăși. Alte limbi nu se străduie deloc să le evite”, spune informaticianul, care arată că spaima pe care cacofoniile le provoacă vorbitorilor de limbă română se are loc din cauza  automatismelor învățate în școala primară.

Își apostrofează elevii care nu vorbesc corect românește

În afară de dexonline, Cătălin Frâncu e profesor la un cerc de informatică la Liceul Tudor Vianu din Capitală, al cărui absolvent este. „Este un cerc de algoritmi în general, dar mai vorbim și despre alte lucruri. Cursul mă solicită foarte mult, pentru că elevii sunt foarte deștepți. Uneori îmi trebuie chiar 2-3 zile să mă pregătesc. Le spun și despre dexonline, dar  elevii îl folosesc oricum pentru că au nevoie. Dar dacă îi prind că vorbesc greșit limba română le dau peste nas”, spune Cătălin Frâncu.

Proiectul de suflet: dicționarul vizual

Frâncu spune că Dexonline rămâne un proiect „de suflet” și, chiar dacă a primit  mai multe oferte de vânzare le-a refuzat pe toate.

„Vreau să dezvolt proiectul și să creăm un dicționar vizual. De exemplu, atunci când cauți un cuvânt precum piston să poți să și vizualizezi”, dezvăluie programatorul planurile lui. Își dorește ca voluntarii să devină proprii creatori de conținut. „E bine să facem ceva și  să câștigăm autoritatea că ce spunem noi aici este adevărat. Mai vrem să confruntăm toate definițiile pentru un cuvânt.  În bună măsură unele definiții sunt și redundante pentru că autoriii se inspiră și ei unii după alții. Și atunci unele definiții sunt la fel și astfel irosim timpul utilizatorilor. Am vrea să restructurăm tot ce avem într-o  singură definiție”, conchide Cătălin Frâncu.