„Mörg kvöldin sat ég sveittur yfir þessu“

Sveinbjörn Þórðarson hugbúnaðarsérfræðingur.
Sveinbjörn Þórðarson hugbúnaðarsérfræðingur. mbl.is/Eggert Jóhannesson

Ensk-íslensk orðabók er nú aðgengileg á netinu á slóðinni ensk.is. Ekki er heil stofnun á bak við framtakið heldur er um einstaklingsframtak að ræða. 

Sveinbjörn Þórðarson hugbúnaðarsérfræðingur hafði furðað sig á því býsna lengi að ensk-íslensk orðabók sé ekki aðgengileg á netinu nema greitt sé fyrir. Sveinbjörn tók sig  einfaldlega til og bætti úr því. Eins og menn gera. 

Lénið ensk.is opnaði um helgina en grunnurinn að orðabókinni sem þar er að finna er ensk-íslensk orðabók sem Geir T. Zoega tók saman á millistríðsárunum. Mbl.is ræddi við Sveinbjörn í dag og spurði hvort hann hafi ekki eytt miklu af sínum frítíma í verkið? 

„Já undanfarið ár eða svo myndi ég segja. Jú þau voru mörg kvöldin sem ég sat sveittur yfir þessu. Ég hef nú ekki tölu á því hversu langan tíma þetta tók nákvæmlega en það fóru hundruð klukkustunda í þetta. Ég gerði þetta í frítíma mínum á kvöldin því ég er annars í fullu starfi við önnur verkefni. Það er gaman að sjá þessi gögn komast loksins til fólks. Ég hefði getað beðið lengur með að gefa hana út, á meðan ég var að bæta orðaforðann, en ákvað að ríða á vaðið um helgina,“ sagði Sveinbjörn þegar mbl.is hafði samband við hann. 

Sveinbjörn starfar sem hugbúnaðarsérfræðingur hjá Miðeind og hefur til að mynda hannað appið Emblu sem vakið hefur nokkra athygli. Sveinbjörn bjó í nokkur ár í Englandi á uppvaxtarárunum og fór síðar í framhaldsnám til London og Edinborgar í Skotlandi. Enskukunnáttan var því til staðar. 

„Þegar ég skoðaði gamlar greinar á blogginu mínu þá sá ég að ég hafði fyrst skrifað árið 2007 að til háborinnar skammar væri að ekki væri til ensk-íslensk orðabók á netinu. Ég hef starfað sem þýðandi, en einnig sem fréttamaður um tíma, og hef fundið fyrir sárri þörf að hafa aðgang að enskri-íslenskri orðabók. Ég bjóst við því að stjórnvöld myndu laga þetta á einhverjum tímapunkti en það hefur ekki gerst. Bestu ensk-íslensku orðabækurnar eru á bak við greiðslugátt hjá Snöru og fyrir ári síðan fékk ég nóg. Ég ákvað bara að gera eitthvað í þessu sjálfur. Ég er sjóaður enskumaður eftir að hafa alist að hluta til upp í Englandi og var þar einnig í framhaldsnámi. Ég treysti mér þar af leiðandi í verkið.“

Orðabók ömmu fær nýjan vettvang

Sveinbjörn stígur á ekki á tær varðandi höfundarétt í þessari útgáfu. Hann notaðist við orðabók sem var í eigu ömmu hans og kom út árið 1932. Höfundaréttur á ekki við lengur en auk þess afsalar hann sér sjálfur höfundarétti af þeirri uppfærðu útgáfu sem hann hefur sett saman. 

„Ég átti orðabók Geirs T. Zoega frá árinu 1932 en hana erfði ég eftir ömmu mína. Ég hugsaði með mér að ég gæti komið henni á stafrænt snið þar sem höfundaréttur væri runninn út. Ég myndi því geta sett hana á netið án þess að brjóta á höfundarétti eins eða neins. Ég sannfærði Landsbókasafnið um að skanna allar 707 blaðsíðurnar úr bókinni fyrir mig. Þegar ég var kominn með þessar ljóslesnu blaðsíður þá setti ég þær inn í hugbúnað sem getur breytt myndum af texta yfir í hráan texta,“ útskýrði Sveinbjörn og þetta hljómar því bara nokkuð einfalt. En kálið er ekki sopið þótt í ausuna sé komið og framundan var mikil handavinna. 

Sveinbjörn Þórðarson á vinnustað sínum á Grandanum.
Sveinbjörn Þórðarson á vinnustað sínum á Grandanum. mbl.is/Eggert Jóhannesson

„Þessu fylgdi langt ferli vegna þess að niðurstöðurnar sem koma út úr svona hugbúnaði geta verið mjög gallaðar. Ég fór því handvirkt yfir allar 30 þúsund skilgreiningarnar og lagaði. Ég keyrði einnig skilgreiningarnar saman við ensk orðasöfn og notaði ýmsar máltækniaðferðir til að hreinsa og bæta skilgreiningarnar. Ég starfa hjá Miðeind, sem er máltæknifyrirtæki, og hef því vanist svona löguðu.

Um daginn náði ég að fara yfir síðustu skilgreiningarnar og lauk við Z. Ég smíðaði léttan vef í kringum þessi gögn og setti á lénið ensk.is. Orðabókin er gefin út í almannaeign og henni fylgir enginn höfundaréttur. Að því leyti sem ég á einhvern höfundarétt á viðbótum mínum við orðabókina þá hef ég afsalað mér honum. Þetta eru opin gögn sem hver sem er má afrita, nota og endurbirta eftir eigin hentisemi. Ég vonast til þess að þetta gagnist sem flestum.“

„Er alla vega byrjun“

Sveinbjörn tekur fram að orðabókin sé ekki sú besta sem völ er á en sér fyrir sér að hún geti orðið betri með tímanum. Aðalatriðið sé að hún geti nýst mörgum.  

„Þetta er ekki besta ensk-íslenska orðabókin. Þetta er gömul orðabók en hefur þann kost að vera opin og aðgengileg öllum. Með tíð og tíma vonast ég til að geta bætt hana og virkja fleira fólk til að hjálpa mér við það. Þar sem bókin er frá 1932 þá vantaði auðvitað skilgreiningar á alls konar fyrirbærum sem urðu til eftir það eins og helicopter [þyrla]. 

Þetta er alla vega byrjun á einhverju. Ég er enginn sérfræðingur í orðabókum sem slíkum en mér þætti eðlilegast að Árnastofnun haldi úti ensk-íslenskri og íslensk-enskri orðabók. En mér skilst að þeir sem eiga höfundaréttinn að núverandi ensk-íslensku orðabókum hafi beitt sér gegn því vegna þess að það myndi grafa undan viðskiptamódelinu. Vonandi er þetta framtak einhvers konar innlegg inn í umræðu um grunntungumálainnviði eins og orðabækur og hvort þær eigi að vera aðgengilegar öllum. Það þurfa hreinlega allir á ensk-íslenskri orðabók að halda á einhverju stigi.  Ég þori að fullyrða það því enska er það áberandi í málumhverfi okkar.“

Ritháttur hefur tekið breytingum

Tungumálið hefur tekið miklum breytingum á nítíu árum og íslensk stafsetning hefur breyst töluvert. 

„Eitt af því sem var meiri háttar vesen var að snúa forneskjulegri íslenskri stafsetningu yfir á nútíma íslensku. Ég notaði að einhverju leyti sjálfvirkar aðgerðir til þess. Skipting er skrifuð með f í bókinni og menntun með einu n.

Ritreglurnar fyrir íslensku hafa breyst og hafa breyst mun meira en í ensku,“ sagði Sveinbjörn Þórðarson sem er fjölhæfur maður en hann er mastersgráðu í bæði heimspeki og sagnfræði. 

mbl.is
Fleira áhugavert
Fleira áhugavert