„Þetta samstarf við OpenAI er til komið vegna ferðar sendinefndar forseta Íslands sem Almannarómur skipulagði,“ segir Jóhanna Vigdís Guðmundsdóttir, framkvæmdastjóri máltæknimiðstöðvarinnar Almannaróms, í samtali við mbl.is, en úr véum fyrirtækisins berast nú þau tíðindi að íslenska hafi verið valin fyrst tungumála, að ensku frátalinni, í þróunarfasa nýjustu útgáfu gervigreindar-mállíkansins GPT-4 en á því byggist samtalsgreindin ChatGPT. Og sjaldan lýgur Almannarómur sem alkunna er.
Sendiförin sem Jóhanna segir af var farin vestur um haf í fyrravor og starfsstöðvar OpenAI þá meðal annars heimsóttar. „Markmiðið var að koma íslenskum máltæknilausnum inn í tækin og tæknina sem fólk notar dags daglega,“ heldur hún áfram.
Undanfarin fjögur ár hafi 60 sérfræðingar á vegum Almannaróms unnið að því að smíða téðar máltæknilausnir eða innviði, „en það þýðir ekkert að smíða þetta ef það er ekki notað, það þarf að koma því yfir í lausnir fyrir neytendur. Út frá sjónarhóli Almannaróms hefur það verið mjög stór hluti af verkefninu að koma þessum lausnum í notkun,“ útskýrir framkvæmdastjórinn.
Hafi fjögurra ára áætlun Almannaróms, sem nú er að renna skeið sitt á enda, gert ráð fyrir að þegar máltækniafurð lægi fyrir yrði haldið til Bandaríkjanna í för sem forsetinn leiddi og kæmi fulltrúum Almannaróms í samband við það fyrirtæki sem nýttist því starfi sem unnið hefði verið á Íslandi.
„Við fórum þangað til að tala máli íslenskunnar, að hún yrði hluti af lausnum þessara fyrirtækja, og ekki síður máli annarra smærri tungumála. Við töluðum mikið fyrir því að íslenska gæti orðið sporgöngutungumál og rutt veginn fyrir önnur tungumál. Það var svona það sem við seldum, innan gæsalappa, OpenAI, að vinna með okkur að því að búa til þetta módel að því hvernig væri hægt að vinna og þau gætu þá tekið upp og unnið, út frá okkar samstarfi, með öðrum þjóðum til að vernda tungumálið,“ segir Jóhanna frá.
Hún bendir á að tungumál heimsins séu um 7.000 um þessar mundir og aðra hverja viku deyi eitt þeirra út. Ástæðan fyrir öllu þessu máltæknistússi Almannaróms væri að tryggja framtíð íslenskrar tungu.
„Það að íslenska sé eina tungumálið utan ensku sem er fínþjálfað á GPT-4-mállíkaninu er til komið vegna þessarar ferðar og fundarins sem við áttum með Sam Altman, stofnanda og framkvæmdastjóra OpenAI, og öðrum sem starfa þar. Út frá þessu sambandi okkar vex þetta samstarf,“ segir Jóhanna.
Hver skyldu þá vera næstu skref í þessu rammíslenska verkefni sem teygir anga sína alla leið til Bandaríkjanna?
„Næstu skref eru að halda þessu samstarfi áfram og það er kannski ágætt að taka það fram að þróun mállíkans er aldrei lokið, OpenAI mun gefa út fleiri og uppfærð mállíkön sem munu geta gert enn þá meira, þetta er öflugasta gervigreindarlíkan sem hefur verið gefið út og næstu skref eru að sjá til þess að íslenskan haldi í við tæknina,“ segir Jóhanna af metnaðarmálum Almannaróms.
Áfram verði hlutverk stjórnvalda að búa til og fjármagna næstu máltækniáætlun þar sem sú síðasta sé nú að endimörkum komin sem fyrr segir en verðugan lokapunkt hennar segir Jóhanna samkomulagið við OpenAI.
„Rannsóknar- og þróunarhópurinn SÍM [Samstarf um íslenska máltækni] hefur undanfarin fjögur ár þróað þá innviði máltækni sem þessi árangur byggir á. Það er ástæða til að þakka þeim sérstaklega fyrir þeirra framlag,“ leggur framkvæmdastjórinn áherslu á.
„Stjórnvöld hafa stutt mjög myndarlega og af miklum áhuga við þetta verkefni og við vonum að svo verði áfram. Við erum orðin fyrirmynd annarra og stærri tungumála og það er ákveðinn ábyrgðarhluti að tala þeirra máli,“ segir Jóhanna Vigdís Guðmundsdóttir að lokum en þess má geta að á mánudaginn kemur, 20. mars, klukkan 13 verður haldinn kynningarfundur í Grósku í Vatnsmýri undir yfirskriftinni „Framtíðin svarar á íslensku“ þar sem árangur máltækniáætlunar verður kynntur, fjallað um næstu skref stafrænnar vegagerðar með máltækni og samstarfið við OpenAI kynnt nánar en fulltrúar fyrirtækisins sækja fundinn.