Portugal avaldas Amalia: avatud tehisarumudel tugevdab Euroopa digisuveräänsuse suunda
Portugal avaldas Amalia, avatud tehisarumudeli Euroopa portugali keelele. Selgitame, miks see on oluline Euroopa digisuveräänsusele.
Amalia näitab, kuidas Euroopa riigid püüavad ehitada kohaliku keele, avaliku sektori ja suveräänse taristu peale oma tehisaruvõimekust. Eesti jaoks on see praktiline näide, miks väiksema keeleruumi AI ei ole ainult mudeli võimekuse, vaid ka andmete, auditi ja avalike teenuste küsimus.

Portugal esitles 1. juulil 2026 Amaliat, riigi esimest avatud suurt keelemudelit, mis on loodud spetsiaalselt Euroopa portugali keele ja kohaliku konteksti jaoks. Mudeli ametlik täisnimi on Assistente Multimodal Automático de Linguagem com Inteligência Artificial ning see on nimetatud fado-laulja Amália Rodriguesi järgi. Portugali valitsuse teatel on tegemist esimese avatud keelemudeliga, mis on arendatud Euroopa portugali keeles.
Amalia ei ole mõeldud üksnes tavakasutajale mõeldud juturobotiks. Reutersi järgi on see alusmudel, mille peale saavad avalikud asutused, ettevõtted, ülikoolid ja teadlased ehitada oma rakendusi. Esimesed kasutusjuhud puudutavad muuseumide virtuaalgiide, Portugali mereväe otsustustuge, õpetajatele mõeldud abivahendeid ning riigiportaali gov.pt avalike teenuste assistenti.
Projekt on osa laiemast Euroopa suunast, kus riigid ja Euroopa Liit püüavad vähendada sõltuvust USA suurtest mudelipakkujatest ning kasvatada oma arvutus-, mudeli- ja andmetaristut. Reuters seob Portugali sammu sarnaste algatustega Prantsusmaal ja Saksamaal, kus toetatakse kodumaiseid arendajaid, nagu Mistral AI ja Aleph Alpha.
Artikli faktipõhi tugineb Portugali valitsuse 1. juuli 2026 pressiteatele, Reutersi samal päeval avaldatud uudisele, Amalia GitHubi ja Hugging Face’i materjalidele, AMALIA tehnilisele raportile, Portugali digiriigi portaalile, EuroHPC andmetele ning Euroopa Komisjoni AI Continent Action Plani materjalidele.
Mis täpselt muutus?
Portugal tegi avalikuks riikliku keelemudeli, mille eesmärk on pakkuda portugali keele Euroopa variandile ja Portugali õiguslikule, halduslikule ning kultuurilisele kontekstile paremini sobivat tehnoloogilist alust. Valitsuse pressiteate järgi saavad mudelit kasutada avalik sektor, ettevõtted, ülikoolid, uurimiskeskused ja kodanikud, et arendada rakendusi Portugali keele- ja õigusruumi vajadustele vastavaks.
Ametlikus materjalis rõhutatakse, et Amalia on avatud mudel. See tähendab, et seda saab auditeerida, kohandada ja kasutada Portugali või Euroopa Liidu kontrollitavas taristus. Pressiteade seob selle andmete kontrolli, läbipaistvuse, Euroopa andmekaitsepõhimõtete ja usaldusväärse tehisaru nõuetega.
Mudeli avaldamine ei tähenda, et Portugal oleks loonud ChatGPT-le otse võrdse tarbijatoote. Portugali valitsuse enda KKK ütleb selgelt, et ChatGPT on OpenAI rakendus, Amalia aga keelemudel, mille peale saab ehitada erinevaid rakendusi. See on oluline vahe: üks on valmis teenus, teine on tehnoloogiline alus.
Kes Amalia arendas ja kui palju see maksis?
Amalia arenduses osales konsortsium, kuhu kuuluvad Universidade NOVA de Lisboa, Instituto Superior Técnico, Universidade de Coimbra, Universidade do Porto, Universidade do Minho ning Fundação para a Ciência e a Tecnologia ehk FCT, sealhulgas Arquivo.pt ja FCCN. Portugali ametliku pressiteate järgi hõlmab projekt üle 60 teadlase, kes töötavad tehisaru, arvutuslingvistika ja informaatika valdkonnas.
Projekti esialgne arendus maksis 5,5 miljonit eurot ning seda rahastati Portugali taaste- ja vastupidavuskava ehk PRR kaudu. Valitsus teatas samas, et kuni 2027. aastani on kavandatud uus etapp, millele lisandub 1,5 miljonit eurot mudeli ja suveräänse taristu edasiarenduseks.
Tehniliselt on Amalia ehitatud Euroopa EuroLLM-9B mudeli peale, mida laiendati ja kohandati Euroopa portugali keelele. Portugali pressiteate järgi loodi esimeses etapis 9 miljardi parameetriga mudel, mida treeniti ligikaudu 4 triljoni sõna peal, kasutades portugali andmeid, sealhulgas Arquivo.pt sisu. Edasistes etappides on plaanis 22 miljardi parameetriga versioon ja uued võimed tehisaru agentide toetamiseks.
Avatud mudel, andmed ja kood
Amalia avalikud materjalid on koondatud GitHubi ja Hugging Face’i. GitHubi projektikirjeldus ütleb, et eesmärk on pakkuda täielikult avatud ressursse ja keelemudeleid, mis on loodud Euroopa portugali keele jaoks. Avalik ökosüsteem katab andmete töötlemise, mudeli treenimise ja hindamise ning sisaldab ka uusi hindamisandmestikke Euroopa portugali keele jaoks.
Hugging Face’is on avaldatud Amalia 2026. aasta juuni väljalaske kogud, sealhulgas AMALIA-9B mudelivariandid ja järelõppe andmestikud. Eraldi on olemas ka AMALIA-VL ehk nägemis- ja keelemudeli kogud, mis sisaldavad 2026. aasta juuni lõplikke mudelikontrollpunkte, treeningandmeid ja hindamisandmeid.
Portugali valitsuse pressiteade märgib, et mudel tehakse kättesaadavaks Apache 2.0 litsentsi alusel. See lubab mudelit kasutada, muuta ja levitada ka ärilisel eesmärgil, kui järgitakse litsentsitingimusi. Sama ametlik KKK rõhutab siiski, et mudel võib anda valesid või sobimatuid vastuseid ning kasutajatel peab olema võimalus probleeme raporteerida IA.gov.pt platvormi kaudu.
Miks Euroopa portugali keel vajab eraldi mudelit?
AMALIA tehniline raport kirjeldab probleemi otse: kuigi suured avatud keelemudelid on kiiresti arenenud, on Euroopa portugali keel nii treeningandmetes kui ka hindamisandmestikes alaesindatud. Raporti autorite järgi võivad masintõlgitud testid jätta märkamata Euroopa portugali keele variandi keelelised ja kultuurilised eripärad.
See eristus on praktiline, mitte ainult sümboolne. Portugali keele Brasiilia ja Euroopa variandid erinevad sõnavara, grammatika, ametliku registri, häälduse, halduskeele ja kultuuriviidete poolest. Kui mudel on treenitud peamiselt inglise või Brasiilia portugali andmetel, võib ta avalikus teenuses või õiguslikus tekstis anda vastuseid, mis kõlavad küll portugali keeles, kuid ei vasta kohalikule tavale.
Portugali valitsus nimetas juba 2024. aasta teates Amalia eesmärkideks portugali keele variantide eristamist, Portugali kultuuri ja ajaloo elementide tundmist, treeningandmete kontrolli ning tundlike avaliku sektori andmete turvalist kasutamist. See näitab, et mudel loodi algusest peale suveräänsuse ja avaliku sektori kasutuse raamistikus, mitte ainult keelemudelite üldise võimekuse tõestamiseks.
Arvutusvõimsus: Deucalion, MareNostrum 5 ja EuroHPC
Amalia arendus tugines Portugali ja Euroopa superarvutustaristule. Ametlik pressiteade nimetab Deucalioni, MareNostrum 5 ja EuroHPC võrku. Deucalion on EuroHPC superarvuti Guimarães’is Portugalis; EuroHPC andmetel on selle tippjõudlus 9,76 petaflopsi ning püsiv jõudlus 7,48 petaflopsi.
MareNostrum 5 asub Barcelonas ning kuulub samuti EuroHPC taristusse. Portugali FCT on varem kirjeldanud, et nii Deucalion kui ka MareNostrum 5 on Portugali teadlastele ja institutsioonidele kättesaadavad EuroHPC konkursside kaudu.
See arvutustaristu on Amalia puhul keskne, sest riiklik mudel ei koosne ainult mudelifailist. Vaja on andmete puhastamist, deduplitseerimist, treeningut, hindamist, järelõpet, turvateste ja kasutusjuhtumite majutamist. Amalia GitHubi materjalides on näiteks eraldi andmetöötluse tööriistad, mis toetavad tekstimassiivide filtreerimist, deduplitseerimist ja töötlemist suurtel arvutuskeskkondadel, sealhulgas MareNostrumi klastril.
Euroopa suveräänsuse kontekst
Amalia sobitub Euroopa Komisjoni laiemasse plaani kasvatada tehisaru taristut, kasutust ja tööstuslikku võimekust. Euroopa Komisjoni AI Continent Action Plan nimetab arvutustaristut üheks viiest strateegilisest valdkonnast, eesmärgiga toetada mudelite treenimist ja peenhäälestamist; samal lehel on AI Factories algatuse eelarveks märgitud 10 miljardit eurot aastateks 2021–2027.
2026. aasta juunis avaldatud Apply AI Strategy seab eesmärgiks tugevdada Euroopa konkurentsivõimet ja tehnoloogilist suveräänsust ning suurendada tehisaru kasutuselevõttu strateegilistes sektorites, eriti väikeste ja keskmise suurusega ettevõtete seas.
Portugal liigub sama suuna riikliku rakenduse poole. Kui suured USA mudelid jäävad paljudele kasutajatele parimaks üldotstarbeliseks valikuks, siis avaliku sektori ja keelepõhiste töövoogude puhul on kohalik mudel teistsuguse loogikaga: kontroll andmete, taristu, auditeeritavuse ja kohaliku keelekvaliteedi üle võib olla tähtsam kui globaalne edetabelikoht.
Ekspertide ja ametnike vaade
Portugali peaminister Luís Montenegro sidus Amalia avaldamise Euroopa strateegilise autonoomiaga ning ütles Reutersi teatel, et tehisaru on muutunud selle autonoomia keskseks osaks. Ta nimetas mudelit vahendiks, mis aitab Portugalil liikuda järgmiste kümnendite poole väiksema sõltuvusega välisteenusepakkujatest.
Portugali riigireformi minister Gonçalo Matias rõhutas valitsuse pressiteates, et avatud mudel võimaldab riigil, ettevõtetel ja akadeemial arendada portugali keeles tehisarurakendusi inimeste ja majanduse teenistuses. Tema sõnul on tegu investeeringuga riigi tehnoloogilisse autonoomiasse ja järgmiste aastakümnete konkurentsivõimesse.
Tehniline raport toetab seda vaadet uurimispõhise argumendiga: Euroopa portugali keel on mudelites ja benchmarkides alaesindatud ning selle probleemi lahendamiseks ei piisa ainult üldisest mitmekeelsest mudelist. Vaja on kohalikku treeningandmete valikut, kohalikke hindamismõõdikuid ja testandmestikke, mis ei põhine ainult ingliskeelsete testide tõlkimisel.
Eesti lugeja vaade
Eesti jaoks on Amalia oluline mitte Portugali mudelina, vaid eeskujuna. Väikese ja keskmise keeleruumi puhul ei taga suur rahvusvaheline mudel alati head halduskeelt, õiguskeelt, kultuurilist täpsust ega avaliku sektori vajadustele vastavat andmekontrolli. Sama probleem puudutab ka eesti keelt.
Eesti on digiriigi poolest tugev, kuid riikliku keelemudeli küsimus ei ole ainult tehniline. Küsimus on selles, kas avalik sektor soovib kriitiliste teenuste jaoks kasutada üksnes väliseid mudeleid või arendada kohalikke komponente, mida saab kontrollida, auditeerida ja käitada Euroopa õigusruumis. Portugali mudel näitab üht võimalikku teed: ülikoolid, teadusasutused, riiklik rahastus, Euroopa superarvutustaristu ja avatud litsents.
Eesti ettevõtetele on Amalia signaal, et Euroopa keelte ümber võib tekkida uus tööriistade turg. Avaliku sektori assistendid, dokumentide otsing, õigus- ja haldustekstide analüüs, hariduse abivahendid ja klienditeenindus ei vaja alati suurimat võimalikku mudelit. Mõnikord on olulisem, et mudel tunneks kohalikku keelt, terminoloogiat ja reegleid ning et seda saaks käitada kontrollitud keskkonnas.
Eesti avaliku sektori jaoks on Amalia õppetund ka hankepoliitika mõttes. Kui riik soovib kasutada tehisaru kodanike teeninduses, peab juba alguses otsustama, kuidas lahendatakse andmete asukoht, auditijälg, mudeli uuendamine, vastutaja määramine, veateadete menetlus ja sõltuvus välisest teenusepakkujast.
Riskid ja piirangud
Amalia ei püüa Portugali ametliku KKK järgi otse konkureerida ChatGPT, Claude’i või Geminiga. Valitsus kirjeldab seda avatud mudelina, mis vastab Portugali, avaliku sektori ja kohaliku innovatsiooniökosüsteemi vajadustele. See on kainestav täpsustus, sest riikliku mudeli väärtus ei pruugi tulla üldises võimekuses maailma tippmudelitega võistlemisest.
Teine piirang puudutab kasutusvalmidust. Mudeli avaldamine ei tähenda, et kõik avaliku sektori teenused muutuvad kohe usaldusväärselt automaatseks. Portugali pressiteate järgi on esimesed kasutusjuhud seotud kultuuri, hariduse, avaliku digiteeninduse ja mereväe otsustustoega. Need valdkonnad eeldavad eraldi kohandamist, testimist ja vastutusahela määramist.
Kolmas risk on andmete ja autoriõiguse küsimus. Valitsuse KKK järgi kasutati avalikke ja õiguslikult kättesaadavaid andmeid ning projekt tugineb Euroopa teadusuuringute eranditele. Samas märgib sama dokument, et mudeli tulevane äriline kasutus peab vastama iga konkreetse kasutusjuhu õigusnõuetele. See tähendab, et avatud litsents ei vabasta kasutajat automaatselt kõigist andme-, autoriõiguse- või vastutusküsimustest.
Neljas piirang puudutab kvaliteeti. Amalia võib valitsuse enda teatel anda valesid või sobimatuid vastuseid. Mudelil on küll turvamehhanismid ja raporteerimiskanal, kuid avalikus teenuses ei saa sellist süsteemi kasutada ilma inimjärelevalve, logimise, piirangureeglite ja tagasisideprotsessita.
Viies risk puudutab avatud mudeli tegelikku kasutatavust. Mudel võib olla avatud, kuid selle tootmiskasutus nõuab endiselt taristut, arendajaid, andmete ettevalmistust, turvateste ja hooldust. Avatud mudel vähendab sõltuvust ühest välisest teenusest, kuid ei tee tehisaru kasutuselevõttu automaatselt odavaks ega lihtsaks.
Mida edasi jälgida?
Esiteks tuleb jälgida, kuidas Amalia esimesed avaliku sektori kasutusjuhud töötavad. Gov.pt assistent, muuseumide ja monumentide virtuaalsed abimehed, õpetajate tööriistad ja mereväe otsustustugi näitavad, kas mudel suudab toimida päris teenindus- ja otsustuskeskkonnas.
Teiseks on oluline 2027. aastani kavandatud lisaarendus. Portugali valitsus lubab 1,5 miljoni euro suurust lisainvesteeringut, 22 miljardi parameetriga versiooni ning agentidele mõeldud uusi võimeid. See näitab, et 2026. aasta avaldamine ei ole projekti lõpp, vaid vaheetapp.
Kolmandaks tuleb jälgida sõltumatuid hindamisi. Amalia enda tehniline raport ütleb, et mudel on konkurentsivõimeline tugevate avatud mudelitega ja parandab tulemusi Euroopa portugali keele spetsiifilistel testidel, kuid riikliku mudeli väärtust tuleb hinnata ka avaliku sektori töövoogudes: täpsus, hallutsinatsioonid, keeleline loomulikkus, õiguslik sobivus, kulu ja turvalisus.
Kokkuvõte
Amalia ei muuda Portugali üleöö maailma juhtivaks mudeliriigiks, kuid see on oluline samm Euroopa väiksemate keelte ja avaliku sektori digisuveräänsuse jaoks. Portugal näitab, et riiklik keelemudel võib olla mitte ainult teadusprojekt, vaid avaliku teenuse, ettevõtluse ja kohaliku keeleruumi taristu.
Eesti jaoks on peamine õppetund selge: tehisaru suveräänsus ei tähenda üksnes oma mudeli nime ega sümboolset käivitamist. See tähendab andmeid, arvutusvõimsust, avatud koodi, kohalikke hindamismõõdikuid, õigusselgust ja pikaajalist hooldust. Portugali Amalia on selles mõttes praktiline näide, kuidas üks Euroopa riik püüab muuta keele, avaliku sektori ja teadustaristu tehnoloogiliseks eeliseks.
Korduma kippuvad küsimused
Mis on Amalia?
Amalia on Portugali avatud suur keelemudel, mis on arendatud Euroopa portugali keele ja Portugali kohaliku konteksti jaoks. Selle ametlik nimi on Assistente Multimodal Automático de Linguagem com Inteligência Artificial.
Kas Amalia on Portugali ChatGPT?
Ei. Portugali valitsus rõhutab, et ChatGPT on OpenAI rakendus, Amalia aga keelemudel, mille peale saab ehitada erinevaid rakendusi. See on alusmudel, mitte ainult valmis juturobot.
Kes Amalia arendas?
Mudeli töötas välja Portugali ülikoolide ja uurimiskeskuste konsortsium, kuhu kuuluvad Universidade NOVA de Lisboa, Instituto Superior Técnico, Universidade de Coimbra, Universidade do Porto, Universidade do Minho ja FCT koos Arquivo.pt/FCCN-iga.
Kui palju Amalia maksis?
Esialgne arendus maksis 5,5 miljonit eurot ja seda rahastati Portugali taaste- ja vastupidavuskava kaudu. Kuni 2027. aastani on kavandatud veel 1,5 miljonit eurot mudeli ja suveräänse taristu edasiarenduseks.
Milleks Amaliat kasutatakse?
Esimesed kasutusjuhud on seotud muuseumide ja monumentide assistentidega, õpetajatele mõeldud tööriistadega, avaliku digiteenindusega gov.pt portaalis ning Portugali mereväe otsustustoega.
Kas Amalia on avatud lähtekoodiga?
Portugali valitsuse teatel tehakse mudel kättesaadavaks Apache 2.0 litsentsi alusel. Avalikud materjalid on koondatud muu hulgas GitHubi ja Hugging Face’i kogudesse.
Miks see Euroopa jaoks oluline on?
Amalia sobitub Euroopa laiemasse eesmärki tugevdada tehisaru taristut, keelelist võimekust ja tehnoloogilist suveräänsust. Euroopa Komisjon on sama suuna seadnud AI Continent Action Planis ja Apply AI Strategy dokumendis.
Mida see Eestile näitab?
Amalia näitab, et väiksema keeleruumi jaoks võib kohalik või piirkondlik keelemudel olla vajalik avaliku sektori, hariduse, õiguskeele ja kultuurilise täpsuse jaoks. Eesti puhul oleks sarnase arutelu keskmes eesti keele kvaliteet, andmete kontroll, Euroopa õigusruum ja avalike teenuste töökindlus.
Saa järgmine AI-RADAR postkasti
Kui järgmine praktiline AI-signaal või tööriistamuutus avaldatakse, saad selle otse e-postile.
Arutelu
0 kommentaari
Seotud teemad AI-RADARis

OpenAI GeneBench-Pro mõõdab, kas tehisaru suudab teha keerulist bioloogiaandmete analüüsi
OpenAI GeneBench-Pro mõõdab, kas tehisaru suudab teha keerulist bioloogiaandmete analüüsi. Selgitame tulemusi, piiranguid ja mõju.

Z.ai GLM-5.2 tõstab Hiina avatud mudelite lati: odavam alternatiiv survestab USA tippmudeleid
Z.ai ehk endine Zhipu AI avaldas GLM-5.2 mudeli avatud kaaludega ja MIT-litsentsi all. Mudel tõuseb Artificial Analysisi ja Arena mõõdikutes avatud LLM-ide tippu ning survestab USA suletud tippmudeleid hinna, ligipääsu

MIT Open Learning avas Universal AI programmi tehisintellekti oskuste lõhe vähendamiseks
MIT Open Learning avas Universal AI programmi, mis aitab õppijatel omandada tehisintellekti põhialuseid ja valdkonnapõhiseid rakendusi. Iseseisva tempoga programm on saadaval MIT Learn platvormil ning kasutab AI-toeg