Студенти и истражувачи на Факултетот за електротехника и информациски технологии (ФЕИТ / УКИМ) ја освоија наградата за најдобар научен труд со наслов “Towards Open Foundation Language Model and Corpus for Macedonian: A Low-Resource Language” на меѓународната конференција „Slavic NLP Workshop“, одржана во Виена во рамките на 63-тото издание на една од најпрестижните светски конференции за обработка јазик – ACL (Association for Computational Linguistics).
Стефан Крстески, Борјан Саздов и Матеа Ташковска, под менторство на професорите Бранислав Геразов и Христијан Ѓорески, со овој труд направија значаен придонес кон дигитализацијата и технолошкиот развој на македонскиот јазик и Вештачката Интелигенција (ВИ) во Македонија. Во рамките на ова истражување беа развиени четири клучни ресурси:
- голем јазичен ВИ модел (анг. LLM) специјализиран за македонски јазик кој е најдобар во својата категорија – domestic-yak-8B
- најголемиот јавно достапен текстуален корпус за македонски јазик
- множество на инструкции на македонски јазик наменето за развој на големи јазични модели
- систем за евалуација на перформансите на јазичните модели на македонски јазик
Овие ресурси се јавно достапни на веб-страницата www.lvstck.org и претставуваат прва отворена инфраструктура за развој на големи јазични модели и апликации базирани на вештачка интелигенција на македонски. Овие ресурси можат се искористат како основа за понатамошни истражувања, развој на македонски јазични алатки и нивна примена во различни сфери и апликации.
ACL е водечка глобална конференција во областа на обработка на природен јазик, со традиција од 63 години. “Slavic NLP”Workshop, која оваа година го одбележа своето десетто издание, е посветена на истражувања од областа на обработка на сите словенски јазици.
Овој успех не само што претставува меѓународно признание за македонските истражувачи, туку и чекор кон дигитална иднина во која македонскиот јазик добива поддршка и видливост во глобалниот развој на јазични технологии и вештачка интелигенција.