Tech.BiznesINFO.pl > Sztuczna inteligencja > Polscy naukowcy stworzą odpowiedź na ChatGPT. PLLuM będzie darmowy
Maciej Olanicki
Maciej Olanicki 02.12.2023 17:13

Polscy naukowcy stworzą odpowiedź na ChatGPT. PLLuM będzie darmowy

flaga polski
Fot. Pixabay

Tempo rozwoju silników przetwarzających język naturalny oraz dużych modeli językowych w ciągu ostatniego roku sprawił, że dysponowanie własnymi narzędziami tego rodzaju stanowi o konkurencyjności lub jej braku. W Polsce do podobnych wniosków doszła część środowiska akademickiego i powołała do życia konsorcjum Polish Large Language Universal Model.

Powstanie polski duży model językowy

Powstanie takiej inicjatywy jak PLLuM było raczej kwestią czasu niż prawdopodobieństwa. Zgodnie z wielokrotnie przyjmowanym już w Polsce paradygmatem, gdzie na innowacje, które w krajach bardziej rozwiniętych są opracowywane głównie siłami sektora prywatnego, odpowiada się przedsięwzięciem państwowym. Jak mówi, Wojciech Pawlak, dyrektor Państwowego Instytutu Badawczego NASK, plany są ambitne:

Wypracowany przez czołowe jednostki badawcze przy współpracy z administracją publiczną, zgodnie z zasadami odpowiedzialnego rozwoju systemów AI, transparentny i całkowicie dostępny otwarty model będzie innowacją na skalę światową w rozumieniu przedsięwzięcia łączącego dostęp do danych, kompetencji, zasobów technicznych oraz know-how jednostek naukowych i rządowych we wspólnym celu wspierania nauki i gospodarki, w tym konkurencyjności polskich przedsiębiorstw

W rezultacie w skład konsorcjum weszło sześć państwowych jednostek naukowych: Politechnika Wrocławska, która będzie przewodzić pracom, Państwowy Instytut Badawczy NASK, Ośrodek Przetwarzania Informacji przy Państwowym Instytucie Badawczym, Instytut Podstaw Informatyki PAN, Uniwersytet Łódzki oraz Instytut Slawistyki PAN.

Jaki będzie PLLuM?

Celem konsorcjum jest zbudowanie polskiego dużego modelu językowego oraz opracowanie na jego bazie oprogramowania, które będzie służyć jako cyfrowy asystent. „Polskość” w tym przypadku oznacza tyle, że model będzie trenowany w większej mierze na treściach spisanych w języku polskim. Konsorcjum wskazuje na ten sam parametr takiego podejścia do rozwoju tzw. sztucznej inteligencji, o którym w ostatnim czasie wspominał także Władimir Putin, tj. nadania jej narodowego rysu:

W ocenie przedstawicieli konsorcjum wyraźnie większy udział tekstów oryginalnie napisanych w języku polskim oraz zawierających informacje o Polsce (polskiej nauce, sztuce, historii, prawie, gospodarce i innych) pozwoli zwiększyć widoczność naszego języka i kultury, które w obecnie dostępnych modelach są odczuwalnie marginalizowane.

Co ważne, PLLuM będzie udostępniany na licencji open source, a dostęp do niego będzie bezpłatny. To ważna wiadomość także dla świata biznesu, polskich firm, które będą mogły komercyjnie wykorzystywać możliwości modelu. Ponadto założyciele konsorcjum już teraz zapowiadają, że końcowy produkt sam w sobie będzie mógł stanowić obiekt badawczy, np. w zakresie prac nad wyjaśnianiem mechanizmów funkcjonowania oprogramowania klasy LLM, co jest niemożliwe w przypadku komercyjnych, zamkniętych modeli, np. GPT. 

LLM po polsku

Jednym z uzasadnień konieczności zbudowania „narodowego” LLM-a ma być służba obywatelom – dzięki niemu i nowemu asystentowi będą mogli uzyskać dostęp do informacji na temat m.in. usług publicznych. Na razie nie wiadomo, czy PPLuM sam będzie wykorzystywał znane już komponenty opensource’owe, czy też będzie modelem budowanym od zera. Nieznany jest także harmonogram prac.