HOT
HOT
HOT
HOT
HOT
Publikacja: 29 listopada 2023 | Autor: Krzysztof Pacuk
Spis treści
Odkryj, jak polscy naukowcy zmieniają oblicze sztucznej inteligencji, tworząc własną wersję ChatGPT. Będzie to nie tylko technologiczny przełom, ale też krok ku głębszemu zrozumieniu polskiej kultury i języka przez AI.
Rozwój sztucznej inteligencji w Polsce wkroczył na nowy, ekscytujący poziom. Zespół z Politechniki Wrocławskiej podjął się ambitnego zadania stworzenia polskiej wersji ChatGPT. Ten projekt, oprócz wprowadzenia języka polskiego do świata AI, ma ambicję lepszego odzwierciedlenia polskich realiów kulturowych i historycznych w cyfrowym świecie.
Naukowcy z Politechniki Wrocławskiej podjęli się ambitnego zadania stworzenia polskiej wersji ChatGPT. Dr hab. inż. Tomasz Kajdanowicz, kierownik Katedry Sztucznej Inteligencji, podkreśla wagę badań AI w strategii uczelni, zwracając uwagę na zróżnicowane zastosowania sztucznej inteligencji. Ten krok może wydawać się luksusem, ale w rzeczywistości jest niezbędny dla dokładnego odwzorowania języka polskiego i jego kulturowego kontekstu w cyfrowym świecie.
Wizja ChatGPT mówiącego po polsku nabiera realnych kształtów dzięki staraniom zespołu Politechniki Wrocławskiej. Dr hab. inż. Maciej Piasecki, koordynator konsorcjum naukowego CLARIN-PL, wyjaśnia, że kluczem do sukcesu jest stworzenie wielkiego polskiego modelu językowego. Dzięki temu polska wersja ChatGPT będzie mogła lepiej odzwierciedlać unikalne aspekty polskiego języka i kultury.
Zespół CLARIN-PL koncentruje się na zebraniu jak najszerszych zasobów językowych. Dr inż. Jan Kocoń z Katedry Sztucznej Inteligencji zauważa, że obecna wersja ChatGPT OpenAI ma ograniczenia w zakresie zrozumienia polskiego języka.
Podejrzewamy, że podczas trenowania ChatGPT nie widział za dużo języka polskiego w stosunku do innych języków. W związku z tym jest duża szansa, że przygotowując odpowiedzi, nadpisuje pewną wiedzę dotyczącą polskiej kultury, obyczajów i faktów danymi z innych języków.
dr inż. Jan Kocoń
Dlatego naukowcy intensywnie pracują nad zbieraniem danych, które pomogą stworzyć model bardziej adekwatny do polskiego kontekstu.
Projekt ten ma ogromne znaczenie nie tylko dla języka polskiego, ale i dla kultury. “W tej chwili modele językowe zaczynają kształtować język, którym się posługujemy. Chcielibyśmy, żeby nasz model bardzo dobrze oddawał specyfikę języka polskiego i pozytywnie na niego oddziaływał,” podkreśla prof. Piasecki. Dzięki temu polski ChatGPT będzie w stanie lepiej reagować na specyficzne potrzeby użytkowników, zachowując przy tym wysoką poprawność językową i kulturową.
Rozwój polskiej wersji ChatGPT na Politechnice Wrocławskiej to nie tylko kwestia oprogramowania, ale też inwestycja w zaawansowaną infrastrukturę technologiczną. Jak mówi dr inż. Jan Kocoń, projekt opiera się na sprzęcie wartej niemal 130 mln zł.
Kupujemy sprzęt warty prawie 130 mln zł. Składa się na niego m.in. 300 kart graficznych H100, stosowanych do trenowania głębokich sieci neuronowych, ponad 30 petabajtów (jeden petabajt to tysiąc terabajtów) miejsca na dyskach twardych i petabajt pamięci RAM. Nie czekaliśmy na ten sprzęt z założonymi rękami. Już teraz mamy zebrane prawie 300 gigabajtów czystego tekstu pochodzącego z różnych źródeł i liczba ta cały czas rośnie.
dr inż. Jan Kocoń
Naukowcy nie tracą czasu, o czym świadczy zebranie prawie 300 gigabajtów czystego tekstu z różnorodnych źródeł. Ta praca pokazuje determinację zespołu w dążeniu do stworzenia modelu, który będzie adekwatnie odzwierciedlał polską rzeczywistość językową i kulturową.
Prof. Maciej Piasecki podkreśla znaczenie projektu dla polskiej tożsamości językowej i kulturowej, wskazując na wpływ, jaki wielkie modele językowe mają na współczesny język.
W tej chwili modele językowe zaczynają kształtować język, którym się posługujemy. Coraz więcej treści jest generowanych na życzenie użytkownika, a czasem wręcz w jego zastępstwie. Dlatego chcielibyśmy, żeby nasz model bardzo dobrze oddawał specyfikę języka polskiego i pozytywnie na niego oddziaływał.
prof. Maciej Piasecki
Jest to ważne zarówno dla zachowania tożsamości językowej, jak i dla precyzyjnego przekazywania informacji.
Ambicją projektu jest stworzenie narzędzia, które będzie stanowić wiarygodne źródło wiedzy o Polsce i polskim języku. „W naszym interesie jest, by nad tym panować i mieć kontrolę nad informacjami, które są związane z naszym krajem,” mówi dr Kocoń. Wrocławski zespół ma nadzieję, że polski ChatGPT zostanie dobrze przyjęty przez użytkowników i przyczyni się do rozwoju polskiej nauki i technologii.
Stworzenie polskiej wersji ChatGPT przez Politechnikę Wrocławską to wielki krok dla polskiej AI. Ten projekt łączy nowoczesny sprzęt i ogromne ilości danych, by stworzyć coś, co naprawdę rozumie nasz język i kulturę. To nie tylko technologia dla technologii, ale narzędzie, które ma szansę zbliżyć nas do przyszłości, w której maszyny lepiej nas rozumieją.
Wkrótce będziemy świadkami, jak polski ChatGPT wychodzi poza granice laboratorium, a my z niecierpliwością czekamy na pierwsze testy. To emocjonujący czas dla wszystkich, którzy interesują się technologią i językiem, a sukces tego projektu może zainspirować inne kraje do podobnych przedsięwzięć.
Najnowsze prompty
Zobacz także