OpenAI prezentuje GPT-4o. Czego się spodziewać po nowym modelu?
![Sam Altman](https://images.iberion.media/images/1920/14092193106_0f9355959d_k_d1fb5b99fc_bc9a962d10_bdffc1ccf0_d5bdfb5d5b_d999eb87f8.jpg)
OpenAI zaprezentowało wczoraj przedsmak nowego wariantu dużego modelu językowego GPT o nazwie GPT-4o. Według szefa OpenAI, Sama Altmana, jest to LLM, którego możliwości można porównać do Samanthy ze świetnego filmu “Her”. Mowa o nowej generacji inteligentnego asystenta, który przetwarza tekst, dźwięk i obraz wideo.
OpenAI prezentuje GPT-4o
Cechą wyróżniającą GPT-4o ("o" od omni) na tle innych wariantów GPT zaprezentowanych wcześniej przez OpenAI jest to, że pracuje on w wielu trybach jednocześnie. Wcześniej, aby przetwarzać tekst, mowę lub obraz, konieczne było zaangażowanie do tego trzech różnych wariantów dużego modelu językowego. GPT-4o to zmienia - dane wejściowe przetwarzane są w ramach jednego modelu, z którego korzysta się za pomocą jednego interfejsu. Główną metodą posługiwania się modelem ma być głos - narzędzie stawia na interakcję przez konwersację, jednak już w mowie, a nie jak miało to miejsce w ChatGPT - w piśmie.
Już wcześniej aktywność Altmana w serwisie X wskazywała na to, że nowość będzie miała wiele wspólnego z uniwersalnym asystentem Samantha znanym z filmu “Her”. Przypomnijmy, że tam główny bohater korzystał z niewielkiej bezprzewodowej słuchawki, by rozmawiać ze sztuczną inteligencją na dowolny temat - od pozyskiwania informacji, przez automatyzację zadań na relacjach towarzyskich, a w końcu romantycznych kończąc.
Polski konkurent dla ChatGPT do kosza? Minister cyfryzacji ma obawyUniwersalny asystent, który ma głos
Czy tak rozbudowane możliwości będzie miało także GPT-4o? Zdaniem Altmana nowy model stał się dla niego najbardziej naturalnym sposobem wchodzenia w interakcje z maszyną, jakiej kiedykolwiek doświadczył. Spore wrażenie robią także opublikowane materiały promocyjne. W ramach jednej aplikacji mobilnej można rozmawiać z modelem, może on analizować na bieżąco obraz z kamery smartfonu, rozpoznawać emocje odbiorcy (co swoją drogą jest zakazane na terenie EU na mocy aktu o sztucznej inteligencji) i żywo reagować z użyciem damskiego lub męskiego głosu.
Zastosowania można mnożyć: od codziennej asysty, czyli spełnienia obietnicy danej i zapomnianej przez Siri czy Asystenta Google, przez niezwykle sprawne tłumaczenia maszynowe, w których GPT-4o działa niemal jak tłumacz symultaniczny, do zaawansowanego przetwarzania obrazu. Oczywiście to czas pokaże, jak w model sprawuje się w praktyce. Zwłaszcza że już dopatrzono się pierwszych sztuczek - 4o może tak naprawdę używać dwóch modeli, pierwszego o bardzo niskiej latencji i drugiego, właściwego, tak aby jak najszybciej reagować na dane wejściowe, co jest bardzo efektowne, a dopiero późnej przetwarzać prompty.
Możliwości i dostępność GPT-4o
Efektowność - to chyba najważniejszy wniosek płynący z wczorajszych prezentacji OpenAI. Oczywiście nie brakuje już prognoz dotyczących wpływu modelu na zachowania społeczne czy też, że GPT-4o to w zasadzie koniec barier językowych. Pół żartem, pół serio mówi się o tym, że relacja z 4o będzie zastępować relacje międzyludzkie, co znów jest realizacją scenariusza “Her”. Szum wokół premiery OpenAI jest ogromny, ale być może lepiej podsumowują ją słowa samego Altmana:
ChatGPT dało nam przykład tego, co jest możliwe z interfejsami językowymi; Ta nowa rzecz sprawia wrażenie czegoś zupełnie nowego. Jest szybka, sprytna, naturalna i pomocna.
Tylko tyle i aż tyle. ChatGPT nie odmienił świata w sposób, jaki przewidywano. Po półtora roku od premiery i kilku iteracjach nadal jest bardzo głupi i często nie potrafi porównać wielkości dwóch liczb naturalnych, a szum wokół pierwszych odsłon publicznych dużych modeli językowych częściowo ucichł. Podobnie do nadmuchanych oczekiwań wobec GPT-4o warto podchodzić z rezerwą. Zwłaszcza że zgodnie z nowym zwyczajem Doliny Krzemowej, premiera niewiele ma wspólnego z udostępnieniem usługi na rynku.
Na razie możliwości 4o będą trafiać do ChatGPT - stopniowo i w ograniczonym zakresie, bowiem tylko w ramach interfejsu tekstowego oraz z wykorzystaniem statycznego obrazu. Po stronie użytkownika zmieni się więc niewiele, można spodziewać się większej skuteczności i szybkości. Tryb głosowy, a więc chyba największy wyróżnik 4o, udostępniony zostanie w ciągu nadchodzących tygodni na razie wyłącznie subskrybentom ChatGPT Plus.
![Chrome](https://images.iberion.media/images/origin/chrome_ochrona_fot_pxhere_DALL_E_897cb3f8b6.png)
![SearchGPT](https://images.iberion.media/images/origin/Search_GPT_2_fot_screen_Open_Ai_Beata_Zawadzka_EN_93670a16d3.png)
![smartfon](https://images.iberion.media/images/origin/adrien_K12_Srka_Zu_Cg_unsplash_6843bef84f_09250301c3.jpg)
![YouTube Music](https://images.iberion.media/images/origin/youtube_music_fot_Ivan_Radic_Flickr_bf764ead4a.png)
![kierowca](https://images.iberion.media/images/origin/kierowca_Phxere_989c3234ff.jpg)
![WhatsApp](https://images.iberion.media/images/origin/Whatsapp_tlumacz_Pxhere_a2fa65d06b.png)
![satya nadella](https://images.iberion.media/images/origin/EN_01612594_1386_cc336b4b37.jpg)
![Parlament Europejski](https://images.iberion.media/images/origin/guillaume_perigois_w_Vq_C9dty3_VQ_unsplash_f9b12e8712_d82882e749.jpg)
![Łazik marsjański](https://images.iberion.media/images/origin/Mars_fot_NASA_F_Lickr_NASA_screen_X_4be9dea17c.png)
![Microsoft](https://images.iberion.media/images/origin/Bill_Gates_fot_UN_Geneva_Flickr_Ian_Burt_Flickr_459156c534.png)
![bsod](https://images.iberion.media/images/origin/d2cdj47_96650d61_1fbd_49ad_99c1_319d7de22dce_1e17cdae56.jpg)
![smartfony](https://images.iberion.media/images/origin/Screenshot_2024_07_24_18_00_34_4eaf2daf51.png)
![smartfon](https://images.iberion.media/images/origin/pexels_zaktech90_971325_1785d660e5.jpg)
![windows](https://images.iberion.media/images/origin/ed_hardie_Y5_P_Sy_Mm8n_Mk_unsplash_a2e41d842e_55b39ba678.jpg)
![Tesla](https://images.iberion.media/images/origin/bram_van_oost_2_N_Aqu_Pmxld8_unsplash_1bf15069aa.jpg)
![niebieski ekran śmierci](https://images.iberion.media/images/origin/The_Blue_Screen_of_Death_in_the_wild_51122315060_b4cdc9361c.jpg)
![google](https://images.iberion.media/images/origin/kai_wenzel_06_MH_Ff_Yv6_YY_unsplash_04e5a6fa83.jpg)
![Ładowarka](https://images.iberion.media/images/origin/Ladowarka_ba28511a6f.png)
![oszustwo](https://images.iberion.media/images/origin/telefon_12ea8a73ab_5caa5afa68_3d0fe0099a.jpg)
![mobywatel](https://images.iberion.media/images/origin/visual_4_17b14e44cd.png)
![Google](https://images.iberion.media/images/origin/Google_fot_Anthony_Quintano_Wikimedia_Commons_dcd7e6496a.png)
![awaria telefonu](https://images.iberion.media/images/origin/uszkodzony_telefon_fot_Pickpik_325732ad2f.png)
![windows](https://images.iberion.media/images/origin/clint_patterson_y_G_Px_CYPS_8_H4_unsplash_391c3f943a_e7241626dc_12618c2621.jpg)
![Playstation](https://images.iberion.media/images/origin/playstation_pad_Pxhere_5528554fea.png)
![Bankomat](https://images.iberion.media/images/origin/bankomat_Pxhere_cb0e68368a.png)
![haker](https://images.iberion.media/images/origin/pexels_mikhail_nilov_6964348_1_b4310ba88d_3b9344f743_d6f92d902a_18a3ec66c9_1f47d54829_c84fb0b933_81c687761f_8ba8ea34f7_57af3715cf_f20d1fe785_87a78f98bd_f6e4f8dc2b_d7cfd63ce0_7d560034da_390fbea8a8.jpg)
![Celine Dion](https://images.iberion.media/images/origin/Kopia_WZORY_DLA_SG_2024_07_26_T233159_059_b0fccb9d4f.jpg)
![Występ Lady Gagi na Igrzyskach Olimpijskich](https://images.iberion.media/images/origin/Wystep_Lady_Gagi_na_Igrzyskach_Olimpijskich_c57c60b176.png)
![Rak szyjki macicy, rak](https://images.iberion.media/images/origin/Co_roku_z_powodu_tego_raka_umiera_1600_Polek_9631c7e88a.jpg)
![Bożena Dykiel, Mieczysław Hryniewicz](https://images.iberion.media/images/origin/Bozena_Dykiel_Mieczyslaw_Hryniewicz_f9de23f40d.jpg)
![Był sobie kot](https://images.iberion.media/images/origin/Byl_sobie_kot_d3edad37dc.jpg)
![Materiały promocyjne](https://images.iberion.media/images/origin/Kobieta_w_ogrodzie_a42c929a56.png)
![Chrome](https://images.iberion.media/images/origin/chrome_ochrona_fot_pxhere_DALL_E_897cb3f8b6.png)
![Wakacje](https://images.iberion.media/images/origin/upadek_biura_1831724a08.png)
![Kot i Pies](https://images.iberion.media/images/origin/Projekt_bez_nazwy_1_40e6b73458.png)
![Celine Dion](https://images.iberion.media/images/origin/Szablony_Lelum_1200x700_88_20cfa0db40.png)
![tarcie jabłek](https://images.iberion.media/images/origin/kolacja_na_cieplo_b4401f9f16.jpg)
![Wulkan](https://images.iberion.media/images/origin/wulkan_turysci_pl_nowe_bd7df8b62a.jpg)