Maciej Olanicki 22.10.2023 09:41

Niezwykły procesor IBM-u: NorthPole jest 25 razy szybszy w trenowaniu sieci neuronowych niż najlepsze GPU

for. Windows/Unsplash

Budowanie sieci neuronowych i prace nad szeroko pojętą tzw. sztuczną inteligencją są dziś ograniczane dwoma czynnikami: zapotrzebowaniem na moc obliczeniową oraz energię. IBM opracował prototyp dość nietypowego procesora, który ma rozwiązać przynajmniej jeden z nich. Poznajcie IBM NorthPole.

IBM prezentuje prototyp układu NorthPole

Inżynierowie z kalifornijskiego ośrodka badawczego IBM-u poinformowali, że ukończyli kolejny etap prac nad nowym procesorem, który posłuży do uruchamiania zaawansowanego oprogramowania nazywanego dziś, w dużej mierze roboczo, sztuczną inteligencją. Nie ma w tym nic dziwnego – nad podobnymi przedsięwzięciami pracuje każda szanująca się korporacja z Doliny Krzemowej.

Tym, co wyróżnia NorthPole na tle klastrów budowanych w sposób tradycyjny, jest architektura samego czipu. IBM dostrzegł problem wąskich gardeł, jaki występuje, gdy w budowanie sieci neuronowych należy sprzętowo polegać na dostępach do zewnętrznych pamięci. Dlatego zdecydowano, by innowacja NorthPole bazowała na ograniczeniu takich potrzeb. Jak największa część procesu trenowania sieci neuronowych, mających przecież odtwarzać strukturę ludzkiego mózgu, ma się odbywać wewnątrz samego procesora, bez konieczności odczytywania danych z zewnątrz.

Analogowe procesory ze szkła. Nowy pomysł na sztuczną inteligencję zwiększy wydajność i ograniczy zużycie energii

Znacząca przewaga nad GPU

Prototyp NorthPole, zamiast polegać na pamięci, sam poniekąd jest pamięcią. Składa się z łącznie z 22 mld tranzystorów, co przekłada się na tablicę 12-nanometrowych jednostek obliczeniowych w układzie 16×16, z których każda dysponuje własną pamięcią wbudowaną (nie mylić z pamięć podręczną) o wielkości 786 kilobajtów. Na każdej z nich można wykonywać kod – jednocześnie do 8 tys. operacji z 2-bitową precyzją. W rezultacie całość budowanej sieci neuronowej ma być możliwie jak najbardziej „zamknięta” w obrębie procesora i ograniczona jest konieczność polegania na innych komponentach.

Zrzut ekranu 2023-10-22 091455.png — Układ IBM NorthPole na karcie PCIe, fot. IBM Research.

W parze z odpowiednio zbudowanym oprogramowaniem już na etapie prototypu udało się wytrenować sieć neuronową w sposób dalece bardziej efektywny niż, gdyby bazowano wyłącznie na GPU, jak to w lwiej części przypadków ma miejsce dzisiaj. Z przeprowadzonych dotąd testów, w których wydajność IBM NorthPole porównywano z GPU NVIDIA V100 Tensore Core. Przy takiej samej ilości zużytej energii prototyp IBM-u zdołał przeprowadzić 25 razy więcej operacji niż grafika NVIDII.

Czip dalece wyspecjalizowany

Oczywiście nie obyło się bez ograniczeń. Niecodzienna, charakterystyczna dla NorthPole architektura limituje zastosowania. Układ IBM-u jest wyspecjalizowany we wnioskowaniu i może być wykorzystywany do bardzo konkretnych zadań w zakresie przetwarzania obrazu (rozpoznawanie i klasyfikacja) i dźwięku (transkrypcje maszynowe), w przypadku których jest nawet do 35 razy bardziej efektywny. Niestety ze względu na jego budowę mało skuteczne będzie prowadzenie z użyciem NorthPole prac nad generatywną czy ogólną sztuczną inteligencją.

Tagi: Sztuczna inteligencja Nauka elektronika