Ile energii zużywa twoja komenda dla AI? Udało nam się tego dowiedzieć

Ilość energii zużywanej przez współczesne modele sztucznej inteligencji staje się coraz bardziej zauważalna. W ogromnym centrum danych w Ashburn w stanie Wirginia rzędy złocistych kart Nvidia H100, zamkniętych w metalowych klatkach i chłodzonych strumieniami powietrza, pochłaniały prąd niczym mała elektrownia.

Według amerykańskiego Departamentu Energii i laboratorium Lawrence Berkeley takie obiekty mogą do 2028 r. zużywać nawet 12 proc. całej energii elektrycznej w USA, a szacunki Joint Research Centre Komisji Europejskiej wskazują, że w Unii udział centrów danych w popycie na prąd może przekroczyć 5 proc. już przed końcem dekady. W Europie buduje się kolejne farmy serwerowe w Dublinie, Frankfurcie czy nordyckich regionach z dostępem do tańszej energii odnawialnej, a wymogi unijnych dyrektyw dotyczących efektywności energetycznej zaczynają obejmować również wyspecjalizowane klastry GPU.

Każde polecenie wpisane w okno czatu lub generatora grafiki trafia najpierw do serwera brzegowego, a następnie – w milisekundach – do klastra wyspecjalizowanych układów graficznych, gdzie rozpoczyna się tzw. inferencja, czyli obliczanie odpowiedzi na podstawie wcześniej wytrenowanego modelu. Aby zminimalizować opóźnienia, duzi dostawcy chmury utrzymują takie zasoby coraz bliżej użytkowników. Amazon i Microsoft oferują klastry GPU m.in. we Frankfurcie, Dublinie czy Warszawie, a francuska firma OVHcloud inwestuje w podobne rozwiązania w Strasburgu i Roubaix.

Zużywa więcej prądu niż naładowanie smartfona

Informacji o dokładnym zużyciu energii wciąż brakuje, lecz niektóre liczby zaczynają przebijać się do opinii publicznej. OpenAI ujawnia, że pojedyncze zapytanie tekstowe do ChatGPT pochłania średnio ok. 0,34 Wh. Naukowcy z Hugging Face, testujący otwarte odpowiedniki komercyjnych modeli, wskazują, że krótka odpowiedź wygenerowana przez lekką wersję modelu Llama wymaga ok. 0,17 Wh, a bardziej rozbudowany wariant tego samego modelu, pracujący równolegle na kilku procesorach graficznych, już 1,7 Wh.

Obraz w rozdzielczości 1024 x 1024 pikseli to zbliżone 1,7 Wh, natomiast sześć sekund standardowej jakości wideo potrafi pochłonąć od 20 do 110 Wh, w zależności od konfiguracji i złożoności polecenia. Dla porównania pełne naładowanie przeciętnego smartfona to ok. 10 Wh.

Przekładając to na koszt finansowy w warunkach europejskich można przyjąć średnią cenę energii dla sektora usług na poziomie 0,20 €/kWh (dane Eurostat za 2024 r.). W takim ujęciu zapytanie tekstowe kosztuje ok. 0,00007 euro, czyli mniej niż jedną piątą eurocenta. Pojedynczy obraz to niespełna 0,00034 euro, a sześć sekund wideo o najwyższej z badanych energochłonności – ok. 0,022 euro. W skali miliardów żądań miesięcznie stawka rośnie dramatycznie, co tłumaczy, dlaczego operatorzy centrów danych intensywnie poszukują źródeł zielonej energii i rozwiązań do odzyskiwania ciepła dla lokalnych sieci ciepłowniczych, szczególnie w krajach skandynawskich i Holandii, gdzie takie projekty są już wdrażane.

Producenci szukają oszczędności

Producenci sprzętu podkreślają, że kolejne generacje GPU są coraz oszczędniejsze. Nvidia szacuje, że najnowsza architektura Blackwell Ultra potrzebuje jedynie jednej trzydziestej energii do obsługi tych samych zadań inferencyjnych, które rok wcześniej wykonywał układ Hopper.

Starsze układy jednak nie znikną z rynku z dnia na dzień. Zestaw wymienionych kart H100 w Ashburn kosztował ponad dziewięć milionów dolarów, a podobne konfiguracje pracują także w europejskich laboratoriach farmaceutycznych i centrach superkomputerowych, takich jak barceloński MareNostrum 5.

Zużycie wody, koniecznej do chłodzenia rozgrzanych procesorów, oraz wpływ na lokalne sieci elektroenergetyczne to osobne problemy, którymi już zajmują się unijni i krajowi regulatorzy.

Nadchodzące przepisy mogą zobowiązać dostawców usług AI do publikacji rzeczywistych wskaźników efektywności, co ułatwi użytkownikom ocenę śladu węglowego własnych zapytań. Dopóki jednak nie ma powszechnej transparentności, odpowiedzialność za skalę zużycia energii spoczywa zarówno na firmach udostępniających modele, jak i na samych użytkownikach — zredagowanie jednego maila nie stanowi problemu, lecz generowanie dziesiątek filmików ze skaczącymi kotami zaczyna mieć realną wagę energetyczną.

Czytaj też: