Firma stojąca za asystentem Claude ogłosiła stworzenie modelu, który samodzielnie wykrywa luki w oprogramowaniu – w tym takie, których przez dekady nie znalazł żaden człowiek ani żadne zautomatyzowane narzędzie. I nie zamierza go publicznie udostępniać.
- Claude Mythos Preview to nowy model AI Anthropic zdolny do autonomicznego wykrywania luk zero-day – firma nie planuje jego publicznego udostępnienia
- Project Glasswing to konsorcjum 40+ firm (m.in. Apple, Google, Microsoft, Linux Foundation) korzystających z modelu w celach obronnych, z budżetem do 100 mln USD od Anthropic
- Model znalazł tysiące błędów, w tym 27-letnią lukę w OpenBSD i błędy, których nie wykryły żadne zautomatyzowane narzędzia po milionach skanów
- Implikacje dla NIS2: zdolności autonomicznych modeli AI do eksploatowania infrastruktury krytycznej wymuszają rewizję obecnych standardów compliance i zarządzania ryzykiem
Wyobraź sobie armię agentów AI, która metodycznie kataloguje każdą słabość w twojej infrastrukturze technologicznej – bez przerwy, bez zmęczenia, bez błędów wynikających z ludzkiej nieuwagi. To opis tego, co już potrafi Claude Mythos Preview – najnowszy model Anthropic, który firma zdecydowała się na razie schować za siedmioma zamkami.
Capybara, która potrafi hakować
Wewnętrznie projekt nosił kryptonim „Capybara”. Kiedy w ubiegłym miesiącu część szczegółów wyciekła do sieci, Anthropic przyznało, że chodzi o „skokową zmianę” w możliwościach AI – szczególnie w obszarach programowania i badań nad cyberbezpieczeństwem. Teraz firma oficjalnie potwierdza, co ten model potrafi i jednocześnie oznajmia, że publicznie go nie udostępni.
Claude Mythos Preview trafi wyłącznie do konsorcjum ponad 40 firm technologicznych skupionych w ramach inicjatywy Project Glasswing – nazwa nawiązuje do motyla ze szklistymi skrzydłami, który się ukrywa. Podobnie jak ten owad, wiele krytycznych luk w oprogramowaniu istnieje od lat w otwartym kodzie, tyle że zakopanych w tak złożonych systemach, że nikt ich nie odnalazł. Do konsorcjum należą m.in. Apple, Amazon, Microsoft, Google, Cisco i Linux Foundation. Anthropic przeznacza na ten projekt kredyty o wartości do 100 milionów dolarów.
Trzydzieści lat i nikt nie zauważył
Skala możliwości modelu robi wrażenie. Jak podaje Anthropic, Claude Mythos Preview zidentyfikował już tysiące błędów i luk w popularnym oprogramowaniu – w tym we wszystkich głównych systemach operacyjnych i przeglądarkach internetowych.
Jeden z przykładów szczególnie rzuca się w oczy: model wykrył 27-letnią lukę w OpenBSD – systemie operacyjnym celowo zaprojektowanym pod kątem odporności na ataki, szeroko stosowanym w routerach i zabezpieczonych zaporach sieciowych.
Inny przypadek to błąd w popularnym oprogramowaniu wideo, który zautomatyzowane narzędzia przeskanowały pięć milionów razy, nie znajdując żadnego problemu.
Logan Graham, szef zespołu Anthropic testującego modele pod kątem niebezpiecznych możliwości, mówi, że model jest dobry w znajdowaniu luk zrozumiałych dla doświadczonych badaczy bezpieczeństwa, ale znalazł też takie, które umknęły dosłownie dekadami pracy ludzi i wszystkich narzędzi stworzonych w tym celu.
Czytaj też: Polski Sąd Arbitrażowy oparty na AI uzupełnieniem dla zdalnych usług dla biznesu
Broń obosieczna
Problem polega na tym, że narzędzie zdolne do ochrony infrastruktury może z równą skutecznością służyć jej atakującym. Co gorsza, jak podkreśla Jared Kaplan, dyrektor naukowy Anthropic, zdolności cyberbezpieczeństwa Claude Mythos Preview nie są wynikiem specjalnego treningu – to po prostu jeden z wielu obszarów, w których ten model jest lepszy od poprzednich. A to oznacza, że podobne możliwości wkrótce pojawią się w innych modelach – u konkurencji, w open source, wszędzie.
Elia Zaitsev, dyrektor techniczny CrowdStrike, jednej z firm mających dostęp do modelu przez Project Glasswing, zwraca uwagę na nieuchronność sytuacji. — Jeśli model jest dostępny dla obrońców, prędzej czy później te same możliwości trafią w ręce atakujących. To, co kiedyś zajmowało miesiące, teraz dzieje się w minuty.
NIS2: czas nagli
W tym kontekście europejskie regulacje cyberbezpieczeństwa, w tym dyrektywa NIS2, zyskują nowe znaczenie. Firmy objęte jej zakresem – a więc operatorzy infrastruktury krytycznej, dostawcy usług cyfrowych czy podmioty z sektora zdrowia i finansów – zostały zobowiązane do wdrożenia odpowiednich środków zarządzania ryzykiem i zgłaszania incydentów.
NIS2 – Czy firmy w Polsce są gotowe na dyrektywę?
Pojawienie się modeli AI zdolnych do autonomicznego wykrywania i eksploatowania zero-day vulnerabilities radykalnie zmienia krajobraz zagrożeń, który stanowił podstawę tych regulacji. Compliance z wczoraj może okazać się niewystarczający już dziś.
Graham zadaje pytanie, które brzmi jak wyrok dla starego paradygmatu bezpieczeństwa: jeśli krytyczne systemy były dotąd „w miarę bezpieczne” głównie dlatego, że ich atak wymagał dużego ludzkiego wysiłku, czy ten model bezpieczeństwa w ogóle ma jeszcze rację bytu?
„To najsłabszy model, jaki będziemy mieli w przyszłości” – przyznaje Kaplan. I w tym zdaniu kryje się więcej niepokoju niż w jakimkolwiek raporcie o zagrożeniach.
Sprawdź też: Muse Spark. Meta zbudowała model AI, który patrzy na świat razem z tobą
