GeForce RTX 5090 trafiła do centrum uwagi nie tylko dzięki swojej mocy, lecz także z powodu poważnej wady. CloudRift ogłosił nagrodę dla osób, które znajdą przyczynę lub sposób rozwiązania problemu.
Poważny problem z kartami GeForce RTX 5090
Najwydajniejsze układy NVIDII miały być przełomem, jednak w praktyce zderzyły się z kłopotliwą usterką. CloudRift, dostawca chmury obliczeniowej GPU, ogłosił, że karty GeForce RTX 5090 oraz RTX PRO 6000 nie działają poprawnie w środowiskach wirtualnych. Problem występuje, gdy karta zostaje przypisana do maszyny wirtualnej, a następnie odłączona lub przypisana ponownie.
Podczas tego procesu serwer wysyła komendę PCIe Function Level Reset (FLR). Powinna ona przywrócić kartę do pełnej gotowości. Niestety, w przypadku wspomnianych modeli karta przechodzi w stan „not ready”. Jedynym sposobem przywrócenia jej do działania pozostaje pełny restart systemu, co w centrach danych oznacza poważne utrudnienia.
Nagroda za rozwiązanie problemu
CloudRift poinformował, że testował już wiele metod obejścia problemu. Żadna nie przyniosła skutku. Dlatego firma postanowiła zachęcić społeczność specjalistów i entuzjastów technologii. Oferuje nagrodę w wysokości 1000 dol. dla osoby, która wskaże przyczynę błędu lub zaproponuje działające rozwiązanie.
Co więcej, na blogu CloudRift opublikowano szczegółowy opis problemu wraz z logami systemowymi. Wynika z nich jasno, że źródłem błędu są same karty graficzne, a nie oprogramowanie serwerowe czy konfiguracja maszyn wirtualnych.
Reakcje społeczności i testy
Według serwisu Tom’s Hardware oraz dyskusji na forach Proxmox i Level1Techs, inni użytkownicy również potwierdzają problem. Zgłaszają, że karty GeForce RTX 5090 zachowują się identycznie jak u CloudRift.
Tymczasem starsze układy, takie jak GeForce RTX 4090 czy profesjonalne modele H100, nie wykazują tej samej wady. To wskazuje, że błąd dotyczy najnowszej generacji Blackwell. W rezultacie nie jest to odosobniona sytuacja, a raczej problem, który może dotknąć wielu klientów inwestujących w te karty.
Co oznacza błąd dla użytkowników?
Dla graczy problem może być niemal niezauważalny. Jednak w środowiskach chmurowych i wirtualizacyjnych sytuacja jest poważna. Brak możliwości przywrócenia karty bez restartu systemu oznacza straty czasu i potencjalne ryzyko przestojów w usługach.
Przede wszystkim problem podważa niezawodność sprzętu, który miał być podstawą dla zaawansowanych obliczeń w centrach danych. Zatem społeczność specjalistów ma realny powód, by zaangażować się w znalezienie rozwiązania.
Podsumowanie
GeForce RTX 5090 to karta, która miała wyznaczać nowe standardy. Tymczasem odkryty przez CloudRift błąd z resetem FLR budzi poważne wątpliwości co do jej zastosowań w profesjonalnym środowisku. Firma liczy na pomoc społeczności i oferuje nagrodę, która ma przyspieszyć rozwiązanie problemu.