HPE ostrzega: SSD mogą utracić dane w chwili osiągnięcia 32 768 godz. czasu pracy
HPE poinformował o wydaniu łatek do nośników SSD, w których wykryto błąd polegający na możliwości utraty danych w momencie osiągnięcia 32 768 godz. czasu pracy. Sprawa dotyczy wyłącznie dysków z interfejsem Serial Attached SCSI (SAS), stosowanych w serwerach, ale jest niewątpliwie intrygująca z czysto teoretycznej perspektywy.
32 768 godz. przekłada się na 3 lata 270 dni i 8 godz. Skąd akurat taka wartość? Producent szczegółów usterki nie ujawnia. Natomiast warto zwrócić uwagę, że liczba 32 768 jest najmniejszą liczbą całkowitą, do której zapisu w systemie dwójkowym wymaganych jest 16 bitów. Możliwe, że wystarczył szkolny błąd w definiowaniu typów danych. W reprezentacji signed (ze znakiem) zapisanie jedynki na najstarszym bicie, jak wiadomo, czyni liczbę ujemną.
Otrzymując niezrozumiałe dane diagnostyczne, kontroler nie może kontynuować pracy—a jest przecież kluczowym elementem SSD. Odpowiada m.in. za adresację komórek pamięci, operacje na plikach i równomierne zużycie poszczególnych komórek (rozkładanie operacji zapisu po całej powierzchni). Awaria kontrolera to de facto awaria całego dysku i utrata danych.
Bądź co bądź, to tylko domysły autora. A fakt jest taki, że nie chcąc zbędnych problemów, 20 modeli serwerowych dysków HPE trzeba połatać. Łatki do ośmiu z nich wydano już teraz, co widać w powyższej tabeli, a kolejnych 12 ma zostać zaktualizowanych 9 grudnia. Producent zaznacza, że urządzenia odłożone na później są na tyle nowe, aby nie osiągnąć krytycznego czasu eksploatacji przed planowanym terminem aktualizacji.
Kompletną listę platform serwerowych wykorzystujących wadliwe nośniki, a co za tym idzie wymagających uaktualnienia znajdziecie pod tym adresem.