Google gebruikt dagelijks miljoenen SSD's in zijn datacentra. Een nieuw document is verschenen over de betrouwbaarheid van SSD's. Verrassend genoeg falen SSD's op een andere wijze dan harde schijven.

SSD's zijn relatief nieuw binnen datacentra. Er is weinig informatie bekend over de betrouwbaarheid van SSD's. FAST 2016 heeft een rapport over de betrouwbaarheid van flashgeheugen tijdens gebruik: "The Expected and the Unexpected", geschreven door professor Bianca Schroeder van de universiteit van Toronto en Raghav Lagisetty en Arif Merchant van Google. Daarin worden onder meer de volgende onderdelen benoemd:

  • Miljoenen 'dagen' gebruik over de duur van zes jaar
  • Tien verschillende drive modellen
  • Drie verschillende types flash: MLC, eMLC en SLC
  • Enterprise en consumenten drives

Volgens het rapport zijn de belangrijkste conclusies:

  • Negeer Uncorrectable Bit Error Rate (UBER) specs. Een zinloos gegeven. Wordt onderaan uitgelegd.
  • Goed nieuws: Raw Bit Error (RBER) versnelt langzamer dan verwacht door slijtage en is niet samenhangend met UBER of andere fouten.
  • High-end SLC drives zijn net zo betrouwbaar als MLC drives.
  • Slecht nieuws: SSD's falen langzamer dan harde schijven, maar UBER ligt hoger.
  • De leeftijd van een SSD en niet het gebruik beïnvloedt de betrouwbaarheid.
  • Bad blocks in SSD's komen vaak voor en drives met een hoog aantal bad blocks zullen waarschijnlijk honderden andere blocks verliezen, zeer waarschijnlijk door slechte of falende chips.
  • 30 tot 80 procent van SSD's ontwikkelen minimaal één bad block en 2 tot 7 procent ontwikkelen tenminste één kapotte chip tijdens het gebruik de eerste vier jaar.

Twee conclusies steken boven de rest uit. Ten eerste, MLC drives zijn net zo betrouwbaar als duurdere SLC drives. Hetzelfde zagen we bij harde schijven, waar SATA-schijven net zo betrouwbaar bleken te zijn als de duurdere SAS en Fibre Channel drives. De tweede conclusie is dat leeftijd, en niet het gebruik, samenhangt met toenemende error rates. Geen enkele drive kwam in de buurt van de opgegeven write limits.

Het slechte nieuws volgens het rapport is dat SSD UBER rates hoger liggen dan disk rates. Dat betekent dat het back-uppen van SSD's belangrijker is dan het back-uppen van harde schijven. Het is minder waarschijnlijk dat de SSD faalt tijdens het gebruik, maar het is wel meer waarschijnlijk dat het data verliest.