O especialista em armazenamento em nuvem e análise de armazenamento Backblaze acaba de lançar um relatório suculento cobrindo a confiabilidade de centenas de milhares de discos rígidos implantados nos servidores da empresa — Backblaze gerenciou 236.893 HDDs no 1T23. O relatório cobre a confiabilidade e as falhas experimentadas nos vários modelos.
Levando em consideração as horas de inicialização para qualquer HDD com falha, excluindo unidades de inicialização com falha, unidades que não tinham dados de atributos brutos SMART ou unidades com dados fora dos limites, o Backblaze viu 17.155 HDDs inativos desde o início de suas operações. Em média, os discos rígidos com falha tiveram um tempo de execução operacional médio de apenas dois anos e seis meses. Se você estiver na Europa, a durabilidade é menor do que a garantia mínima exigida por lei, que é de três anos.
O Backblaze agrupou os HDDs mortos em 30 modelos, excluindo aqueles com menos de 50 falhas para não distorcer os resultados com outliers. Aqui estão os modelos (variando de 4 TB a 12 TB) em uma tabela organizada:
O Backblaze observou algumas tendências em sua avaliação, e a própria tabela nos fornece alguns pontos de dados interessantes. Por um lado, vemos que a Seagate é o rei das falhas de unidade. Seu Seagate ST12000NM0007 de 12 TB registrou 2.023 falhas, terminando com a maior Taxa Média de Falha (AFR) de 7,46% e uma vida útil média de apenas um ano e seis meses. O segundo pior modelo de unidade nas estatísticas de Backblaze foi outra unidade Seagate, a unidade ST1400NM0138 de 14 TB teve uma AFR de 6,23%.
Os resultados do Backblaze podem ser interpretados como significando que os HDDs maiores tendem a falhar com menos frequência do que os HDDs menores, mas há várias ressalvas aqui. Por um lado, a Backblaze aponta que todos os seus HDDs de “pequena capacidade” que estavam destinados a falhar já falharam: a empresa não utiliza mais HDDs de 1, 1,5, 2, 3 ou mesmo 5 TB – todas as falhas nesses modelos já são ” contado em” nas taxas de falha do Backblaze. Esse não é o caso de unidades de maior capacidade, que também têm maior probabilidade de ter um tempo de execução menor, como geralmente é o caso das opções de armazenamento do Backblaze.
A Backblaze analisou ainda mais seu pool de HDD observando as taxas médias de falha entre os fabricantes, com a Seagate reivindicando uma taxa média de falha líder de 2,28%, enquanto a WDC reivindicou a menor média de falhas com seu resultado de 0,31%. Ao olhar para esses números, é importante lembrar que mesmo a taxa de falha da Seagate significa que apenas 2,3 de cada cem HDDs enviados param de girar seus pratos antes do esperado.
Ao todo, o Backblaze terminou com uma taxa média de falhas no primeiro trimestre de 2023 de 1,54%, um aumento de 1,21% no quarto trimestre de 2022 e também em relação ao ano anterior, onde o primeiro trimestre de 2022 registrou um AFR de 1,22%. Isso pode significar que alguns modelos têm uma durabilidade menor do que o esperado e começaram a falhar. Também pode ser um problema com um lote de unidades ou com as condições de manuseio, instalação e operação. Simplificando, não há como dizer que “os HDDs estão piorando” a partir desses dados, pois há muitas incógnitas.
O relatório Annualized Failure Rates da Backblaze parece relativamente alinhado com análises semelhantes de falhas de HDD conduzidas pela Secure Data Recovery, uma empresa de recuperação de dados de HDD, SSD e RAID. Ele analisou 2.007 HDDs e descobriu que sua vida média antes das falhas era de cerca de 2 anos e 10 meses. Isso é apenas quatro meses de diferença do resultado de 2 anos e seis meses do Backblaze.
Esperamos que ambos os provedores continuem analisando as taxas de falha e fornecendo esses dados publicamente. E se você tiver dados importantes que não aguenta perder, certifique-se de ter uma boa estratégia de backup — até mesmo algo tão simples quanto um dispositivo de armazenamento externo é melhor do que nada.