Оценка надежности компонентов сервера на основе статистики гарантийных обращений

Оценка надежности компонентов важна для понимания нескольких аспектов, важных для:

- выбора типа и марки комплектующих сервера;

- эксплуатации готового сервера;

- оценки рисков выхода из строя сервера;

- формирования, в случае необходимости, ЗИП — набора деталей и компонентов для оперативного восстановления работоспособности.

   Приведенные ниже цифры основаны на реальной статистике обращений по гарантийному обслуживанию покупателей. Компания продает готовые серверы на базе продукции Supermicro и серверные комплектующие. Персональные компьютеры и соответствующий вид комплектующих не продаются и в статистике не участвуют.

   Выборка презентативна, поскольку в статистическом исследовании рассматриваются данные за 3 года. Компания, предоставившая данные, достаточно крупная и присутствует на рынке серверных решений порядка 20 лет. Соотношение числа комплектующих в составе готового сервера и проданных отдельно, как товар, примерно сохраняется.

ГруппаТип компонентовДоля по отношению к общему числу  обращений
Накопители HDDСерверные серии накопителей HGST, Seagate. 2,5-дюймовые SAS на 10 000 об/мин, 3,5-дюймовые NL накопители на 7 200 об/мин с интерфейсом SAS и SATA28,5%
Материнские платыМатеринские платы компании Supermicro 1-, 2-процессорные, в т. ч. в составе платформ и серверов26,5%
Блоки питания, платы распределения питанияБлоки питания компании  Supermicro, в т. ч. в составе корпусов, платформ и серверов22%
Модули памятиСерверные модули DIMM компании Kingston буферизованные, с контролем четности16%
КонтроллерыКонтроллеры RAID компаний Avago (LSI), Microsemi (Adaptec), контроллеры интерфейсов Qlogic, Mellanox4,5%
ПроцессорыПроцессоры Intel Xeon серий E3-, E5-2%
Вентилятор охлажденияВнутренние вентиляторы охлаждения компании Supermicro, в т.ч. в составе корпуса, платформы, сервера0,15%
ПрочееВсе остальные обращения, в основном - кабели, держатели, переходники,...0,35%

Выводы из полученных данных:

   - Самая проблемная составляющая сервера — накопители HDD. HDD имеет движущиеся детали, подверженные износу. Современный HDD – весьма сложное изделие, диски в котором вращаются с огромной скоростью. Плотность записи растет от года к году, от модели к модели. Повышенная вибрация, некомфортная температура эксплуатации могут привести к потере информации или выходу HDD из строя.

   - Материнские платы довольно часто оказываются в сервис-центре. Частично это связано с некорректной эксплуатацией — клиент неудачно обновил BIOS, после неожиданного пропадания питания сервера сбились настройки, поврежден или выведен из строя некорректным подключением устройства внутренний или внешний интегрированный интерфейс и т. д. Большой относительный процент обращений с материнскими платами обусловлен также тем — что это самый сложный компонент сервера, объединяющий все остальные. Относительно большая доля обращений с материнскими платами формируется покупателями, которые самостоятельно собирают сервер, купив в компании только материнскую плату.

   - Предсказуемо в список проблемных элементов попали блоки питания, несмотря на то, что Supermicro самостоятельно проектирует и производит очень надежные блоки питания с очень высокой эффективностью.

   Во-первых, импульсный блок питания выводится из строя некачественной электрической сетью. «Дребезг», присутствие в питающей сети наводки от мощных потребителей (насосы включились, или сварочный аппарат запитали), кратковременные пропадания и скачки напряжения питающей сети могут погубить блок питания. Часть цепей блока питания работает с высокими напряжениями в сочетании с высокими токами.

   Во-вторых, вентилятор охлаждения блока питания работает непрерывно, соответственно — вся пыль и грязь из воздуха, в котором эксплуатируется сервер, оседает на внутренних деталях блока питания и ухудшает теплообмен. При профилактической очистке внутренностей сервера, даже если она производится (мало кто этим занимается, на самом деле), относительно легко очищаются лопасти вентиляторов внутреннего охлаждения, но внутрь блока питания без вскрытия гарантийных пломб добраться никак нельзя — а это два самых грязных элемента сервера!

   - Практически в два раза меньше относительно группы компонентов повышенного внимания обращений с модулями оперативной памяти. В основном, они возникают в первые месяцы эксплуатации. Как правило, проработавшие некоторое время в сервере модули DIMM, годами не вызывают нареканий.

   - Большая доля из общего ряда обращений с контроллерами обусловлена двумя причинами: неудачное обновление фирменного программного обеспечения (Firmware) и некорректным подключением кабелей интерфейса. В целом, контроллеры показывают себя как один из самых надежных компонентов системы.

   - Менее всего вопросов возникает к центральным процессорам (CPU). При этом, часть из этих немногих обращений некорректна — покупатель неправильно ставит процессор в гнездо (сокет), сминая его ножки и даже замыкая контакты.

   - Неожиданно, но — факт! Вентиляторы внутреннего охлаждения Supermicro практически не ломаются. Единичные обращения в гарантию за период в 3 года. Несмотря на то, что относятся к элементам с движущимися деталями и из-за этого традиционно включаются в список возможных проблемных деталей