Распределенные и параллельные вычисления/Системы мониторинга

Материал из Викиучебника — открытых книг для открытого мира

На сегодняшний день (2011) не существует универсального программного комплекса для мониторинга распределенных вычислительных систем. В связи с этим в кластерах используются или несколько программных продуктов одновременно, или программы мониторинга создаются с нуля.

Среди готовых решений можно выделить такие программы:

  • Ganglia — гибкая легко масштабируемая система
  • Nagios — стала популярной благодаря встроенной системы оповещения
  • w:en:GStat (англ.) — используется для GRID систем

также используются следующие утилиты и библиотеки:

  • lmsensors
  • hhdtemp
  • hdparm