企业监控调研指引:17个精心准备的开源运维监控系统

企业监控调研指引:17个精心准备的开源运维监控系统
最新回答
巷陌

2021-10-29 08:26:07

以下为17个精心准备的开源运维监控系统介绍:

1. Zabbix

  • 核心功能:企业级网络监控工具,支持从服务器、虚拟机、网络设备收集数据,提供实时监控、自动发现、映射和可扩展功能。
  • 特色模块:内置Java应用服务器监控、硬件监控、VMware监控,以及CPU、内存、网络、磁盘空间性能监控。
  • 性能指标:每分钟可执行3,000,000次检查,具备高安全性与数据中心监控能力。
2. Nagios

  • 核心功能:监控IT基础架构状态、历史日志和基础报告,支持系统指标、网络协议、应用程序、服务器等监控。
  • 工具类型:提供Nagios XL(企业级网络监控)、Nagios日志服务器、Nagios网络分析器三种工具。
  • 企业版功能:基于Web的服务器控制台访问、业务流程监控、记录审核和自动化删除。
3. Cacti
  • 核心功能:基于Web的网络监控与图形化工具,实时显示CPU负载、带宽利用率等数据。
  • 技术架构:作为RRDtool前端,默认使用SNMP协议,支持自定义Perl/PHP脚本采集数据。
  • 版本特性:最新版0.8.8h支持无限图形项目、图形自动填充、自定义数据采集脚本等功能。
4. GroundWork Monitor Core
  • 核心功能:监控网络、应用和云计算使用情况,开源版支持最多50个设备监控。
  • 网络管理:提供设备自发现、拓扑管理、报警控制、API/SNMP/IPMI数据收集。
  • 存储管理:支持NetApp、EMC等企业级存储设备,提供数据收集与中断可视化。
5. Hyperic
  • 核心功能:监控物理/虚拟/云环境下的Web应用性能,覆盖应用服务器、数据库、操作系统等。
  • 特色模块:提供基础设施监控、详细报告、警报修复工作流程、通用可扩展API。
  • 企业版增强:提升网络警报功能与基准创建能力。
6. Observium
  • 核心功能:自动监测网络工具,支持社区版和专业版。
  • 技术架构:基于RRDTool实现数据存储与图形化,提供自动发现协议网络映射。
  • 专业版功能:实时软件更新、基于规则的自动分组、流量统计系统。
7. NetXMS
  • 核心功能:企业级开源网络管理与监控程序,支持Windows/Linux双平台。
  • 特色模块:提供分布式网络监控、自动化网络发现、详细报告功能。
  • 性能优势:服务器与代理组件轻量化,安装部署简单。
8. Pandora FMS
  • 核心功能:企业级监控系统,提供快速洞察工具与网络统计信息展示。
  • 响应速度:代理模式下监控系统响应时间约10秒。
  • 诊断能力:无需外部访问即可执行网络诊断。
9. NetDisco
  • 核心功能:基于Unix的自动发现网络设备工具,生成网络拓扑图。
  • 设备管理:支持通过MAC/IP定位设备、关闭交换机端口、修改VLAN/PoE状态。
  • 适用场景:专为中大型网络设计,提供设备清点与拓扑可视化。
10. OpenNMS
  • 核心功能:1999年发布的企业级事件管理、服务监控与性能测量工具。
  • 特色模块:支持外部脚本、Java通知策略API、RT集成、IPv4/IPv6网络可达性测试。
  • 企业服务:提供预置事件通知、数据收集、工作流与附加报告功能。
11. RANCID
  • 核心功能:监控路由器/交换机配置变更,维护历史记录。
  • 设备支持:覆盖Juniper、HP、Redback等厂商设备,支持Observium扩展。
  • 管理功能:自动登录设备、运行命令、发送变更邮件、提交版本控制。
12. Xymon
  • 核心功能:监控服务器、应用与网络状态,通过网页展示运行状况。
  • 技术传承:基于Big Brother改进,解决性能问题并简化部署流程。
13. Big Brother BTF
  • 核心功能:90年代中期发布的网络系统监控工具,后被Quest/戴尔收购。
  • 社区支持:拥有大型论坛与开发者社区,适合初学者使用。
  • 版本类型:提供开源版与商业专业版。
14. Big Sister
  • 核心功能:改进Big Brother性能的网络监控工具,减少故障警报数量。
  • 特色模块:提供节点管理、doxygen过滤器、Web应用框架。
  • 系统支持:覆盖Unix衍生系统与Windows操作系统。
15. Open Falcon

  • 核心功能:小米开源的互联网企业级监控系统。
  • 技术特点

    支持自动发现、SNMP、用户自定义插件等数据采集方式。

    单周期支持上亿次数据采集与告警判定。

    提供策略模板继承、多种告警方式与callback调用。

    图形组件单机支撑200万metric上报,历史数据查询秒级响应。

  • 高可用性:无核心单点,支持水平扩展,后端采用Golang开发。
16. Icinga
  • 核心功能:Nagios分支项目,提供分布式监控与多线程框架。
  • 版本演进:从Icinga 1迁移至Icinga 2可获得性能提升。
  • 特色模块

    多款Web UI简化配置管理。

    集成PNP4Nagios等绘图套件,可视化效果可靠。

    支持SNMP与定制插件扩展设备监控。

17. Ntop

  • 核心功能:网络流量监控工具,提供简洁Web界面。
  • 技术特点

    单进程监控特定网络接口,支持协议、源/目的地址分析。

    提供网络利用率图表、实时地图与趋势分析。

    嵌入硬件监控器Nbox,支持Lua API扩展。

  • 应用场景:快速定位高流量消耗主机,支持交换机端口级监控。