1、概述

Open-Falcon 是小米研发的一款开源的互联网企业级监控系统解决方案。

2、Open-falcon-V2.0使用手册

https://www.bookstack.cn/read/open-falcon-v0.2/SUMMARY.md

3、Open-falcon的特性

  1. 强大灵活的数据采集:自动发现,支持falcon-agent、snmp、支持用户主动push、用户自定义插件支持、opentsdb data model like(timestamp、endpoint、metric、key-value tags)
  2. 水平扩展能力:支持每个周期上亿次的数据采集、告警判定、历史数据存储和查询
  3. 高效率的告警策略管理:高效的portal、支持策略模板、模板继承和覆盖、多种告警方式、支持callback调用
  4. 人性化的告警设置:最大告警次数、告警级别、告警恢复通知、告警暂停、不同时段不同阈值、支持维护周期
  5. 高效率的graph组件:单机支撑200万metric的上报、归档、存储(周期为1分钟)
  6. 高效的历史数据query组件:采用rrdtool的数据归档策略,秒级返回上百个metric一年的历史数据
  7. dashboard:多维度的数据展示,用户自定义Screen
  8. 高可用:整个系统无核心单点,易运维,易部署,可水平扩展
  9. 开发语言: 整个系统的后端,全部golang编写,portal和dashboard使用python编写。

4、监控范围

1、基础监控

  • CPU、Load、内存、磁盘、IO、网络相关、内核参数、ss 统计输出、端口采集、核心服务的进程存活信息采集、关键业务进程资源消耗、NTP offset采集、DNS解析采集,这些指标,都是open-falcon的agent组件直接支持的。
  • Linux运维基础采集项:http://book.open-falcon.org/zh/faq/linux-metrics.html
  • 对于这些基础监控选项全部理解透彻的时刻,也就是对Linux运行原理及命令进阶的时刻。
    2、第三方监控
  • 术业有专攻,运行在OS上的应用甚多,Open-Falcon的开发团队不可能把所有的第三方应用的监控全部做完,这个就需要开源社区提供更多的插件,当前对于很多常用的第三方应用都有相关插件了。
    3、JVM监控
  • 对于Java作为主要开发语言的大多数公司,对于JVM的监控不可或缺。
  • 每个JVM应用的参数,比如GC、类加载、JVM内存、进程、线程,都可以上报给Falcon,而这些参数的获得,都可以通过MxBeans实现。
    使用 Java 平台管理 bean:http://www.ibm.com/developerworks/cn/java/j-mxbeans/
    4、业务应用监控
  • 对于业务需要监控的接口,比如响应时间等。可以根据业务的需要,上报相关数据到Falcon,并通过Falcon查看结果。

5、相关资料

官方网址:http://open-falcon.org/
中文文档:https://book.open-falcon.org/zh_0_2/
中英文档:https://book.open-falcon.org
软件下载:https://github.com/open-falcon/falcon-plus/releases