以下为记录自己蓝鲸监控中增加对服务器进程和端口的监控过程:
版本:
蓝鲸:5.0.4
蓝鲸监控:1.4.82
工作流程图
采集器术语解释
baserepor 主机基础性能采集器,主要负责主机系统,硬件配置,CPU、内存、磁盘实时状态的采集和上报,应用于CMDB上的实时数据,蓝鲸监控里的主机监控数据
gsecmdline 自定义上报命令行工具,应用于蓝鲸监控的脚本采集,自定义监控,数据平台自定义上报数据
unifytlogc 高性能日志采集器,主要负责主机上特定日志文件的过滤,采集和上报,应用于蓝鲸监控自定义上报
bkmetricbeat 主机组件性能采集器,采集组件的metric信息,支持Redis,Apache,Nginx等组件,也支持对接promethues的exporter,应用于蓝鲸监控里的组件监控
processbeat 主机进程性能采集,采集主机进程监听端口状态和资源性能信息,应用于蓝鲸监控主机监控里面的进程信息
uptimecheckbeat 拨测监控采集器
1、CMDB 注册注册进程,
以下为Linux主机中增加 对nginx 进程监控过程,
名词解释:
进程名称:在蓝鲸监控中进程显示的名称,自己设定。
功能名称:进程二进制名称,机器中查看。此处填写nginx。如果为Windows 需要填写.exe 后缀名称。(功能名称注意填写正确,此处最重要)
启动参数:如果没有相同二进制名称可以不填,进程运行在机器后面的字符串,区分相同二进制名称进程。比如kafka、zookeeper 二进制名称都是Java,可以填写启动参数选项进行区分,可以使用 以下命令过滤
ps aux|grep 进程名
这里可以看出都是 Java 进程,所以启动参数可以写 zookeeper 、kafka 区分。
绑定IP:端口绑定的 IP 需要机器中查看。不监控端口可不填。
端口:进程占用端口,机器中查看。不监控端口可不填。
具体查看进程方法参考下图。
Linux
根据上图,功能名称nginx,绑定IP为0.0.0.0,端口:80 。
Windows 中我增加的SQLserver进程,特别注意,SqlServer进程的二进制名称为 sqlservr.exe
cmd 中执行 wmic ,然后执行 process
2、蓝鲸监控中下发采集数据。
等数分钟,查看数据
3、数据未采集上问题排查:
检查采集器是否已经启动:
linux
ps ‐ef|grep processbeat
如果没有启动执行
/usr/local/gse/plugins/bin start.sh processbeat
windows
tasklist|findstr processbeat
如果没有启动执行
C:\gse\plugins\bin start processbeat
重新下发采集
若是以上配置均正确,批量采集无报错,等待二十分钟后刷新还是没有数据,请检查agent端配置是否下发
cat /usr/local/gse/plugins/etc/processbeat.conf |grep zookeeper
cat /var/lib/gse/host/hostid |grep zookeeper
如果添加端口监控,端口状态为黄色注意修改CMDB中绑定ip地址。
绿色为正常
红色代表端口全部未被监听
4、数据上报入库流程图
采集器术语解释
baserepor
主机基础性能采集器,主要负责主机系统,硬件配置,CPU、内存、磁盘实时状态的采集和上报,应用于CMDB上的实时数据,蓝鲸监控里的主机监控数据gsecmdline
自定义上报命令行工具,应用于蓝鲸监控的脚本采集,自定义监控,数据平台自定义上报数据unifytlogc
高性能日志采集器,主要负责主机上特定日志文件的过滤,采集和上报,应用于蓝鲸监控自定义上报bkmetricbeat
主机组件性能采集器,采集组件的metric信息,支持Redis,Apache,Nginx等组件,也支持对接promethues的exporter,应用于蓝鲸监控里的组件监控processbeat
主机进程性能采集,采集主机进程监听端口状态和资源性能信息,应用于蓝鲸监控主机监控里面的进程信息uptimecheckbeat
拨测监控采集器
排查数据未上报问题,首先检查相应采集器状态。
参考:
https://bk.tencent.com/s-mart/community/question/571
https://docs.bk.tencent.com/bk_monitor/Process_and_Port_Monitor_Now.html
https://bk.tencent.com/s-mart/community/question/416
Comments (0)