重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
问题1:1部windows服务器,安装了Zabbix Agent, 然后不断重复报警
High ICMP ping loss
Zabbix agent on xxx is unreachable for 5 minutes
从策划到设计制作,每一步都追求做到细腻,制作可持续发展的企业网站。为客户提供网站制作、网站设计、网站策划、网页设计、国际域名空间、虚拟空间、网络营销、VI设计、 网站改版、漏洞修补等服务。为客户提供更好的一站式互联网解决方案,以客户的口碑塑造优易品牌,携手广大客户,共同发展进步。
解决方法:修改为主动侦测
打开:C:\Program Files\Zabbix Agent\zabbix_agentd.conf
激活ServerActive, 把Zabbix监控服务器填写好,让被监控主机主动提交信息。
关于这个主动监控,端口应该为10051才对,ServerActive=zabbix_server_ip:10051
可通过这个命令检查log:sudo tail -f /var/log/zabbix-agent/zabbix_agentd.log
如果存在连通性问题,log会提示错误信息如下:
123705:20191106:074310.500 agent #0 started [main process]
123706:20191106:074310.500 agent #1 started [collector]
123710:20191106:074310.502 agent #5 started [active checks #1]
123707:20191106:074310.502 agent #2 started [listener #1]
123709:20191106:074310.502 agent #4 started [listener #3]
123708:20191106:074310.503 agent #3 started [listener #2]
123710:20191106:074313.502 active check configuration update from [54.222.165.90:10050] started to fail (cannot connect to [[54.222.165.90]:10050]: [4] Interrupted system call)
这里的10050端口错误,需要修改为10051,同时zabbix server那边的网络需要打开允许client agent IP 访问10051端口
设置成功后,正常的log内容如下:
140859:20191106:082004.516 using configuration file: /etc/zabbix/zabbix_agentd.conf
140859:20191106:082004.516 agent #0 started [main process]
140860:20191106:082004.516 agent #1 started [collector]
140863:20191106:082004.517 agent #4 started [listener #3]
140861:20191106:082004.518 agent #2 started [listener #1]
140862:20191106:082004.518 agent #3 started [listener #2]
140864:20191106:082004.518 agent #5 started [active checks #1]
还有一种方法将trigger由5分钟修改为长一点的时间,例如10分钟
问题2:在Zabbix服务器页面端提示 get value from agent failed: cannot connect to IP:10050, interrupted system call
解决方法1:客户端开启10050端口访问(防火墙端)
如何从服务器端检测联通性,如下在Zabbix服务器端操作:
sudo apt install zabbix-get
然后输入命令:zabbix_get -s client_ip -p 10050 -k "system.uptime"
通的话会返回一串数字
解决方法2:客户端发起主动传输给服务端
vim /etc/zabbix/zabbix_agentd.conf
Windows:C:\Program Files\Zabbix Agent\zabbix_agentd.conf
下面这一行填写服务器IP
ServerActive=zabbix_server_ip:10050
然后重启agent:sudo service zabbix-agent restart
问题 3:Too many processes on host
Zabbix的Linux Template默认300进程,超过就会报警
解决方法:禁用或者调高这个默认的300阀值
问题4:防火墙已开启但是仍然无法连接Zabbix Agent
从Zabbix服务器端:zabbix_get -s IP -p 10050 -k "system.uptime"
提示如下错误:
zabbix_get [21359]: Check access restrictions in Zabbix agent configuration
然后Zabbix Server网页端,添加host后,显示红色,鼠标点上提示信息:Received empty response from Zabbix Agent at [IP]. Assuming that agent dropped connection because of access permissions.
而在Agent端检查log:没有任何错误提示
尝试检查防火墙和zabbix_agent.conf文件配置,IP什么的都没有问题
后来尝试卸载zabbix agent然后重新安装:
sudo apt-get remove zabbix-agent
sudo apt-get remove --auto-remove zabbix-agent
sudo apt-get purge zabbix-agent
安装
sudo apt-get install zabbix-agent
这个过程实际上把新版的zabbix agent装上了,原来我装的是旧版
然后才重新配置好conf文件并重启zabbix agent服务,然后打开log文件,新版log文件位置也改了/var/log/zabbix/, 旧版为/var/log/zabbix_agent/,终于发现错误
这才明白这个防火墙与服务器之间是通过端口转发实现的,需要将zabbix_agent.conf的server IP修改为这个192.168.150.6才可以,原来一直设的是公网IP。