重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
背景:mariadb,mycat中间件。
问题:DB连接数过多;开发使用程序使用连接池连mycat;
DB待优化项: interactive_timeout,wait_timeout 都是8小时默认值。
mycat配置:100个分片库,和其他业务库。现在分片库用到16分片,后面尚未使用。
当前DB大连接数:3000
mycat 版本:当前线上的mycat版本是1.5.8版本,推荐以后线上使用最稳定的 mycat1.6.5版本。
经DB和开发碰面了解 这两个timeout时间不能缩短,所以常规的优化手段不能使用:
正常DB连接数1000,数据库两个timeout为300--500,参数可以全局动态生效。
公司线上DB前段时间建总出现连接数过多问题,正常来说连接数1000,已经能够满足大部分需求。
正常手段无法使用的时候,那么就要找到DB为啥连接数过多。
1. 审计日志
DB上部署过审计日志,审计日志部署请移步:审计日志部署,审计日志中可以查看到做坏事的坏小子是谁!
因为时间关系,未保存。但是从审计日志中发现大量访问连接sql就是'select 1' ,也是mycat连接mysql的连接。
且该链接连的是大量尚未使用的物理库。
至此审计日志只能判断到这里。
2. DB层面
mariadb物理库 information_schema 中processlist表记录连接相关信息,比如 DB,HOST,INFO,STATUS等。而且能统计具体某个库的连接数。
查询后,发现很多没有使用的DB中连接很多没有释放,大概占总连接数的60%左右,使用脚本 "kill id; "后连接仍旧重新连接。
这种情况很尴尬,找不到原因。
3. 审计日志
再结合审计日志,查看连接从哪来的,还是mycat 发过来的
其中有一条是关于未用的DB连接算法:如果当前DB一直有访问,那么链接该DB 的heartbeat暂不执行,未用的DB链接300秒重新连接该DB。
这算法是个人的理解,因能力有限,代码阅读能力低,只能理解个大概;现也能判断个大概方向。
4.更改mycat配置
需要减少未使用的datanode,减少后发现,连接数并未减少。
kill id; 后还是连接数会重新增长。判断单单更改datanode不是解决问题的办法。
删除尚未使用的
至此问题解决,实验文字叙述较多,描述较少,仅供读者参考。
另外有需要云服务器可以了解下创新互联cdcxhl.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。