1 通过elk查看用户的行为。
发现用户在October 14th 2017, 07:47:47.000,有一个503错误。503错误,一般为服务器负责过高,程序执行时间过长,或者慢sql。
2 查找对应服务器10.3.12.27:80的error-web.log日志
对应时间点发现一条超出内存的报错
3 查找服务器的慢sql发现
通过Anemometer查询对应时段的慢sql。
select id from weixusers where phone='' and weixintype='patient'。这条慢sql执行了17s,扫描了380万行数据。
<img data-cke-saved-src="https://img-blog.csdn.net/20171020191559404" src="https://img-blog.csdn.net/20171020191559404" alt="" />
<img data-cke-saved-src="https://img-blog.csdn.net/20171020191610426" src="https://img-blog.csdn.net/20171020191610426" alt="" />