最新消息:www.yxkong.com也可以访问

问题解决

意外惊喜

意外惊喜

yxkong 3周前 (12-30) 58浏览

今天在拿U盘拷贝一个东西,发现了16年的一个工作笔记。我记得我是11月17日入职,入职以后就开始处理各种问题。简单的扫描了一眼,发现了一些问题,当时作为核心开发,视界还是不够宽。 1,一直在处理问题,遇到一个处理一个,并没有沉淀成知识推广出去; 2,...

最近遇到的问题与优化

最近遇到的问题与优化

yxkong 3周前 (12-26) 65浏览

推文502 背景 前几周,运营做营销活动推文,推文后,我们我们没有收到任何的系统报警。业务反馈,用户进不去页面,有的还报502。what? 抓紧时间排查。 cpu 正常 网络链接正常(单机ng的有效链接1000,单机流量200mb) 链路请求正常(1...

redis的key过期了还能取出来?

redis的key过期了还能取出来?

yxkong 2个月前 (12-01) 413浏览

我记得在2016年,2017年的时候,我们使用2.8的集群。当时业务有个需求,要求某个接口一天调用不能超过1000次,当时开发使用一个key: biz:total 来限制。 当时出现的问题是,第二天,接口实际调用量为0,但是从redis里获取到的值还...

消息积压了怎么办?

消息积压了怎么办?

yxkong 4个月前 (09-15) 239浏览

引入消息中间件以后,系统交互的复杂性提升,一旦出了问题以后,要想各种各样的解决方案。 如果用消息中间件是为了削峰填谷,那在高峰期积压了慢慢处理即可。 如果用消息中间件只是为了解耦、异步处理,业务对时效性有一定的要求,那么就要求必须尽快处理。 消息积压...

一次系统宕机认识系统日志

一次系统宕机认识系统日志

yxkong 7个月前 (06-08) 279浏览 0评论

今天开发小伙伴给我说,哥,你帮我看下吧,系统无缘无故的宕机了。之前跑了一个多月好好的。 我问了下这台机器的配置是啥? 虚拟机:1核2G jvm配置:xms:1gxmx:1g 我就开始着手查看 监控指标怎么样?    监控系统这两天...

记一次数据库

记一次数据库”脑裂”问题的复盘

yxkong 8个月前 (05-07) 200浏览 0评论

问题回顾 4月2日 开发发现专有云的用户rds实例链接数报警,并于中午发起了数据库配置变更申请; 4月8日14:00 某云在场运维巡检,发现该实例有中断的任务,尝试补偿执行失败; 4月8日14:23 某云在场运维直接手动操作跳过一些步骤,将中断任务继...

记一次外部agent侵入导致的OOM排查过程

记一次外部agent侵入导致的OOM排查过程

yxkong 9个月前 (04-26) 199浏览 0评论

业务系统从公有云在迁移到专有云后,有几台服务器一直有问题,直接导致迁移进度无进展。通过 jstat -gcutil pid 5000 查看,发现应用程序的老年代已满,fullgc一直在增长,反而ygc很小。 猜测: 对象生成没有经过年轻代,直接进了老...

我遇到的生产事故

我遇到的生产事故

yxkong 9个月前 (04-07) 209浏览 0评论

事故一,jvm相关 大对象(运营商数据;数据库查询未加查询条件,结果集过大;第三方接口或异步消息);来回转化 死循环; 推文并发量大 String.intern() 导致oom static字符串拼接 导致oom 堆内存过小 ConcGCThread...

记一次生产慢sql查询的解决

记一次生产慢sql查询的解决

yxkong 10个月前 (04-03) 218浏览 0评论

今天测试在验证的时候,测试反馈工单后台查看数据特别慢,慢到数据无法展示。那就看下呗。看了下有慢sql。 本着对生产敬畏的心态,转移到测试环境进行验证。测试数据不够,自己造呗。工单表具备以下特征: 数据字段多,索引也多; 随着数据的流转,数据一直在更新...