线上故障如何快速排查?

2025-06-19 19:35:16

前几天凌晨2点,我又被监控报警给吵醒了。

服务器CPU飙到90%,但是top看了半天也找不到罪魁祸首。

这种时候,就得请出我们运维人员的两大法宝了——strace和ftrace。

说实话,刚开始接触这两个工具的时候,我也是一脸懵逼。

什么系统调用、内核跟踪,听起来就很高大上的样子。

但是用多了你就会发现,这玩意儿简直就是排查问题的神器!今天就跟大家分享一下我这些年用下来的一些心得。

先说说系统调用这个东西你可能会问,系统调用到…。

线上故障如何快速排查?
广告位810*200
相关阅读
Go 语言 Web 应用开发框架,Iris、Gin、Echo,哪一个更适合大型项目?

Go 语言 Web 应用开发框架,Iris、Gin、Echo,哪一个更适合大型项目?

项目起因2021 年,我在面试中多次被问到数据库内核相关问题...

2025-06-21
做个web服务器,gin框架和go-zero怎么选?

做个web服务器,gin框架和go-zero怎么选?

如何选择你的 Golang 后端开发框架引言与 J***a ...

2025-06-21
SQLite不能支持高并发,为什么又说它能支持 10万 的日访问量?

SQLite不能支持高并发,为什么又说它能支持 10万 的日访问量?

一个操作耗时 1 秒,可以有 10 的并发,100 秒就可以...

2025-06-21
个人开发者或小企业不申请经营性ICP备案,怎样开发APP盈利?

个人开发者或小企业不申请经营性ICP备案,怎样开发APP盈利?

这个问题回答八百遍了: 如果你的 App 或者网站想收费,注...

2025-06-21
为什么没有核动力货轮?

为什么没有核动力货轮?

核动力这么强劲,为什么商船却不用? 其实看看世界第一艘核动力...

2025-06-21