写CUDA到底难在哪?

2025-06-24 23:50:15

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?
广告位810*200
相关阅读
以前的日漫都这大胆的吗?

以前的日漫都这大胆的吗?

看看推荐的很多感觉擦边小儿科,看看孔雀王系列,尤其是孔雀王退...

2025-06-23
为什么很多公司都不招大龄码农?

为什么很多公司都不招大龄码农?

我老婆去面试一家公司,对面的CTO很年轻,就问经典问题,就是...

2025-06-23
golang和rust你选择哪个?

golang和rust你选择哪个?

我自觉是无法参与基础设施建设的开发者,所以对 Rust 不是...

2025-06-23
老板说我设计了一周的海报还是不行,我到底该怎么学啊?

老板说我设计了一周的海报还是不行,我到底该怎么学啊?

如果你老板要求不高的话,还可以抢救一下,但是也得学一段时间 ...

2025-06-23
《西虹市首富》里面想花完钱却越花越多的情况,现实里面会发生吗?

《西虹市首富》里面想花完钱却越花越多的情况,现实里面会发生吗?

和大部分人的想法不同,这事实上是普遍状态、大概率***。 ...

2025-06-23