写CUDA到底难在哪?

2025-06-24 20:40:15

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?
广告位810*200
相关阅读
为什么 macOS 上国产软件不流氓?

为什么 macOS 上国产软件不流氓?

没人提到之所以不敢是因为开发者证书么? mac上无论是否上架...

2025-06-20
吴柳芳的真实水平如何?

吴柳芳的真实水平如何?

真实水平应该挺高的, 起码是被大众鉴定过的, 刚刚去看了一下...

2025-06-20
为什么openai的sdk只提供了python和js两个版本?

为什么openai的sdk只提供了python和js两个版本?

国内把JAVA当主流,不代表国外也把JAVA捧在手心里。 ...

2025-06-20
《欢天喜地七仙女》中 「仙女下嫁凡人」 的设定,在今天是否过时?

《欢天喜地七仙女》中 「仙女下嫁凡人」 的设定,在今天是否过时?

“仙女下嫁凡人”的设定在今天也能找到对照,比如孔雀女下嫁凤凰...

2025-06-20
明星现实中真的很漂亮吗?

明星现实中真的很漂亮吗?

见过杨幂,17年绣春刀杭州路演。 概括来说就是“一个很**...

2025-06-20