写CUDA到底难在哪?

2025-06-23 17:20:19

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?
广告位810*200
相关阅读
不是说剪映很简单吗,为啥大家还是喜欢用pr呢?

不是说剪映很简单吗,为啥大家还是喜欢用pr呢?

最根本的原因就是玩pr的人,他们玩的比较早,那时候还没有剪映...

2025-06-27
《海贼王》里,为何赤犬作为很早就出场的强者,他的压迫感没有掉价?

《海贼王》里,为何赤犬作为很早就出场的强者,他的压迫感没有掉价?

因为尾田还没开始刻画赤犬,开始仔细描写之后一定是小丑。 这部...

2025-06-27
女子被闺蜜按水中后续如何?

女子被闺蜜按水中后续如何?

成都黄龙溪景区两个女孩玩打水仗游戏,其中胖女孩玩过火了,把瘦...

2025-06-27
cloudflare的1.1.1.1和warp有什么区别?

cloudflare的1.1.1.1和warp有什么区别?

坦白说,我第一次听说 Cloudflare 是因为他们提供的...

2025-06-27
看新闻说老美的B-2连续飞了37小时,飞行员的吃喝拉撒怎么解决?

看新闻说老美的B-2连续飞了37小时,飞行员的吃喝拉撒怎么解决?

B-2的资料有很多,能公开的早都已经公开了,内部有生活区,睡...

2025-06-27