网站地图官方微信:
网站首页 修文镇 石沛镇 插花镇 乐峰镇 高陂镇 曹古乡

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 为何 Linus 一个人就能写出这么强的系统,中国却做不出来? |

    你看Linus自传就完事了。 Linus研究生时期开始写操...

    查看详情>>
  • | php这个岗位在未来几年会消失吗,因为刚从事php有点焦虑? |

  • | 双非一本软工毕业生,啥也不会,但还想学这行业,该选择哪门语言的哪个方向? |

  • | 新买了一台nas,第一个月下载20t+,上传5+,不会被网警盯上吧? |

  • | 山姆超市是怎么在中国火起来的? |

  • | 最近,你有什么顿悟? |

  • | 在NAS上安装了什么应用,让你的生活体验有了巨大的提升? |

  • | 如何评价《塞尔达传说:王国之泪》? |

  • | 创业公司是否应该使用 Rust ? |

  • | 皮肤太白是种怎样的体验? |

  • | 哪里有便宜的实时level2接口? |

  • 亲身经历: 刚工作的时候,厂里分配来一个小姑娘, 真的非常漂...

    2025-06-25
  • 在广州住了几年,搬到上海,发现在广州基本同事都已结婚生子,到...

    2025-06-25
  • 瘦的人,一般胸都小,但也有例外,那就是乳腺型胸的人,这种人活...

    2025-06-25
  • Lar***el。 去看了一下 解读两大主流框架lar**...

    2025-06-25

关注我们

添加微信好友,关注最新动态