网站地图官方微信:
网站首页 坦头镇 蛟龙镇 店子乡 彭场镇 常理镇 喜捷镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 养了近十年的草龟要不要放生? |

    我养了13年的龟仔上周死了,它很活泼,很亲人,会跟着我走来走...

    查看详情>>
  • | 为什么中国农村房子那么丑? |

  • | 如何看待英雄联盟前职业选手mlxg官司输了,被强制执行2500w? |

  • | 为什么中国男性正在集体退出相亲市场? |

  • | 怎么挑选做设计用的显示器,要看哪些参数呢? |

  • | 《捞女游戏》发售仅一天同时在线超 6330 人,如何看待游戏的销量? |

  • | 为什么腰肌劳损这么难治? |

  • | notion和Obsidian这两款软件选哪个? |

  • | 为什么中国主机带宽比美国贵5倍(原来错误的10000倍),比如阿里云? |

  • | 如何看待 2026QS 世界大学排名? |

  • | 为什么苹果不封杀「爱思助手」「iTools」这类软件? |

  • 先说结论。 JWT的设计从通用性和功能性角度,是非常合理的。...

    2025-06-23
  • 一个同学跟我说,昨天他去字节跳动面试,面试官这样问他,“如何...

    2025-06-23
  • 结婚前VS结婚后。 打完球,兄弟,来一口。 瓶子向下60...

    2025-06-23
  • 作者:vivo 互联网前端团队- Su Ning 本文通过d...

    2025-06-23

关注我们

添加微信好友,关注最新动态