网站地图官方微信:
网站首页 曲峪镇 恒山区 锦屏乡 嘎玛乡 景古镇 贡寮区

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 脸与身材不符是种怎样的体验? |

    提名一下我的一米九萌妹老婆呀。 没错,我老婆大人净身高18...

    查看详情>>
  • | 世界上最大的航母有多大? |

  • | 如何看待rust编写的zed编辑器? |

  • | 刘强东称「京东外卖很快就会出来一个跟美团完全不同的商业模式」,如何看待此回应? |

  • | 为什么有人爱 Firefox 胜过 Chrome 呢? |

  • | 公司规定所有接口都用 post 请求,这是为什么? |

  • | 上海作为超大城市,高架上反而没有特别拥堵,上海交警是如何治理的?有哪些措施是其他城市可以效仿的? |

  • | 有什么关于山西的冷知识? |

  • | 匿名说一下自己最近的烦恼吧? |

  • | 黄一鸣为什么敢承认孩子是王思聪的? |

  • | JetBrains 放弃 AppCode 是否是一个错误决定? |

  • 自古以来的服务器应用都是一台服务器跑一个 server **...

    2025-06-20
  • 我的天,真的爆炸了!而且非常严重!更新一下:天亮了,经过一晚...

    2025-06-20
  • 目前的进展: 军用先进涡扇: 涡扇-15 :即将批量服役歼-...

    2025-06-20
  • 我是前飞蚊症患者,做了玻璃体切除术后飞蚊已经对我人生再也不产...

    2025-06-20

关注我们

添加微信好友,关注最新动态