网站地图官方微信:
网站首页 干沟乡 高寨镇 刘湾镇 百马乡 马烈乡 西兴镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | Manus会不会开源? |

    Manus是否开源已经没有那么重要了。 。 。 。 。 。 ...

    查看详情>>
  • | 大家猜猜伊朗的结局如何? |

  • | 空战的时候可不可以先击落预警机? |

  • | 字节跳动技术副总裁开源了自己与Trae合作的首个项目,如何评价目前AI开发的水平? |

  • | 要不要帮导师装服务器? |

  • | 存电话号码,究竟该用int类型还是string类型? |

  • | 老公想要买2万左右的相机,我该同意吗? |

  • | Golang与Rust哪个语言会是今后的主流? |

  • | 有哪些开源web应用漏洞扫描工具? |

  • | 如何评价腾讯元宝桌面端使用 Rust 的 Tauri 框架? |

  • | 网络小白如何建立一个网站,供别人下载文件(主要是PDF和MP3)? |

  • 文 | 佘宗明时间点,正确——不是寻常时点,是6·18收官日...

    2025-06-20
  • 【选择题】以下框架运行性能最低的是( ) A.锟斤拷锟斤拷锟...

    2025-06-21
  • 上了一周的班,周五晚上8-10点打个羽毛球,筋疲力尽。 回家...

    2025-06-20
  • 特别注意——谈航向角主要对应的是尾弹仓——航向角好的那几个,...

    2025-06-20

关注我们

添加微信好友,关注最新动态