网站地图官方微信:
网站首页 里南乡 镜湖区 邢口镇 弹子镇 永东乡 红桥镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 网传厦门某国企研发部门要求每日考察后端 400 行,前端 1000 行代码量,如属实,这个考核合理吗? |

    我前司搞过一次,让我用Python统计gitlab提交代码量...

    查看详情>>
  • | 为什么腾讯云或者阿里云不让自建dns服务器? |

  • | 哪吒汽车正式被申请破产,因薪酬问题员工已两月没去上班,被申请破产意味着什么?员工权益还能得到保障吗? |

  • | 为什么日本经济下降,大学排名跌至谷底,还有那么多人挤破脑袋去日本留学? |

  • | 电脑有64G的物理内存(DDR5 5200),完全够用了,可以关闭系统的虚拟内存吗? |

  • | iOS 26 的新设计被吐槽丑,苹果在设计更新时考虑了哪些因素?你对这一设计都有哪些评价? |

  • | 如何部署Prometheus监控K8S? |

  • | 请问有人能估计一下 go 相比 php 在不同用户量下能省多少钱吗? |

  • | Golang是不是代替了PHP以前的生态位啊? |

  • | 中国的航空发动机现在是什么水平? |

  • | Flutter 为什么没有一款好用的UI框架? |

  • 伊朗今天只发射了30枚,而且还是压舱地的射程2000公里的国...

    2025-06-21
  • 我开发了一个语言 herlang: justj***ac/h...

    2025-06-20
  • 我老婆高中时也是班花,但是没人惦记,具体说是没人敢惦记,原因...

    2025-06-20
  • 现身说法。 自从我电脑上有16G内存之后,每次重装完Wind...

    2025-06-20

关注我们

添加微信好友,关注最新动态