网站地图官方微信:
网站首页 孙村乡 永丰乡 浙源乡 兴旺镇 鱼塘镇 元墩镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二? |

    当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最...

    查看详情>>
  • | 中国的导弹水平到底怎么样? |

  • | 以色列摩萨德这么厉害,中国网民为何不害怕? |

  • | 为什么负荷那么大的腰部力量训练的人不会受伤,长期无载荷久坐的人会出现腰肌劳损? |

  • | 你的亲戚提过什么过分的要求? |

  • | 卖域名还是个好生意吗? |

  • | 程序员为啥突然会变成这么辣鸡的一个行业? |

  • | 你的亲戚提过什么过分的要求? |

  • | 如何评价张靓颖刘宇宁《九万字》? |

  • | 为何Microsoft能一直留在中国市场? |

  • | 伊朗这次让以色列打惨了,这个国家还能挺过来吗? |

  • 德云社早期演出,王玥波帮场演了一段《八扇屏》,其中“莽撞人”...

    2025-06-19
  • 我有两个孩子,学习都比较好: 幼儿园识字过千,一年级开始学奥...

    2025-06-19
  • 19年第一次去日本旅游,离开前被这位检查行李的工作人员的颜值...

    2025-06-19
  • 个人觉得,女生穿牛仔裤的形式意义还是大于内容 说白了,就是审...

    2025-06-19

关注我们

添加微信好友,关注最新动态