网站地图官方微信:
网站首页 东墟镇 阁山镇 凉亭乡 泰山乡 桴焉乡 朗溪镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 还有必要学习爬虫吗? |

    当然有,但“学爬虫”的意义已经变了。 ✅ 学的是能力,不只...

    查看详情>>
  • | 巅峰期的成龙身体素质是怎么一种存在? |

  • | 想买一台显示器,主要用于设计和办公,4K分辨率最好,刷新率不追求,1500左右的有吗? |

  • | 对方的哪个瞬间让你的相亲终止了? |

  • | 为什么腾讯云或者阿里云不让自建dns服务器? |

  • | 大部分语言都用尖括号<>表示泛型,为什么golang要标新立异用中括号? |

  • | 三只羊是不是被人做局了? |

  • | 央行行长潘功胜首次在公开场合谈及稳定币,稳定币是什么?有何深意? |

  • | 在武汉,你们的找对象标准是怎样的? |

  • | 你见过哪些宛如智障的广告? |

  • | 美国搞出个“稳定币”,到底是什么?其它国家是如何看待稳定币的? |

  • 漏洞简介 CVE-2024-53900 Mongoose 8...

    2025-06-22
  • 讲个真事。 我曾经共过事的一位女同事,年前被诊断出子宫内膜...

    2025-06-22
  • 命途多舛,干了小半年Android开发,发现两件事: And...

    2025-06-22
  • 我的小腿,真的非常粗,而且近来可能是运动的缘故,好像还加粗了...

    2025-06-22

关注我们

添加微信好友,关注最新动态