有人说,我做一款AI芯片,只要原生支持PyTorch就好了呀,用户直接用PyTorch跑模型,根本接触不到CUDA呀。
没错,一般的用户只要在PyTorch层面做应用,但是总是有新的模型架构出来,这些架构都需要做特定的性能优化才能在一个芯片上得到较高的性能,这时候就涉及到算子开发了。
比如说一开始LLM在GPU上的性能不好,后来社区针对Nvidia GPU做了flash attention等的优化才把LLM的性能提升到了比较可观的程度。
CUDA已经被各种开源AI框…。
代码:
如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
印度女性为什么不嫁到中国?
做一个中国的微软到底有多难?
如何看待rust编写的zed编辑器?
Anthropic 推出的 Claude Code 是什么技术原理呢?
为什么我感觉gemini 2.5 pro总是用力过猛?
网络小白如何建立一个网站,供别人下载文件(主要是PDF和MP3)?
你会从mac转向Windows吗?
有没有大佬评价一下这套电脑配置?
docker怎么修改拉取源从指定的国内仓库拉取镜像?
我感觉 Mac 的文件浏览器(Finder)挺好用的,Windows 上面有没有差不多的软件呢?
M4 Mac mini2024款,这种主机到底怎么样呀?
Golang和J***a到底怎么选?
人社部称个人养老金领取时需缴个税 3%,不区分本金和投资收益,哪些人适合缴存个人养老金?应注意什么?
怎么实现一个简单的数据库系统?
python与nodejs哪个性能高?
20届设计系,我的设计水平很差吗,找不到合适的工作?
什么是你去了台湾才知道的事?
能够自己一个人创业的全栈web码农fullstack developer要会哪些技术?
为什么现在吹Rust的人这么多?
为什么都认为无GC语言一定会比有GC语言要快?
《绝命毒师》(Breaking Bad)里有哪些硬伤?
不限制语言,客户端GUI开发用什么好?
真的没有人觉得2k是一个很尴尬的分辨率吗?
《西虹市首富》里面想花完钱却越花越多的情况,现实里面会发生吗?
如何评价阿里等大厂笔试现已经禁用本地IDE?
三只羊是不是被人做局了?
为什么买的小乌龟总是养不活呀?
为什么韩国的热辣舞团无法征服中国的男性市场??
golang总体上有什么缺陷?