
英伟达的cuda是什么东西? - 知乎
你平时看到的 __global__ 、 threadIdx 、 cudaMalloc,只是整个 CUDA 平台最底层的一部分,随着时间推移, CUDA 平台 的范围不断膨胀, 原先首字母缩略词所代表的字面含义,已经很难再准确描述如 …
CUDA是什么?主要应用在什么地方? - 知乎
CUDA,全称 Compute Unified Device Architecture,是 NVIDIA 在 2016 年推出的一种通用并行计算平台和编程模型,它利用 NVIDIA GPU 中的并行计算引擎以比 CPU 更有效的方式解决许多复杂的计算问 …
CUDA到底是什么东西,能不能通俗易懂地解释一下? - 知乎
本人是NLP搬砖工,并不专门研究CUDA算子。我看了几个回答没看见特别通俗易懂的,所以我想尝试以一个外行人的身份给其他外行人解释。所以我主要注重懂,而不是准。 在CUDA生态的最低层就是 …
如何系统地学习CUDA? - 知乎
于是,我决定将自己先前整理的CUDA-Learn-Notes笔记,继续扩展,经过将近一年的业余时间的努力,终于达到了我认为可以开写CUDA基础系列笔记的状态。 材料准备好了,25年继续更新笔记,保 …
50系列显卡怎么兼容低版本pytorch+cuda? - 知乎
首先低版本cuda不用想了,50系需要12.8起步 但好消息是cuda12.×的兼容性还不错基本不需要改代码就能重新编译大多数项目 再来看torch 上策:重新编译torch 拉取旧torch代码修改cuda版本约束后重新使 …
CUDA到底是什么东西,能不能通俗易懂地解释一下? - 知乎
本人是NLP搬砖工,并不专门研究CUDA算子。我看了几个回答没看见特别通俗易懂的,所以我想尝试以一个外行人的身份给其他外行人解释。所以我主要注重懂,而不是准。 在CUDA生态的最低层就是 …
GPU国产化了还能用CUDA吗或者有类似的库吗? - 知乎
国产GPU厂商非常清楚,当今的AI和高性能计算(HPC)世界是建立在CUDA之上的。 如果要求所有开发者抛弃数十年积累的CUDA代码,去学习一个全新的编程语言,那将是“生态自杀”。 因此,“国产 …
DeepSeek 绕开 CUDA 垄断,针对英伟达 PTX 进行优化实现最大性能, …
Feb 2, 2025 · 你以为的:DeepSeek 绕过 CUDA 使用 PTX。 实际上的:DeepSeek 通过在 CUDA 代码里塞入一堆 PTX 代码来优化 CUDA 性能,然后和其他现成 CUDA 工具链结合,在可接收的开发时 …
如何评价 Sakana AI 推出的 AI CUDA Engineer? - 知乎
Feb 21, 2025 · 技术报告里有这么一个被优化后比compile speedup 一百多倍的下三角矩阵乘法的算子,我给看官们解析一下笑点在哪里: 在kernel里面,使用的是二维block config,分别表示矩阵的row …
为什么说CUDA是NVIDIA的护城河? - 知乎
与其说CUDA是护城河,倒不如说Nvidia在科学计算、自动驾驶、人工智能、机器人这些领域已经形成了护城河,CUDA只是这个护城河的一部分,或者说是直接能接触到的护城河。