开发者必须手工管理成千上万条线程的索引、内存布局和同步,仿佛一个交响乐指挥需要亲自调试每一件乐器的音准。这种复杂性将大多数开发者挡在门外,只有少数高性能计算专家才能驾驭。
机器之心报道机器之心编辑部几个小时前,NVIDIA CUDA Toolkit 13.1 正式发布,英伟达官方表示:「这是 20 年来最大的一次更新。」这个自 2006 年 CUDA 平台诞生以来规模最大、最全面的更新包括:NVIDIA CUDA ...
NVIDIA 在2025年GTC大会上宣布了一项具有里程碑意义的技术更新:CUDA并行计算平台正式支持原生Python编程。这一突破性进展将 ...
很少有人像他一样,在 通用CPU、移动SoC、车载SoC、AI加速器 上都做过一线设计和架构决策。近几年他频繁在TSMC、三星等论坛谈未来工艺与架构,被称为「半导体设计传奇」。
2025 年12 月,NVIDIA 推出CUDA 13.1,此次更新被官方定位为“自2006 年CUDA 平台诞生以来最大、最全面的升级”。其核心亮点之一,是引入了新的编程模型CUDA Tile。这个变化,有可能不仅仅是一项技术迭代,而是标志着GPU 编程范式迈入一个新的阶段。
今年,英伟达可谓是全力押注,明确表示要确保 Python 成为 CUDA 并行编程框架中的“一等公民”。 多年以来,英伟达为 GPU 开发的 CUDA 软件工具包始终缺少原生 Python 支持,现如今这种情况终于有所转变。在近期的 GTC 大会上,英伟达宣布其 CUDA 工具包将为 Python ...
最多可支持 10000+ 个并发线程。 经过近 10 年的不懈努力,对计算机科学核心的深入研究,人们终于实现了一个梦想:在 GPU 上运行高级语言。 上周末,一种名为 Bend 的编程语言在开源社区引发了热烈的讨论,GitHub 的 Star 量已经超过了 8500。 作为一种大规模并行 ...
近日举办的2025 RISC-V中国峰会上,NVIDIA硬件工程副总裁Frans Sijstermans宣布,CUDA软件平台将支持RISC-V指令集架构处理器,为开源架构RISC-V开启进入数据中心与AI市场的大门。 据了解,过去x86与Arm架构在AI与HPC领域居于主导地位,主要原因就是和CUDA的高度整合。
在中国举办的 2025 年 RISC-V 峰会上,Nvidia 宣布其 CUDA 软件平台将在 CPU 方面与 RISC-V 指令集架构(ISA)兼容。这一消息在 RISC-V 活动期间的一个演示中得到了证实 。这是在性能要求高的应用中启用基于 RISC-V ISA 的 CPU 的重要一步。 这项宣布表明,RISC-V 现在可以 ...
说到视频编码,也许大家都会认为这种应用太小众,但我们却与之关系密切。从正版的电影发行媒体DVD、Blue-Ray或者HDDVD等等到我们下载的电影,其中大部分都经过了视频再编码的过程(BD 原盘镜像除外)。虽然这牵扯到版权问题,但不可否认,无论是MP4、IPOD ...
DeepSeek-R1火遍海内外,但推理服务器频频宕机,专享版按GPU小时计费的天价成本更让中小团队望而却步。 而市面上所谓“本地部署”方案,多为参数量缩水90%的蒸馏版,背后原因是671B参数的MoE架构对显存要求极高——即便用8卡A100也难以负荷。因此,想在本地小 ...
在昨天测试了丽台的Cell核心视频加速卡后,今天日本PCWatch网站又放出了一篇视频处理性能测试文章。这一次的主角也是近期的热门人物,NVIDIA CUDA加速。他们分别使用了三款目前支持CUDA加速的视频处理软件:Badaboom Media Converter、TMPGEnc 4.0 XPress和PowerDirector威力 ...