首页
学习
活动
专区
圈层
工具
发布

#gpu

国产GPU全景选型与量化实践:打通大模型训推的性能与生态瓶颈

gawain2048

腾讯科技(深圳)有限公司 | 市场研究 (已认证)

本文聚焦大模型训推面临的算力、访存带宽及生态迁移瓶颈,提出基于“一云多芯”的国产GPU精细化选型矩阵(涵盖GPGPU与DSA架构)。通过覆盖真实业务场景的严格量...

300

Kubernetes GPU 调度完全指南:从入门到生产实践

云技术以及云存储

在 AI 大模型训练、推理场景爆发式增长的今天,如何在 Kubernetes 集群中高效调度 GPU 资源,已成为云原生领域的关键技术。本文系统梳理 K8s...

7210

明明模型很小,为啥 GPU 显存却被吃满?一文讲透深度学习显存真相

GPUS Lady

这个话题十分有趣,Jimin Lee的文章就详细解释了这一困惑,我们来看看他是怎么说的。

15910

黄仁勋炸场 GTC 2026:NemoClaw 才是真正大招,比新 GPU 更关键

GPUS Lady

在2026年NVIDIA GTC大会上,黄仁勋带着机器狗、趣味彩蛋走完舞台,在一众硬件新品里,藏着一个对企业技术决策者远比新显卡更重要的重磅发布:NemoCla...

19910

GPU 黑科技 DSMEM: 让线程块 “片上直达”,告别显存绕路

GPUS Lady

我们可以把 GPU 里的 ** 线程块(Block)** 想象成一个个独立的 “小工作组”,它们并行干活,效率极高。但只要涉及 “跨组传数据”,老架构(Hopp...

6810

GPU地球进展

气象学家

先用LINE_STRIP实现了省界,一条线一个VAO在for循环里逐个渲染,目测对帧率没什么影响。GPU让我有些时候低估了CPU的效率。

5410

显存大解放:vLLM Sleep模式实战指南,90% GPU资源瞬间回收!

Michael阿明

参考 https://docs.vllm.ai/en/latest/features/sleep_mode/

15310

手把手教你使用 Docker+GPUStack 快速搭建企业级大模型服务平台,轻松实现从单机到集群的高效扩展!

民工哥

手把手教你使用 Docker+GPUStack 快速搭建企业级大模型服务平台,轻松实现从单机到集群的高效扩展!

31810

50:高端计算威胁解析:GPU集群破解经典加密的风险与防御

安全风信子

作者: HOS(安全风信子) 日期: 2024-09-13 主要来源平台: GitHub 摘要: 本文深入解析GPU集群破解经典加密的技术原理,从并行计算...

11010

传SK海力士推迟HBM4量产与扩产时间

芯智讯

12月8日消息,据韩国媒体ZDNet Korea 报导,存储芯片大厂SK海力士已经修改HBM4生产计划,原本2026年2月量产HBM4、明年二季度扩大产量的计划...

22210

不惧谷歌TPU竞争!黄仁勋:GPU有通用优势,英伟达地位稳固!

芯智讯

11月28日消息,近日业内盛传美国科技巨头Meta可能会从2027年起采用谷歌自研的TPU芯片来用于满足自身的AI需求。如果接下来有更多的厂商选择谷歌的TPU,...

9410

传英伟达因DRAM短缺已停止向GPU主板合作伙伴提供显存

芯智讯

11月27日消息,业内传闻显示,由于DRAM内存芯片供应紧缺、价格持续上涨,英伟达已经停止向GPU板卡合作伙伴出售GPU捆绑的显存,导致合作伙伴自行采购所需的显...

12910

2025年第三季数据中心GPU出货量暴涨145%,PC显卡仅增长2.5%

芯智讯

11月25日消息,根据市场研究机构 Jon Peddie Associates 的最新报告,2025年第三季PC 显卡出货量环比增长了2.5%,但数据中心的GP...

13010

国产GPU双雄科创板IPO又进一步!

芯智讯

11月13日,国产GPU厂商摩尔线程正式发布科创板上市招股意向书,其网下申购代码688795、网上申购代码 787795,拟发行7000万股,占发行后总股本 1...

18110

英伟达Q3营收大涨62%!黄仁勋:AI GPU已销售一空!

芯智讯

11月20日,英伟达(NVIDIA)发布了截至10月26日的2026财年第三财季财报,营收及获利均超出市场预期,并且第四财季指引也超出了市场预期。英伟达创始人兼...

29910

东芯股份:砺算首款GPU芯片“7G100”进入客户送样阶段

芯智讯

11月14日,东芯股份发布投资者关系活动记录表,宣布砺算科技正在围绕首款图形渲染GPU芯片“7G100”开展客户送样、测试优化、产品生产与市场推广等工作,相关工...

13310

美国财政部长:Blackwell GPU落后两代,才会允许对中国出口!

芯智讯

虽然英伟达CEO黄仁勋一直希望推动基于Blackwell架构的定制版GPU能够对中国出口,以替代已经落后的H20 GPU。但是,据路透社报道,美国白宫11月4日...

12910

AMD CEO苏姿丰:2nm的Venice CPU和MI400 GPU明年推出!

芯智讯

当地时间11月4日,AMD公布了其 2025 年第三季度财报。在随后的财报会议上,AMD CEO苏姿丰(Lisa Su)透露,基于2nm制程Zen6核心的EPY...

24010

一顿炸鸡啤酒,黄仁勋让韩国两大财阀买了10万颗GPU!

芯智讯

10月30日,英伟达创始人兼CEO黄仁勋在韩国参加亚太经合组织(APEC) 峰会后,与三星电子执行董事长李在镕(Jay Y. Lee)及现代汽车执行董事长郑义宣...

14210

OpenAI总裁:未来每个人都将拥有自己的专用GPU!

芯智讯

9月30日消息,据Tom's Hardware报道,OpenAI总裁Greg Brockman近日与OpenAI CEO山姆·奥尔特曼(Sam Altman)、...

7910
领券