在2026年国际消费电子展(CES 2026)上,英伟达公布了面向即将推出的Vera Rubin NVL72 AI数据中心服务器机架的一系列新功能,包括全新的“推理上下文内存”(Inference Context Memory)存储平台、“零停机”维护能力、机架级机密计算(confidential computing)等。
全球人工智能算力芯片龙头英伟达周二宣布, 推出专为长上下文工作负载设计的专用GPU Rubin CPX,用于翻倍提升当前AI推理运算的工作效率 ,特别是编程、视频生成等需要超长上下文窗口的应用。
根据Phoronix报道,Intel开源显卡驱动工程团队于年底送出2025年最后一笔drm-xe-next更新,为下一版Linux核心加入多项新功能,重点包括多设备共享虚拟内存(Shared Virtual Memory,SVM) ...
显卡作为PC电脑中重要的配件之一,一直是玩家非常看重的,但同时显卡也不像其他配件有可查询性能参数的标注。 那么在众多显卡厂商中,他们的卡都有什么区别,又如何自己手动查询呢,这就要用到显卡的灵魂伴侣GPU-Z了。 GPU-Z是一款显卡识别工具,绿色免 ...
近日,西安电子科技大学盛凯教授团队的论文"Cherry: Breaking the GPU Memory Wall for Large-Scale GNN Training via Micro-Batching"被高性能计算领域的国际顶级会议——2025年国际超级计算会议(2025 ACM International Conference on Supercomputing, ACM ICS ...
【天极网IT新闻频道】据浪潮数据统计,智算中心60%以上的故障都出自GPU卡或GPU服务器的故障,这类故障动辄造成设备离线甚至直接的经济损失。在大模型推理服务 7×24 小时连续运行的今天,AI 基础设施的稳定性对业务至关重要。但现实痛点突出:云 ...