您现在的位置是:亿华云 > 应用开发
联想AI服务器首次实现低于1TB本地部署DeepSeek满血大模型
亿华云2025-10-08 23:09:08【应用开发】8人已围观
简介近日,联想集团宣布基于联想问天WA7780 G3服务器,在行业内首次实现单机部署DeepSeek-R1/V3 671B大模型,以低于行业公认1TGB显存实际768GB)承载多并发用户流畅体验,可以满足
近日,联想联想集团宣布基于联想问天WA7780 G3服务器,服务在行业内首次实现单机部署DeepSeek-R1/V3 671B大模型,器首以低于行业公认1TGB显存(实际768GB)承载多并发用户流畅体验,次实可以满足千人企业的现低血使用需求,为行业树立了企业级大模型部署新基准。地部
联想问天WA7780 G3大模型训推一体服务器
突破性能限制,满模型树立DeepSeek-R1大模型部署新基准
作为全球关注的联想焦点,众多企业正准备在本地化部署DeepSeek大模型。服务然而,器首在落地实施过程中用户普遍面临以下关键决策难题:单机能否部署满血版DeepSeek R1?次实所需最低配置是什么?如何确保高并发与吞吐量下的优质体验?如何避免采购陷阱?
联想此次突破为企业提供科学选型指南。针对行业公认1TB显存是现低血千亿参数大模型运行基线的背景下,联想研发团队通过专家并行优化、地部智能访存架构升级及PCIe 5.0全互联架构创新,满模型大幅提升了显存利用率,联想从而实现了性能的提升。
据了解,联想WA7780 G3服务器在2月初已实现单机768GB GPU显存条件下部署DeepSeek 671B R1和V3满血模型,并能满足中小企业的源码库并发需求。进而通过联想万全异构智算平台的访存优化,专家并行调用策略等技术优化手段,实现了单机一个月内并发能力增长10倍, 同时还提升了每路用户的TPOT、TTFT等综合性能体验
持续优化升级,解决用户体验难题
联想的这一创新成果揭示了设备选型的新维度,也提醒企业审慎评估各种测试数据,摒弃对总吞吐量和总并发数等指标的片面追求,而应从用户体验出发,关注这些指标背后的隐藏信息,如数据精度等。实际上,如果将数据精度从FP8转为int8或int4(即量化),虽能明显改善性能表现(如更高并发量和高吞吐量),但会牺牲结果的准确性,显然这不是用户所期望的高防服务器。
需要特别指出的是,高吞吐量和高并发量也并不等同于用户体验好。若服务器GPU卡配置不高,局部通信瓶颈可能引发响应延迟使体验降级,这正是联想着力解决的难点之一。
毫无疑问,联想技术突破将有效破除大模型落地瓶颈,显著加速大模型在企业的落地进程。未来,联想基础设施业务群与联想研究院ICI实验室将继续携手合作,依托联想万全异构智算平台对DeepSeek平台从AI预训练、后训练到推理的全流程进行持续优化,为客户奉献出性能更佳、性价比更高的产品和解决方案,以加速DeepSeek大模型的落地,推动新一轮生产力革命。服务器托管
很赞哦!(79)
相关文章
- 在数以亿计的网站中,我们应该抓住每一个可能带来宣传的机会,域名可以带有企业的名字,一般可以使用汉语拼音或者英语单词或者是相关缩写的形式,只要用户记住了你企业的名字,就能很容易的打出你的网站域名,同样的,记住了网站域名也能很快的记住你公司的名字。
- GNOME 的放大镜现在将避免对桌面进行双重绘制
- 让 Node.js 变“懒”的 COW 技术
- 5张图带你彻底理解G1垃圾收集器
- 因为域名解析需要同步到DNS根服务器,而DNS根服务器会不定时刷,只有DNS根服务器刷新后域名才能正常访问,新增解析一般会在10分钟左右生效,最长不会超过24小时,修改解析时间会稍微延长。
- 通过 Ribbon 查询 Nacos 服务实例
- 如何使用 Go 读取和写入 Excel (XLSX) 文件
- 给学妹看的SpringIOC 面试题(下)
- 当投资者经过第二阶段的认真学习之后又充满了信心,认为自己可以在市场上叱咤风云地大干一场了。但没想到“看花容易绣花难”,由于对理论知识不会灵活运用.从而失去灵活应变的本能,就经常会出现小赢大亏的局面,结果往往仍以失败告终。这使投资者很是困惑和痛苦,不知该如何办,甚至开始怀疑这个市场是不是不适合自己。在这种情况下,有的人选择了放弃,但有的意志坚定者则决定做最后的尝试。
- Nacos客户端是如何实现实例获取的负载均衡呢?