11月10日,以“数字科技焕新启航”为主题的2023数字科技生态大会在广州市举办。会上,天翼云重磅发布一站式智算服务平台“慧聚”。天翼云科技有限公司董事长、总经理胡志强对天翼云智算服务体系进行了全面解读。
2023年是大模型高速发展的一年,大模型不断扩大的参数规模和快速迭代的技术路线跨越式地提升了模型的能力,但是同时也为大模型的训练和应用带来了很多挑战。比如算力利用率的瓶颈日益凸显、算力成本压力进一步增大、模型的构建难度不断提升、模型的行业落地更加复杂。
为顺应大模型时代对于云服务商的新要求,天翼云全面升级,构建了全栈大模型智算服务,包括打造智算数据中心AIDC、升级云智超一体化基础设施平台“云骁”、推出一站式智算服务平台“慧聚”、构建国云大模型生态,形成云智一体的智算服务体系。
智算数据中心作为智算服务的载体,成为整个体系的基石。针对AI高强度运算带来的散热问题,天翼云推出了液冷DC舱,融合定制化液冷智算服务器,实现低至1.12的PUE。与此同时,天翼云也将“云骁”升级成为云智超一体化基础设施服务平台,构建了高性能RoCE网络、并行文件存储等服务;重点提升训练加速、网络加速等核心能力,同时升级了运维体系,实现对基础设施的全面故障预测和感知。在国产化方面,“云骁”平台率先在公有云加载天翼云RoCE网络+国产GPU方案并实现商用。
在平台层,天翼云在本次大会发布大模型的一站式智算服务平台“慧聚”。“慧聚”是天翼云一站式智算服务平台,在“云骁”基础设施平台的加持下,大幅降低大模型训练、微调、部署、推理的门槛,提供一站式、全链路、低门槛、高安全的大模型训推服务,为各种行业、各种场景提供从模型的生产到应用闭环的大模型解决方案。包含四大平台:数据平台,模型开发平台,模型服务平台和应用服务平台。通过平台提供数据准备、模型开发、任务管理、模型优化等七大主要产品功能模块。内置工具集,集成核心技术,赋能合作伙伴解决训练阶段如何提升模型训练时间,如何保证稳定训练两大核心痛点问题。
数字山河,云行无疆。在数字时代,以算力为核心的数字信息基础设施已成为国家战略性布局的关键组成部分。为持续释放新型生产要素潜能,加速打通信息“大动脉”,创新打造经济高质量增长新引擎,作为云计算领域的国家队,天翼云依托国云智算底座,发挥国云安全优势,将与产业各方合作伙伴紧密协作,共建繁荣的大模型创新生态,携手打造先进的智算生产力,全面赋能经济社会的数字化和智能化。