“青云科技在整个‘东数西算’领域的核心是打造多元算力的超级智算平台,向下接驳多样性的算力,向上支撑行业应用。”青云科技(qingcloud.com,股票代码:688316)副总裁、数字价值研究院院长沈鸥曾表示,青云超级智算平台的目标是通过对多样性算力的管理和调度,来支撑行业应用的计算和行业数据的智能分析。
随着“东数西算”工程全面启动,青云也对外宣布新一代的超级智算平台将成为青云布局算力中心建设与运营的核心产品。对于青云来说,算力中心的重点和关键在于多元算力操作系统。沈鸥表示,青云的多元算力操作系统,即超级智算平台,将重点在四个方面提供平台能力,从而为企业的数字化进程提供完善的整体服务能力。
打造多元算力的超级智算平台
据悉,青云科技基于虚拟化、容器等技术,实现对算力与底层基础设施的解耦,通过统一的云操作系统对底层资源进行纳管和协同编排,构建了支持多元算力的超级智算平台,实现多元算力的统一协调管理及协同工作,最大化地发挥多元算力的作用。
沈鸥介绍,青云超级智算平台主要提供了四个方面的平台能力,包括算力生产供应平台能力,数据开放共享平台能力,智能生态建设平台能力和产业创新开发平台能力。
四个平台能力相互依存,从而为企业的数字化进程提供完善的整体服务能力。在整体能力搭建上,青云通过技术开源、对开放标准的支持,从而将相关技术能力更为广泛地应用到多个领域和行业。目前在智能制造、医药分析、地理海洋预测等领域,青云都有成熟的应用案例落地。
青云超级智算平台以融合架构计算系统为平台,以数据为资源,能够以多元算力驱动计算模型对数据进行深度加工,源源不断产生各种智慧计算服务,集成各场景业务软件,通过统一的应用商店,支撑各行各业应用场景。
同时,青云超级智算平台基于 KubeSphere 构建了以应用为中心的分布式、多租户、多集群、企业级容器平台,具有强大且完善的网络与存储能力,并通过极简的人机交互提供完善的多集群管理、CI/CD、微服务治理、应用管理等功能,与 HPC 平台相融合,在云、虚拟化及物理机等异构基础设施上快速构建、部署及运维容器架构,实现应用的敏捷开发与全生命周期管理。
算力:转化为便捷易用的基础设施
“东数西算”工程中的“数”,指的是数据;“算”指的是算力,即对数据的处理能力。作为一项国家级的算力资源跨域调配战略工程,“东数西算”工程对于优化我国算力资源空间布局,加快打造全国算力“一张网”,构筑我国数字经济发展新优势,都具有重要的意义。
其中,算力代表了对数据的处理能力,是数字化技术持续发展的衡量标准,也是数字经济时代的核心生产力。
在沈鸥看来,算力不是孤立存在的,算力的价值是以更快、更短的时间完成数据分析、业务计算任务,推动业务进程和管理活动。
而如何将算力转化为便捷易用的基础设施,真正让算力成为基础设施,让各种应用、算法或者模型都能更方便的运用这个算力,是青云一直在思考和努力的。
因此,青云分别在2014年、2017年发布了云平台应用中心(AppCenter)1.0、2.0,提出了基于统一框架加速应用上云,提升云服务能力。2020年发布了超算应用中心,支持像EDA、CFD等行业应用在青云超级智算平台上的发布和部署,满足近两年企业数字化转型,特别是工业领域的企业里所产生的需求,让行业的能力和算力进行有效的连接,这也是青云超级智算平台支撑众多行业场景的技术基础。
沈鸥介绍,超级智算平台凝聚了青云过去几年的多项核心技术能力。首先,超级智算平台是在一个平台上提供多样性算力,每种算力都支持海量扩展、按需扩容、按需增加节点。其次,基于分布式的云架构和软件定义广域网的技术,超级智算平台能够跨地域分布式部署,在统一的运营框架下,算力服务可以跨域申请和使用,服务和应用的访问也可以跨域,而且在统一用户管理、统一运营体系下。
同时,沈鸥强调:“整个超级智算平台的核心代码都是青云科技自主研发的。”
具体到东数西算项目,沈鸥透露,青云已经在跟一些枢纽节点进行相应的技术沟通、交流,与合作伙伴沟通来设计方案,以及规划产品技术研发,希望通过整体的智算平台建设,为枢纽节点提供相应的端到端的整体解决方案。“青云现在主要在相关技术的沟通和相关技术的研发当中,希望有更完善的整体方案给国家枢纽节点的一些设计和管理单位。”
绿色智慧数据中心建设:节能减排 降本增效
作为数字经济发展的核心生产力,算力已经成为国民经济发展中最为重要的基础设施。这也让数据要素和算力等基础设施的重要性,被提到更高的高度。
“东数西算”将不单单是数据中心的工程建设,也不单单是算力的堆砌,必然会涉及到技术升级、产业升级。从青云的角度来看,包括像“绿色节能数据中心、算力调度、海量数据存储和流通、数据智能分析、数据安全”等方面,都将伴随着“东数西算”工程的建设,得到更多的研发投入和产业升级。沈鸥认为:“整个产业链条会很长,覆盖门类会很广,其实是需要产业链上下游来协同创新的。”
沈鸥介绍,在整个算力中心建设上,“东数西算”工程,一方面会新建一批绿色、低PUE 的数据中心,也会整合原来高能耗的数据中心,减少数据中心在国家能源消耗中的占比;另一方面,则是提供算力服务来满足政府和行业企业的数字化计算、数据分析的需求。这两个方面在“东数西算”的整体纲要当中都有所提及。
因此,除了青云超级智算平台外,智能化管理、能耗管理也是数据中心建设的重点。沈鸥介绍到:“对于大型数据中心而言,如果系统的IT负载率取值,比如0.9或者1的差别,就可以使服务器总体能耗相差10%。所以能耗的管控与调度,都能对数据中心的整体能耗带来很大的变化和影响。”
目前,青云科技结合物联网、边缘计算等技术,跟数据中心的基础架构管理厂商,即 DCM厂商合作,打造了智算数据中心管理平台,构建整个数据中心统一的运维数据中台,包括统一的设备数据采集平台、统一的设备配置数据库、统一的监控告警平台、统一的运维管理流程、统一的管理调度服务,相当于青云为整个数据中心提供了一个技术和业务的数据中台。
青云通过新型的采集网关和分布式物联平台,实现了对数据中心楼宇自控、数据中心设备运行数据的毫秒级采样。
沈鸥透露,在未来几年,云计算相关的技术和能力还会有很多迭代,“在整个以算力为主导的行业数字化发展过程中,青云会一如既往地在技术研发、产品研发上投入,支持行业客户在整个数字化转型中,向前走得更快更远。”