从理想照进现实,浅谈“算力网络”

2022-05-17 612
本文转自:钟楼漫谈

近日,“东数西算”让“算力网络”再次成为热点。借此机会来聊一聊对“算力网络”的认知。

谈算力网络之前,先来了解一个故事:在家探索外星生命。

人类对于宇宙的好奇,一直没有停歇。随着科技的进步,有越来越多的手段去探索无尽星空,射电望远镜就是其中之一。

中国在贵州建设有单口径最大的天眼射电望远镜,口径500米,能探索到130亿光年之外的遥远信息。与单个大口径对应的则是射电望远镜阵列。

无论是哪种方式,都是去采集来自宇宙天体发出的强与弱的电磁波信号,聆听来自宇宙的声音。

这些信号里不排除可能隐藏着外星生命发出来的信号。

如何识别出信号是否具备生命特征,美国天文学家构建了一个方程式,用于从信号中计算存在其它生命的可能性。

方程式整出来了,但要分析的电磁波信息数据太多,而且每天都在以海量的方式增加。如果构建单体的超级计算机,耗资极其巨大。

一般的政府很难承受这样的投资,也很难接受极其巨大的投资下去但数十年没有成果的局面。

尽管很难,世界上总会有狂想者和天才来推进。

在上世纪,伯克利大学想到了一个办法,开发出一个专用软件——伯克利开放式网络计算平台BOINC,利用社会上大量的个人计算机来进行开放计算和网格计算。并且还琢磨出一个巧妙模式来推广。

伯克利开放式网络计算平台(Berkeley Open Infrastructure for Network Computing,简称BOINC)是主流的分布式计算平台之一,由加州大学伯克利分校的电脑学系发展出来的分布式计算系统。它本身设计成用于SETI@home项目,但逐渐在其他领域包括数学医学天文学气象学等。BOINC现时旨在为各研究者提供汇集全球各地大量个人电脑的强大运算能力。直至2008年1月25日,BOINC在全世界有约549,000台活跃的主机并平均提供约852TeraFLOPS (TFLOPS)的运算能力。

百度百科

图片关键词

他们设计了一款很炫的屏幕保护程序,个人电脑安装这个屏幕保护程序后,一旦电脑进入空闲状态,便启动屏幕保护程序,后台连接服务器,获取拆小的数据块包,在本地进行分析计算并返回结果。当用户再次使用电脑时,屏保退出,计算终止,完全不影响个人电脑用户的使用,但却充分利用了这些个人电脑的算力来完成海量计算。

这个计划最早在伯克利大学的内网推行,随着互联网的普及,逐步扩展到全球。

在2013年的某一天,有233个国家,145万台机器同时在线,达到了668万亿次的浮点运算能力。

BOINC平台最早为支持“在家探索外星生命”计划而开发,发展到后来,逐渐演进成为主流的分布式计算平台,为众多的数学、物理、化学、生命科学、地球科学等学科类别的计划所使用。

故事讲到这,是不是觉得目前流行的家用无线路由器被聚合起来挖矿跟上述计划有点类似。

从经典经济学的角度,政府的核心职能是提供公共物品和公共服务,比如国防和公园。但实际并不仅如此,还会参与产业战略布局,甚至有时还会通过政策或补贴等方式直接介入到企业运作中。

中国地大物博,经济发展不平衡,资源分布不平衡,完全依赖市场经济并不能获得效率最大化。政府适当介入,以计划经济和市场经济的“混合经济”模式可以更好地推动国家更高效发展。

南水北调、西气东输是很好的例子。没有西气东输,这段时间湖南的大雪可能就会直接影响到当地居民的生活。

近期发改委、工信部、国家能源局联合发布通知,全面启动“东数西算”工程,在8个枢纽节点规划建设10个国家数据中心集群,也是同类性质。用西部丰富的土地资源、可再生能源来发展数据中心,承接东部算力需求的潜力,匹配不断加速的数字产业化进程。

工程刚启动,最先热闹的还是在股市,芯片、服务器、IDC等企业相关股票开始连续飙红。反倒是承接“东数西算”战略的核心主体电信运营商不温不火,还不如谷爱凌夺冠对中移动股价拉升的刺激大。

这也可以理解,毕竟要建大型、超大型数据中心,对芯片、服务器提供商是直接刺激,带来巨幅的增量市场空间。而对于运营商而言,先得重资产投入构建基础设施,然后再一步步通过产业渗透,获得相应的回报,回报周期长,回报率却难以预料,犹如5G的推出。

东数西算,看到是国家层面调配资源,看不到的是可能哪个产业因为这样的政策牵引而蓬勃兴起,比如自动驾驶。

数据中心的建设只是第一步,要将国家战略充分落地,有漫长的路得走。有些关键问题得琢磨,可能蕴藏着商机,也有可能问题突破后能在更大程度推进社会形态改变。

1.

如何考虑算力的一体化供给

算力的提供至少可以分为规模算力和零星算力两种提供方式。

图片关键词


运营商一直在全国范围规划部署建设一体化大数据中心体系,比如中国电信的2+4+31+X。除了运营商,像腾讯、阿里、华为、百度、UCLOUD等也均在全国大规模布局,部署的服务器超百万台。当然也有规模小一点的,比如东方国信也在建设数据中心,万台左右的规模。

这些大大小小的IDC,累加起来,提供的算力已然不小。但问题在于由不同企业提供的算力是割裂的,甚至于同一个运营商不同区域的IDC提供的算力也可能是割裂的。

对于算力消费方,不太容易根据自己不同的场景的要求(时延小、计算量大、性价比、安全能力等)灵活动态选择不同形态的算力提供方。算力消费方要么经过复杂对比后选择多个提供方来拼凑完整方案,并在后期投入繁琐的运营管理;要么牺牲性价比降低某方面的算力要求来单一选择某个算力提供方。

对于算力提供方,需要琢磨如何将自己的算力变现,以及更有价值的变现。这也并不容易,后续也有可能陷入增量不增收的局面。

除了规模算力之外,如何用共享经济的模式,搭建平台整合全社会的零星算力,这是算力供给的另一种模式。说不定某一天,冒出一家企业,成为“没有建设一个IDC,但却是全球最大的算力提供商”。

在电网系统,既有年发电量200亿千瓦时的葛洲坝巨型水电站发电入网,也有一些小规模年发电量百万千瓦时的民营水电站发电入网,此外现在也发展到家庭安装屋顶光伏,满足自用外,还可并入大网赚些小钱。

算力网其实也是一样,若有一个平台来聚合各形态算力,实现算力一体化供给。

聚合各形态算力并不简单,规模算力通常由大企业提供,具备云管平台,基于统一算力标识,可以相对方便接入算力大平台。但对于社会零星算力,则需要算力平台方提供手段,进行整合纳管。中国电信规划的云网操作系统,做针对性延展,或许可以来解决这个问题。

“在家探索外星生命”是一个很好的整合社会零星算力的案例。

2.

如何考虑算力的一体化服务

算力的消费,不用太关注算力提供方是谁,由算网平台方基于业务场景的诉求,智能扫描,找到最匹配且性价比最高的算力提供方来提供算力。

算力提供方对算力消费者是透明的。算力消费者不需要因为业务场景的复杂,而在不同算力提供方分别做算力订购、算力配置、算力计费、算力监控。

如果业务场景对性能、稳定性、能力要求高,需要涉及的维度就会更多,不仅仅是选择最匹配的算力提供,还得设计配置选择相匹配的网络链路,以保证端到端全程的指标要求。在这方面,运营商更具优势。

如果业务场景对实时性能、稳定性等要求不高的,只是需要较大算力时,则可以选择较低的资费方案,匹配调度经济算力。

一旦经济算力由分布式算力构成,对算网平台的架构和调度则有更高要求。

以BOINC平台为例,为了保证计算结果的正确,BOINC平台会将要分析的数据块包发送给多台计算机,只有在返回结果规范且关联结果是一致时,这个结果才会被确认。如果因为计算错误或者故意提交虚假数据,导致结果不一致,BOINC平台会发送给更多的计算机进行计算,直至达到设定的要求。

这中间涉及到设施层面的有在网算力、算力忙闲、算力调度,还有在应用层面的数据核准、数据汇聚、数据安全、异常调度、发散收敛。要考虑全面,以及灵活扩展,会非常复杂。

无论是一体化算力供给还是一体化算力服务,除了算力、网络,还需要有算网平台:

在算力侧,致力于更经济的手段提供更强大的算力;


在网络侧,用分层分级来保证不同场景下的消费方和提供方的链路匹配;


在平台侧,实现多态算力的有效整合、算力和网络的智能感知调配,以及聚合的设计与监控。


如果哪个运营商打造出来的算网平台,实现既整合规模算力和社会零星算力,又能对算网端到端全程智能感知调配,这个运营商或许能真正成为未来数字社会的核心主体,或许又能增加万亿市值。

官方微信公众号

浩鲸云计算科技股份有限公司 版权所有 2003-2022

苏ICP备10224443号-6