忽如一夜春风来,千树万树梨花开 —— 我看中国信创“根”社区的发展

忽如一夜春风来,千树万树梨花开  —— 我看中国信创“根”社区的发展

又是一年霜雪季。

前不久,我参加了 2021 信创 “大比武” 鲲鹏基础软件开发赛道总决赛的活动。在大赛上,我看到了诸多令人眼前一亮的作品,也见证了许许多多充满勃勃生机的年轻人付出的努力。

关于 2021 信创 “大比武” 鲲鹏基础软件开发赛道总决赛

这是一场由信息技术应用创新工作委员会指导,华为主办,重庆鲲鹏创新中心、北京鲲鹏联合创新中心、openEuler 开源社区、openGauss 开源社区及 openLookeng 开源社区共同承办的开源技术应用领域的全国性大赛。

我踟躇于紫荆盛开的树下,而此刻北方大地已是寒风凛冽,此情此景,我觉得颇类如今中国的开源基础软件领域的景象。遂写一篇小文,抒发一些管窥之见与诸位。

枝繁叶茂,如火如荼

三十年前,中国的计算机领域才刚刚起步,开始逐步往企业、民用领域扩展。作为从上世纪九十年代就接触到计算机的人,我几乎是经历了中国计算机行业、互联网空间从无到有,从小到大的主要过程。

在这三十年里,我们有了 10 亿网民,就连农村地区都有近 60% 的上网普及率。而在这两年全球疫情的严峻形势下,在线办公人数从去年的 2 亿人增加到将近 4 亿人,网络支付用户也在两年间增加了 2 亿人。(以上数据均参考自 CNNIC 发布的第 48 次《中国互联网络发展状况统计报告》)

不仅在互联网和计算机方面体量巨大,而且,我国在计算机高端领域也取得了不菲的成就。比如,我国正在建设的 两台量子计算机,其中 “祖冲之二号” 将比美国谷歌的 “悬铃木” 快 1000 万倍,而另外一台 “九章 2 号” 可以在一毫秒内计算出世界上最快的经典计算机需要 30 万亿年才能完成的任务。中国成为唯一在光量子和超导量子两条技术路线上实现 “量子计算优越性” 的国家。

无根之木,难以成林

但是就在这一片繁荣景象的背后,正因这两年世界局势的变化,也使人看到了一些长期以来被忽视的领域。

大家也都知道了,“芯片难” 的问题虽然是全球性的困难,但是更是中国的难题。在禁运的阴云下,我们才发现,在这个我们已经离不开计算机的互联网世代,它就像被白蚁噬食的华厦,其最基础的芯片、操作系统等根基岌岌可危。

固然,我们有海思麒麟这样优秀的半导体设计企业,但是我们却缺乏能将其生产出来的完整半导体产业链。

固然,我们有数亿台计算机和更多的移动终端,然而上面跑着的各种操作系统,更不用说桌面操作系统了,却都是微软和苹果公司的天下,就连服务器领域广泛使用的开源操作系统 Linux,我们也大多只是拿来使用,而不能形成独立自主的整个生态

固然,我们有庞大的数据库,但是就在当下,我们还有很多政企采购只能定向采购 Oracle 这样的国外企业的产品,而且,不可替代、不可迁移!

固然,我们有充沛的工业生产能力,但是我们的工业企业却只能使用进口的工业设计软件来设计这些产品。

固然,我们有很多投身于计算机研究的专家,但是在计算机理论的前沿研究方面取得举世瞩目的成就还寥寥无几。

一夜春风,花发几枝

前几年,我曾经去过美国、日本和新加坡,也曾去过港台等地。在这些曾经被认为发达的地方,我惊奇的发现,原来他们的网上购物不如我们的便捷、他们的支付居然大多是刷卡甚至现金,他们的脸书、推特也不过尔尔。和很多人一样,我也曾盲目地认为我们在某些互联网和计算机技术方面已经超过他们了。

但是,就像前面说的,我们在 “引擎盖下” 的基础领域还有很多欠缺之处。也正是这两年,让我们逐渐清醒地看到我们的基础产业还需要夯实和再造,我们的基础设施还需要重新审视。

可能,这两年你偶尔会听说一个词 “信创”,也听说了国家将 “开源”、“基础软件” 等写入到了《“十四五” 规划纲要》。不经意间,这两年已经有很多初看并不起眼的事情在发生。

比如说芯片,两年前,华为提出了“鲲鹏+昇腾”双引擎战略,将华为历时 15 年,投入超过 2 万名工程师,打造的以 “鲲鹏+昇腾” 为核心的基础芯片族作为引擎,开放给各行各业。随着时间的推移,如今,已经有超过一万个企业级应用已经迁移到鲲鹏架构,在鲲鹏架构上开枝散叶。

再比如说基础软件,同样是两年前,华为密集宣布了 openEuler、openGauss、openLooKeng 等一系列基础开源软件项目,囊括了操作系统、数据库、大数据等基础软件领域

现在,新近捐增给了开放原子开源基金会的 openEuler 开源操作系统,它已经拥有了包括统信、SUSE、麒麟等 10 个 OSV 开发的商用发行版,累计商用达到了 30 万套,并广泛应用于政府、金融、电信、能源等行业。而 openEuler 社区也已经成长为拥有几十万社区用户、七千余贡献者、近百个 SIG 的中国发展最迅猛的开源 “根” 社区之一。

应用于大并发、大数据量、联机事务处理场景的电商、金融、O2O、电信等应用的 openGauss 数据库,同样也有十余家商用发行版,已经实现在金融、政府、电力、制造等行业的规模化应用。openGauss 社区,也从无到有地成为墨天轮排行榜前二的开源数据库社区。

而在这些社区中也涌现出了不少优秀贡献者和项目。比如,在近日的 2021 信创 “大比武” 鲲鹏基础软件开发赛道总决赛中,就出现了不少令人眼前一亮的项目。自开赛以来,来自各行业近百家企业以及高校的 300 余位开发者参与了比赛,产生了数百个优秀作品。这其中,来自 openGauss 赛题的华夏银行基础技术研究团队凭借作品 Hermes 荣获金奖;来自 openEuler 赛题的数硕云澈基础设施团队和统信云原生团队获得了银奖。

金奖得主的作品 Hermes 是一套可以全面收集 openGauss 数据库监控指标的开源项目,采用 Java 实现,充分利用了 openGauss 数据库已有的监控指标,其易于扩展,平台无关等特性值得称道。

而银奖之一的统信的云原生底座对现在主流的云原生技术做了抽象封装,使之可在标准的基线仓库上做适配。这样可以保证底层软件包经过了完整测试,极大减少了适配工作。对于用户在云平台上部署和适配产品提供了很大帮助。

沐雪沥冰,百花始开

国家提出的 “信创” 产业是为了打造自己的具有自主创新的信息产业,而面对需要投入浩繁人力、天量资金和无数心血的基础软件领域,远非一家或几家企业就能全盘完成的。这就需要更多的力量共同合力攻关、突破技术问题、建设丰富互补的生态。

其中,重中之重便是计算机系统的内核和基石 —— 操作系统。操作系统的发展,将会直接决定数字基础设施的发展水平。建设操作系统的 “根” 社区,有助于凝聚整个操作系统领域所有企业和个人的力量,共同建设一款操作系统,构筑稳固的操作系统基石。

而在此基础上,通过开源、开放的方式构建的合作与协作是发展壮大的必由之路。开源项目最大的优势便是包容性强,无论你是一个优秀的技术开发者,还是一个专精于交付和后续维护的服务提供商,都可以在开源社区当中找到自己的位置,并基于开源社区的产物贡献自己的价值。相比于传统的协作模式,开源 “根” 社区的方式,能够最大范围、最高效的盘活资源,将技术与商业、技术与人才等不同形态的资源进行打通,形成良性的互动与循环。

道阻且长,埋头耕耘

当然,两年时间对于需要经年打磨的基础软件领域来说,还太短暂,虽然这些基础软件事实上已经在 “土下孕育” 发展了更长时间。

作为一个第三方观察者,我也发现了其中一些亟待努力的方面:

其实,openEuler 社区和 openGauss 社区已经是我所仅见的发展迅猛的中国开源社区了。但是这辆奔行迅猛的列车,到了需要瞭望更远处风景的时刻。 openEuler 和 openGauss,在国内的影响力日渐深远,但是在国际上、在整个开源世界,还没有形成足够的传播和号召力。举例说,同样可以作为 CentOS 的优秀替代品, openEuler 在全球开源社区的声量就不如 Alma Linux 和 Rocky Linux,而我相信, openEuler 的品质决不会逊色于它们。

另外,IBM 旗下的红帽 Linux 在某种程度上引领着 Linux 操作系统的发展技术前沿,从 Fedora、CentOS Stream、RHEL,如同滚滚洪流,带来了一代代新的 Linux 技术创新,而相比之下, openEuler 开源操作系统的创新则还比较偏于某些特定领域。

再比如,谷歌、MIT 等公司和高校出版的一篇篇论文从理论上引导了数据库技术的发展,而国内的数据库技术发展在开创性的理论研究方面比之尚显逊色。

当然,作为批评者动嘴自然轻松,而这些地方每一个进步都需要真正在其中贡献的人付出莫大的努力

我曾经拜访过华为操作系统实验室的几位专家,对他们在某个领域独到的研究深表钦佩。我也感叹于在我们所感受到的技术进步的背后,都来源于这些研究人员所做的无数个一点点改进。

而 openGauss 数据库也在国际领先的数据技术理论方面做了大量实践,在开源数据库“根”技术方面,内核持续突破,已经在数据库方面进入领先水平。

现在,这几个专注于基础设施的 “根” 软件、“根” 社区,就如同是为一棵大树培下的沃土,不起眼,但是来年开春,繁枝浓叶的中国 “信创” 大树将深植于此。

独立风中,火树银花

从世纪初到现在,中国信息产业已经获得了极大的发展。不经意间,我们的生活已经被现代信息技术浸透。而现在,是时候让这棵撑起信息社会的大树扎根百丈,荫蔽万里了。

我期许这些深入土壤的 “根” 能育出一棵独立自主、筑巢引凤的大树,独立于风中,绽开一树繁花。