“我过去有过幻想,我过去觉得基于X86和ARM不可能做自己的生态,但基于比较开放的指令系统,授权比较开放,比如说可以自己加指令,是可以做自己的生态的。但是这个幻想破灭了。”
2022年1月13日,对于龙芯中科来说是个大日子,首届LoongArch生态创新大会召开,龙芯中科首次正式和大家分享关于自主研发的信息技术体系发展的进展。会上龙芯中科携手众多合作伙伴发布基于LoongArch自主指令集的产品或解决方案,发布龙芯生态白皮书,并同步举行了吸引中小企业参与研发的龙芯创业者支持计划颁奖典礼。
14日中关村在线受邀来到龙芯产业园,与龙芯中科董事长胡伟武先生、龙芯中科副总裁张戈先生、龙芯中科龙芯实验室主任张福新先生一同进行了深度交流。
01构建安全可控的信息技术体系
目前大家常见的信息技术体系主要是由微软与英特尔一起构建Wintel体系,以及ARM与安卓构建的A-A体系,这两大体系几乎掌控了全球电子信息技术领域。这两大体系都扩展出了非常庞大的生态系统,电脑平台几乎全是Wintel体系的天下,移动设备A-A体系占据着至关重要的地位。我们常说社会规则把人分为规则制定者和规则服从者,谁制订规则谁就有话语权,能拿到更大的利益。

龙芯中科董事长胡伟武先生
大家已经有共识,在Wintel体系和A-A体系构建中国自主的信息技术体系是完全不可能的,但基于一些开源体系就可以了吗?
龙芯中科董事长胡伟武先生表示,“我过去有过幻想,我过去觉得基于X86和ARM不可能做自己的生态,但基于比较开放的指令系统,授权比较开放,比如说可以自己加指令,是可以做自己的生态的。但是这个幻想破灭了。”
虽然是所谓开源,但终归还是要有人管理的,如果是linux这样完全无序开源,那所有人都不能互相兼容,也就无法建立统一的生态,一旦涉及到管理,那就又会出现问题,龙芯曾经就是基于MIPS指令系统设计,但随着龙芯中科技术积累和发展的需要,产生新的需求,这个时候,即使是所谓开源也会产生大量的限制。
胡伟武先生举了个例子,“原来(使用开源指令集)虽然允许你加指令层,(一共)64个,只允许用4个,说是你可以自己加,但是是受限制的,现在我自己64个都是自己的,我现在只用到32个,后面还有32个可加。”
正因为这样,龙芯中科现在使用的是完全拥有独立自主的LoongArch指令集。胡伟武先生做了个比喻,设计芯片就像是住房子,你可以直接购买国外成熟的IP来组建自己的芯片,比如买ARM的IP授权,然后自己组建芯片,优点很多,性能强、生态完善、拿来就用,就跟租房子一样,但是你需要交高额租金,房间里的结构你基本上都不能动,甚至一些大件的家居你也没法换。房子还是别人的,随时都可以收回。
更进一步是用自主IP设计芯片,就像是龙芯中科之前用MIPS开源指令系统设计了自主的IP,进而打造出完整的芯片,一定程度上有自由度了,就像是买房子,里面所有的结构家居都可以自己改造,除了承重墙不能动,整体结构不能动之外,还涉及到其他邻居的地方你不能动,自由度相对来说比租房子高很多,但还是处处受限,有人可以制约你的发展。
龙芯中科的新路线是基于自主指令系统做芯片,从最底层的0和1指令都拥有“自由”,想做什么就做什么,想怎么改就怎么改。这就像是自己有一片地盖房子,想要什么样就盖什么样,是真正意义上的独立自主。
当然也不是说租房买房就是不对,也要根据实际需求来看,租房买房都很快捷,只要花钱马上就可以用,解决近在眼前的事情是很必要的,盖房子就需要有足够的能力,能力不够,盖不起来。
龙芯中科也是经过了20年的摸索,在无数的失败当中学会的。
02基于自主指令构建生态需要10个基础能力
胡伟武先生认为,技术创新其实远不是仅仅靠人力物力财力投入就可以迅速成就的,时间是除体制机制、人才、经费之外的第四大变量,之前已经做过很多的尝试,买产品、买技术、买专利,都有一定的效果但不能解决根本问题。一切可以缩短时间完成创新的方法都尝试过了,但始终没有完成真正意义上赶超国际水平,或许造芯片本身就不是一件容易的事情。
有钱就可以做的产品中国企业已经做透了;有钱+有手艺(人才)才能做的产品,目前正在大力发展;而信息技术体系与生态就像是养孩子,不仅要投入钱,教知识,还要投入时间等他长大。
经过20年的积累,龙芯中科现在拥有10个基础能力,其中包括两大核心软件:BIOS、操作系统内核(含驱动和虚拟化),三大编译器:GCC、LLVM、GOLANG,三大虚拟机:Java、JavaScript、.NET,两大二进制翻译系统:X86、ARM。胡伟武先生认为同时拥有这10个能力之后,才可以构建自主又兼容的的指令系统。
LoongArch指令系统拥有四大特点,先进性:吸收近年来指令集发展的先进技术成果,提高代码效率;兼容性:融合X86、ARM等的主要特点,高效支持二进制翻译;模块化:基础部分、二进制翻译、虚拟化、向量化;扩展性:指令槽留有余地,利于今后的持续演进。
03CPU性能补课完成,进入生态建设新阶段
在之前,龙芯处理器曾被人吐槽,虽然是自主性最高的,但也是性能最差的。不过正如中国工程院院士倪光南先生在首届LoongArch生态创新大会上说的那样:国产软硬件的发展过程一般要经历“不可用”-“可用”-“好用”三个阶段。
龙芯中科在之前的20年时间之中一直在努力“性能补课”,使用开源的生态努力完成设计能力的技术积累,龙芯中科董事长胡伟武先生对龙芯处理器的性能水平做了一个比喻,2013-2015年龙芯3A1000/3B1500系列处理器性能大约是市场主流水平的十分之一,属于基本可用的水平,大约相当于小学毕业;
2016-2018年3A/3B2000及3A/3B3000系列处理器基本上追上市面上最入门级产品的水平,大约相当于中学毕业;
2019-2021年之间的3A/3B4000和3A/3C5000已经可以逼近市场主流水平,进入到了好用的水准,大约相当于大学毕业了,已经可以应对绝大多数应用场景的性能需求了。
但其实龙芯目前刚刚进入到14nm工艺节点,距离7nm还有很远,我们都知道工艺升级可以大幅度提升性能水平,但另一个影响性能的决定性因素在于设计能力,龙芯可以用相对落后一些的工艺水平设计出逼近主流性能水平的龙芯3A/3C5000系列处理器,证明了在设计能力上,龙芯中科已经有了相当的积累。
预计在2022-2024年的3A/3C6000、3A/3C7000系列产品当中, 将会真正达到市场主流产品的性能水平,达到研究生毕业的好用。
胡伟武先生对此非常乐观,他表示“这么多年龙芯就是在骂声中长大的”,下一步就将会把一些龙芯中科的产品推向消费者市场,想买的人可以非常方便地在电商平台上买到它。“让他们骂嘛,总要先给他们东西他们才有的骂,被骂了才知道哪里需要改。”
在“十四五”期间,龙芯中科要努力完成“三个转变”,一是从技术“补课”到生态建设的转变,二是从政策性市场到开放市场的转变,三是从跟随性发展的“必然王国”到自主发展的“自由王国”的转变。
从龙芯中科首届LoongArch生态创新大会召开,就意味着发展进入了全新的阶段。
04优秀的生态是切合实际的
胡伟武先生表示,一个优秀的生态有三个主要特点。一是开放,越开放合作伙伴越多。二是兼容,把合作伙伴的工作形成合力。三是优化,通过系统优化而不仅仅是CPU升级来提高性能。龙芯中科将秉承上述开放、兼容、优化的理念与合作伙伴一起共建自主生态。
龙芯中科副总裁张戈先生
龙芯中科副总裁张戈先生介绍说,搭载龙芯处理器的产品目前已经由大量合作伙伴共同设计生产,已有近百家厂商推出了数百款基于LoongArch的龙芯桌面、服务器、网安、密码等产品,覆盖了党政、能源、交通、教育等多个行业,年出货量超百万片规模。
在农业银行,工商银行等金融行业已经完成了试点应用;电信领域在湖州移动营业厅、金华移动营业厅都接入了搭载龙芯芯片的电脑、打印机、叫号设备、身份证识别仪等产品。能源行业当中,龙芯在火电水电等系统之中已经开始试点应用,在输电、变电、配电等领域实现了批量应用。交通领域当中,高铁车载设备包括基于龙芯的人机交互DMI系统、车载网关、车载安全主控板、地面联锁安全计算机、安全计算机平台、车地统信系统等,地铁ATO自动驾驶系统之中的主控板、网络板、CAN板、通信盘、机车远程监控与诊断CMD系统等,公路交通ETC系统当中都有着龙芯芯片产品的应用。工业领域的工控设备、网安通信、密码安全等设备以及教育领域的教学平台、智慧教室之中都有龙芯芯片的应用。
张戈先生表示,龙芯中科从2020年开始牵头成立了龙芯生态适配服务产业联盟,目前已经有70余家适配中心和相关机构加入,形成了遍布全国的适配服务联动体系。后续龙芯会致力于在国际社区创立LoongArch分支,同时组建LoongArch联盟,把LoongArch指令集免费开放,联盟不光对指令集本身开放,也将对部分处理器的IP核实现代码也全部开放,以最大的开放程度来打造LoongArch生态联盟。
05LoongArch指令系统拥有强大实力
龙芯中科龙芯实验室主任张福新先生从专业技术的角度分享了LoongArch指令系统的优势所在,之前有网友质疑,LoongArch是不是和MIPS一样,张福新先生从跳转指令延迟槽、二进制程序接口、重定位机制、多线程机制系统态资源机制等多个角度分别论述了LoongArch指令系统的特殊性。同时LoongArch指令系统也通过了国内权威机构的知识产权评估,可以明确的说LoongArch是完全不同于MIPS的独立自主的指令系统。
LoongArch指令系统有着强大的实力,第一,更大的创新自由,不同于以往使用MIPS指令系统,现在的LoongArch拥有完全的创新自由,不受任何组织控制和限制,规避其他指令系统的风险,并且可以随时升级。面对当前体系结构发展的黄金时代,软件负载日趋多样化,指令集不断扩展,人工智能等领域的专用加速器涌现,都需要在最底层进行支持才能获得更高的效率。
第二,更高的性能,对比其他的指令系统,LoongArch执行同样的程序需要更少的动态指令数,运行效率更高,性能更强。
第三,高兼容性设计,LoongArch从指令集开始做的兼容性设计,可以对MIPS、ARM、X86等平台的应用程序实现高效率支持,目标要做到80%以上的运行效率,甚至超越其原有平台。
“有了‘自由’之后,就要用好它”,张福新先生这样总结。
06为人民做龙芯
面对“卡脖子”,我们其实都有不同程度地担忧,但胡伟武先生表示很有信心,目前的龙芯中科已经有了这样一支信仰坚定的队伍,他们知道龙芯是在为谁而做。胡伟武先生用毛主席的话来总结龙芯中科发展之路,“我们正在前进。我们正在做我们的前人从来没有做过的极其光荣伟大的事业。我们的目地一定要达到。我们的目地一定能够达到。”



