当前位置主页> 正文

透视中国超级计算机 首个“世界冠军” 天河一号

tebiebaodao 2010-12-20 22:41:06 (编辑组稿/王沫楠) 总第116期 放大 缩小

“中国速度”再次震惊世界:不久前,世界权威的国际TOP500组织在其网站上公布了全球超级计算机500强最新排行榜,中国自主研制的“天河一号”二期系统(TH—1A)跃居榜首,成为世界运算速度最快的超级计算机。

“超级计算机被誉为计算机中的珠穆朗玛峰,代表了一个国家计算机设计、制造和应用的最高水平。”“天河一号”工程办主任李楠研究员介绍说,TOP500排名榜目前由德国曼海姆大学、美国田纳西大学、美国能源研究科学计算中心(NERSC)、劳伦斯伯克利国家实验室联合举办,已成为衡量各国超级计算水平最重要的参考依据。

在这次TOP500榜单中,中国在前十中占有2席,仅次于美国;在前500强中,占了41席,总体占有率8.2%,位居第二。而在2009年11月的TOP500排名中,中国还只有21台,总体占有率4.2%,位列第五。这说明,中国的超级计算机研制水平在以较快的速度,整体赶超。

“从‘人有我无’的奋力追赶到今天登上世界超级计算技术巅峰,30年磨一剑,中国几代人‘超算’人的梦想终于成真。”在中国首台千万亿次计算机“天河一号”夺得第36届世界超级计算机500强排行榜“冠军”之际,国防科技大学校长张育林如是说。

一年内从世界第五到世界第一,“中国速度”怎样实现飞跃?“天河一号”又将为中国产业发展和国际超级计算业界带来什么样的变化?

“用中国人的方法造出千万亿次计算机”

每秒4701万亿次的峰值速度和每秒2566万亿次的实测速度,这是“天河一号”的“夺冠”成绩。从2009年9月诞生至今,“天河”的这两项速度分别提高了2.89倍和3.55倍。

在短短一年里,“天河一号”完成了一系列重大技术升级与综合优化,在大规模集成电路芯片、结点机、操作系统、编译系统等关键技术上成功升级,在基于高阶路由的高速互联通信、高性能虚拟计算域等方面取得新的突破,达到世界领先水平。

“研制一期系统的时候,我们并没有把‘十八般武艺’都用上。”“天河一号”常务副总设计师、国防科大计算机学院院长廖湘科说,“一期系统的主要任务是体系验证,看看用我们中国人的方法能不能造出一个可用的千万亿次机器。”

2006年出台的国家863计划“高效能计算机及网格服务环境”项目,制定了“先研制两台百万亿次机、再研制一台千万亿次机”的“两步走”战略。几乎是在中国著名计算机制造商曙光和联想公司开始研制“曙光5000A”和“深腾7000”百万亿次机的同时,国防科大启动了千万亿次超级计算机的技术预研。

从十万亿次到百万亿次是量的变化,千万亿次则到了质的变化,这是业界的共识。但,究竟采用一条什么样的不同于此前所有机器的技术路线?对于这一研制超级计算机的基础,业界意见不一。

在没有先例可循的路上艰难探索,国防科大人为“天河一号”设计出“CPU加GPU异构融合体系”。这是中国人独创的体系结构,是一条世界上全新的技术路线。

一年过去,因其低能耗、低成本、高集成度等优点,这种在“天河一号”上得到成功实践的结构已经成为国际主流。“中国创造”不仅催生了“中国速度”,也提升了“世界速度”:在最新国际TOP500排行榜的前10台计算机中,除了“天河一号”,中国的另一台千万亿次机“曙光星云”和位于第4名的日本TSUBAME超级计算机也采用了异构结构。而生产GPU的美国厂商NVIDIA公司,也因此身价大涨。

“这条路上,中国人在拉着世界往前走。”中国科学院软件所研究员张云泉说。

“向自主可控进军的步伐永远不停”

美国田纳西大学计算机专家杰克·邓格拉指出,“天河”的互联芯片完全是中国自主制造的,并且中国已经在研制自己的CPU了。

在国产化的道路上,“天河”人早已出发并且留下了坚实的足印。在使“天河一号”二期系统性能倍增的一系列新技术中,相当一部分来自国产。

随着国防科大自主研发的“飞腾1000”CPU装入二期系统,中国的超级计算机有了“中国芯”。

“一期系统使用国外进口CPU,主要是出于研制进度和成本方面的考虑。”“天河一号”总设计师、国防科大副校长杨学军说,自主CPU的成功研制和运用,为今后“天河”的全部国产化奠定了基础。

尽管目前的自主CPU与世界先进水平还有差距,杨学军透露说,国防科大正在研发中的新一代芯片又有新的技术“绝活”,性能将显著提升。

“中国人要有志气,虽然不能一下子超过人家,可以一点点地做得更好,最终实现全面超越。这是个水滴石穿的积累过程。”李楠说。

不同于其他超级计算机的“麒麟”操作系统,同样是“天河一号”的亮点。在中国超级计算机大多使用外国操作系统的境况下,这套由国防科大自主开发的操作系统以高安全性著称。

“大家使用‘天河一号’,就像到银行租个保险箱,钥匙和密码都在自己手上,其他用户甚至管理员都看不到。”“天河一号”主任设计师卢宇彤说。

卢宇彤同时表示,这套操作系统经过改造后完全可以用于个人电脑,而包括操作系统在内的自主产品,都有希望走向国际商业市场。

所有这些,指向中国超级计算机发展从起步时就清晰的一个目标:自主可控——只有拥有了自主可控的系统,才能不受制于人,才能确保信息安全。然而,这一领域的博弈到今天也没有结束。

这是中国超级计算机发展历程中并不陌生的一幕:中国一旦宣布成功研制某型计算机,西方立即会解除该型计算机的对华禁运,以此阻止中国的自主产品占领市场。

“无论市场如何变化,我们永远不会停止向自主可控进军的步伐。”张育林说。在2010年3月召开的“两会”上,作为全国人大代表的他提出了“大力打造自主可控信息系统”的建议。

“迈出这一步并不容易,做一个操作系统往往可能就需要上千人。舍不舍得花钱养这么多人,涉及国家战略。”国防科大原副校长齐治昌说,“中国只能走自主可控的路,越早走,越主动。”

“天河使用起来毫不逊色”

国家超级计算天津中心700多平方米的机房里,140个银灰色的机柜构成了“天河一号”二期。对于如此庞大的系统来说,稳定性尤为重要。

“几万个处理器集成在一个大计算机里工作,元器件固有的可靠性一定会随着数量的增加而下降。”李楠说。

如同所有刚刚“上路”的“新手”一样,“天河一号”也曾在试运行期间“状况”频频。

2010年7月,“磨合期”结束。在解决了各种“莫名其妙的问题”之后,系统正式上网投入使用。目前,“天河一号”已在石油勘探、高端装备制造、生物医药、动漫设计等方面为20多家用户提供了超级计算服务。

“天河是以云计算的方式把计算能力输送给各行各业,与全社会进行共享。用户终端小到笔记本、3G手机,都可以通过互联网享受服务。”国家超级计算天津中心副主任朱小谦介绍说,“天河一号”目前的主要服务对象是天津地区的国家战略性新兴产业,将来既可以进行科学计算,还可以实现信息检索、在线储存等功能。

天津国际生物医药联合研究院,就是其中的一家客户。

研究院院长助理徐峰介绍说,研发一种新药,平均要耗时10年,花费10亿美元,筛选10万个化合物,随之而来的还有初期巨额成本的投入。在“天河一号”上进行筛选仅一个星期,而普通计算机上需要运行一年。高性能计算机介入生物医药,将大幅度提高这个行业研发新药的效率,进而提升整个行业的水平,对医药行业产生革命性的影响。

最成功的应用案例,是中国科学院软件研究所完成的题目——“地球外核热流动数值模拟”。科学家们实现了此前从未尝试的600亿未知数的超大计算规模的数值模拟,而目前国际上同类问题的模拟现状一般为数十亿未知数水平。

在为“天河一号”给出的使用报告上,中科院的科学家们热情洋溢地写道:“系统与IBM蓝色基因等引以为傲的网络系统相比毫不逊色,结果达到了与世界同步的研究水平甚至有所超越。”

“能不能用好机器更重要”

4年前,当千万亿次超级计算机研发准备立项时,曾有过激烈的争论。

“一方面,我们能不能做出来?毕竟当时的技术水平是有限的。另一方面,即使做出来了,能不能用得上?因为当时也没有今天这么多的应用需求。”科技部高新技术与产业化司信息处处长强小哲回忆说。

然而,需求来得之快,超出了人们的预想。最繁忙时,“天河一号”全系统可用到80%。对于超级计算机的资源使用率来说,这个数字相当可观。在最新的TOP500排行榜上,中国科学界欣喜地发现,中国以41台机器的占有数量超过日本、法国、德国和英国,成为超级计算机的第二大使用国。

在建设创新型国家的进程中,超级计算机作为基础设施的作用日益凸现。能不能用好机器,成为一个比研制更重要的问题。

大型应用软件,是中国超级计算机事业的一块短板。

作为“天河一号”的研制方,国防科大还大力参与应用软件的开发。而这项工作的难度,并不小于机器的构建。

“软件不仅是技术,更是一种文化。WINDOWS操作系统的生态链非常丰富,为它开发软件的人很多,但我们的‘麒麟’系统还没有形成生态链。”廖湘科说。

他同时表示,“天河一号”虽然在运算速度上夺得世界第一,推广工作才刚刚起步,在应用方面赶超世界先进水平还有很长的路要走,在充分发挥系统并行计算能力、优化系统应用效率等方面同样面临许多挑战。

应对这些挑战的,是由200多名国防科大科研人员组成的“天河”团队。

“世界信息领域格局并未改变”

早在新一届排行榜出炉的几个月前,关于“天河一号”即将夺冠的传言四起。

业界和媒体很久没有如此兴奋了。自1993年开始发布全球最快的500台超级计算机名单以来,TOP500排行榜上的第一名、甚至前10名几乎都没有悬念地是美国机器。

这项全世界最具权威的超级计算机“比赛”,是由德国曼海姆大学、美国田纳西大学、美国能源研究科学计算中心及劳伦斯伯克利国家实验室联合举办的。位居排行榜前列的系统代表着超级计算的顶尖水平,引导超级计算技术的发展,并在很大程度上显示一个国家信息领域的科技创新能力和综合实力。

尽管中国方面此前一直在谨慎等待最终结果的正式发布,“天河一号”早已是国际传媒的焦点。《华尔街日报》引用美国计算机专家的话说:“这台机器毫无疑问是高性能计算领域的游戏规则改变者,这是一个转折,标志着经济竞争力从西方转向东方。”美国总统奥巴马也多次在不同场合提到“中国有了世界上最快的超级计算机”。

西方的反应并不意外。但,“游戏规则”真的改变了吗?

“就整体优势而言,第一梯队仍然是美国,我们只能说在第二梯队中占据了领先地位。”强小哲说。

“天河一号”副总设计师胡庆丰认为,中国的整体系统已经走向世界领先,但就包括基础芯片研制在内的高性能计算机完整产业链而言,中国正在通过自主创新逐步缩小差距。

张育林对此表示:“西方国家在信息技术领域的优势地位没有改变,美国在超级计算机研制和应用上的主导地位没有改变,世界各国在超级计算机领域加大竞争的态势没有改变。”

李楠说:“我们的机器能否拿第一其实并不是最重要的,我们希望通过智力和市场上的作为,在引领世界超级计算机发展中作出自己的贡献。”

 

【欢迎转载 请注明来源】

相关文章