官方服务微信:dat818 购买与出租对接

2018世界大学生超级计算机竞赛现场:清华大学学生李北辰团队挑战前沿科技

2万

主题

2

回帖

6万

积分

管理员

积分
62067
发表于 7 小时前 | 显示全部楼层 |阅读模式
    (原创)

    赛场一片沉寂,只有呼呼的风扇声。在场的上百名大学生紧盯着电脑,他们的手指飞快地敲击着键盘。

    这群大学生平均年龄还不到 22 岁。他们面对的是当下最为前沿的研究,其中包括机器阅读理解。还有获 2017 年诺贝尔化学奖的冷冻电镜技术。以及美国国家航空航天局(NASA)的流体力学模拟软件等等。

    面对大量的数据,清华大学的大四学生李北辰经过估算后决定对方案进行调整,因为他觉得几乎不可能跑完。临近结束的时候,他甚至能够清晰地听到自己的心脏在“咚咚”地跳动。

    这是 2018 年世界大学生超级计算机竞赛(ASC18)的现场。在规定的 2 天 20 小时时间内,每个队伍都要自行搭建小型超级计算机。并且要完成组委会布置的 4 道题目。运算的结果将会作为最后成绩的评分依据。

    李北辰队伍搭建的机器运算能力,大概是 1 万台现在市面上主流家用电脑运算能力的总和。然而,与目前世界上最快的超级计算机“神威·太湖之光”相比,他们的算力还不足其百分之一。

    超级计算机在几个国家的超级计算中心里日夜运行着。全国各地发来的运算指令在这些超级计算机中运行着。无论是天文观测的需求,还是航空模拟计算的需求;无论是天气预报的需求,还是生物医疗等日常生活的需求,都需要超级计算机来提供支撑。

    超级计算机的研究水平对一个国家的尖端科研实力有着决定性作用。拿天气预报来说,倘若计算明天天气需要超过一天的时间,那么这个预报就没有任何意义了。国家超级计算济南中心主任张云泉向中国青年报·中青在线记者透露了这一情况。当前,在中、美、日、俄等国大力投入高性能超级计算机研究的背后,实际上是一场抢占科研制高点的竞赛。

    1后面17个0

    这是一个以万亿为计量单位的世界。

    在超级计算机领域存在一份世界 500 强榜单。从最新的排名情况来看,倘若一台机器的运算能力未达到 500 万亿次每秒,那么它就会被毫不留情地“除名”。衡量超级计算机的标准较为直接且简单:只要运算能力够快就行。

    上一代超级计算机所采用的架构和目前主流的架构不一样。如今的技术在未来有可能会被量子计算机所替代。

    这份榜单每半年更新一次,总是能引发全世界的关注。人们对冠军的更替津津乐道。哪个国家的超级计算机上榜最多、总算力最高这一情况,还被美国总统写进了国情咨文。

    2013年至今,中国自主研发的超级计算机就一直稳坐榜首。

    最近两年,这个位置被“神威·太湖之光”占据。它的峰值运算速度极为惊人,达到每秒 12.5 亿亿次,也就是“1”后面有 17 个“0”。这大致相当于 200 万台普通电脑同时运行的运算能力。

    它不仅仅只是堆积用于运算的中央处理器(CPU)以及图形处理器(GPU)。 它的内涵远非仅仅是这些部件的简单堆积。 它远不是单纯地堆积用于运算的中央处理器(CPU)和图形处理器(GPU)而已。 它的意义远超过只是堆积用于运算的中央处理器(CPU)和图形处理器(GPU)。 它绝不是仅仅将用于运算的中央处理器(CPU)和图形处理器(GPU)进行堆积。

    张云泉向记者表明,超级计算机的运算速度并非遵循“1+1=2”的公式,需考虑它们之间工作分配以及数据传输的损耗。这就如同领导 10 个人与领导 1000 个人存在区别,倘若不能进行合理管理,那么每个人的工作效率都会显著降低,也就是说每个 CPU 和 GPU 的性能都未能得到充分发挥。

   


    “神威·蓝光”超级计算机的黑色机箱在国家超级计算济南中心紧密排布,围成一个大圈,它被小心地安置在数百平方米的一楼大厅内。

    这台研发费用达数亿元的机器运转时,其功耗为 1 兆瓦。1.5 万户家庭的家电功率总和大致与此相当。每年仅电费这一项的支出就接近 2000 万元人民币。

    国家超级计算中心的投入较为庞大,而李北辰参加的 ACS18 要求机器总功耗需在 3000 瓦以内。这就表明能够使用的 CPU 和 GPU 的数量存在一个上限。

    他们需要精打细算以最大化利用它们的运算能力。一方面要仔细分配每个节点的运算内容,另一方面要简化复杂的运算,使每个节点能同时计算尽可能多的内容。

    在这次比赛里,他们队伍运用了 16 块 GPU,其总价值超出 60 万元人民币。为了对风险进行分摊,几位队员各自负责几块。他们小心翼翼地把这些宝贝从学校的实验室搬运到比赛现场。赛前,场地上布满了选手,大家都在紧张地进行设备的安装和调试。

    租用超算一天,花费上万元

    比赛开始不久后,参赛选手开始冒汗。一方面是心理因素,另一方面是现场设备高速运转时会释放大量热量,队员戏称那热量能“摊鸡蛋”。每个 GPU 都得配备降温风扇,不然就会因温度过高而停止运行。

    超级计算机面临一个发展瓶颈,那就是如何有效地带走其“大脑”思考时散发的热量。在国家超级计算广州中心,工程师特地建造了冷水厂,并且让其不间断地运送 8 摄氏度的水进入“天河二号”的水冷系统。

    机房安排人员进行 24 小时值班。人员负责监控机器的运转状况。人员还负责清理垃圾进程。这样做可以实现效率的最大化。张云泉说,是机器就有损坏和出问题的概率,怎样让机器出问题的影响尽可能小也是一门学问。

    李北辰曾参与另一场大学生超算竞赛,这场竞赛需要 48 小时持续进行,他和队员只能依次轮流睡觉,以此来确保始终有人时刻留意着机器的运行情况。并且,组委会还会随机对赛场实施断电操作,以此来考查程序能够及时进行备份的能力。在实际的应用过程中,这些情况都是极其有可能会出现的挑战。

    中山大学肿瘤防治中心的博士后赵齐对此感受深刻。他所在的团队是最早利用“天河二号”来测试生物应用的团队之一。由于需要对大量的生物基因组数据进行处理,所以他们从 2012 年开始便使用超级计算机。

    他向记者讲述,他曾经遭遇过各式各样稀奇古怪的报错情况以及任务丢失的状况。环境的配置还会时不时地出现问题,并且常常会算出一些连他自己都感到难以置信的结果。

    生物信息领域在超级计算机上的应用处于起步阶段,成熟的软件数量不多,很多情况下都需要用户与超算中心的工作人员合作来开发以解决问题。

    过去 5 年,仅他一人就借助“天河二号”处理了 100TB 以上的数据。超级计算机能够在几天或者几小时内,完成一般计算机半年甚至几年才能完成的工作。之前,等待运算结果是他最为苦闷的时刻,“使用上超级计算机就如同迈入了小康生活。”

    由于需要处理的数据量较大,且网络传输速度较慢,所以赵齐有时会选择邮寄硬盘这种方式,他认为“邮递员最快”。

    这样的代价是比较高的。赵齐所在的实验室每年在数据存储方面所消耗的钱大约为 5 万元。租用超级计算机来进行数据处理,有时候一天就需要花费上万元。

    多数用户使用超级计算机和自己的电脑没区别,只需登录账号,上传数据,运算在千里之外进行。

    超算世界500强前两名是中国

    你拿起智能手机后,向语音助手询问天气。在这之后,远在美国的超级计算机能够在不到 1 秒的时间内理解你的意思。而甜美的女声播报出的结果,是由济南、广州、无锡等多地的超级计算机一同计算得出的。

   


    很多影视公司借助它来进行后期特效处理,传统制造业也依靠这个技术,有部分公司的洗衣液瓶子是由超级计算机设计出来的。

    研究者借助超级计算机,能够模拟出人类器官对药物的反应,这样就大大缩短了新药的研发时间,也节省了成本。在对抗埃博拉病毒药物的筛选过程中,超级计算机一天内就可以完成超过 4000 万分子化合物的筛选,从而以最快的速度来应对爆发性的恶性传染病。

    此外,美国研究核武器的方式之一是使用超级计算机进行核爆炸模拟。

    过去,超级计算机的主要任务在于进行科学计算。最近几年,有关人工智能的运算方面的请求也呈现出越来越多的态势。

    为此,ASC 竞赛开始引入人工智能的相关问题。李北辰进行了一个比方,他说过去他们的工作与计算式子的结果相似,然而现在,他们的工作更像是在做应用题。具体来说,他们需要先读懂问题,接着从问题中抽象出式子,然后再进行计算。

    目前,“天河二号”的用户数量已经超过 1200 家。这些用户涵盖了各大高校以及研究所。同时,“天河二号”还支撑了超过 400 项国家级课题。

    2001 年,在超级计算机 500 强名单里,没有一台是来自中国的。如今,榜单的前两名都被中国所占据。并且,中国的上榜数量为 204 ,而排名第二的美国仅有 143 。

    2015 年,美国开始对中国超级计算机领域实施芯片禁运。在此之前,美国对中国出口超级计算机存在诸多限制,比如出售的机器性能不能比中国自己能够研发的机器性能更高。

    张云泉向记者告知,我国已然掌握了超级计算机的制造技术。其中涵盖了“神威·太湖之光”以及“神威·蓝光”等一系列的设备。从芯片方面来看,从操作系统到冷却系统,这些都完全是由我国自主进行研发的。

    中国在硬件条件方面取得了领先地位。然而,在软件方面还需要投入大量的资金。目前,应用于超级计算机的商用软件,几乎都是由美国、日本等国开发的。而中国在这方面的市场占有率几乎为零。

    应用于超算的生物信息学软件开发存在很大困难。赵齐感叹道,人才缺口较为显著。在他所在的专业领域,有许多人都不再使用“天河二号”,原因是学习以及沟通的成本过高。他认为,超算中心应当开展更多关于超算技术的科普工作和培训活动。

    在计算机科学领域,超级计算机并非是热门的方向。在李北辰的同学当中,每年仅有约 10%的同学对这个方向怀有兴趣,而大多数人依然投身于人工智能的研究。

    张云泉认为,解决软件问题需要政策和财政两方面给予支持。西方国家在超算领域通常会制订 10 到 20 年的计划,其背后带有一点军备竞赛的意味。然而,中国一直是制订 5 年计划,在完成当前 5 年计划后才会讨论下一个 5 年是否继续。这样的规划不够长远,并且使得技术团队难以保持稳定。

    他介绍说,我国在超级计算机领域研究的总投入和美国相差不多。然而,我国在软件方面的投入比较低,当下仅占总投入的 20%。他觉得,这个比例最好能达到 50%,并且美国和日本也是这个比例。

    美国对超级计算机的研究历经超过 50 年之久,而我国仅仅 30 年。张云泉表示,我们需要多一些耐心。过去我们处于跟在别人后面跑的状态,那时只专注于追赶。如今我们实现了超前,应当看清前进的方向,这比追赶要花费更多的功夫。

    我们站立的地方是我们的中国。我们的网络空间应当是阳光理性的。青年怎样,中国便怎样。你光明,网络就不黑暗。希望青音朗朗,能折射出时代进步的光。我是中国好网民,要让网络空间清朗,看我们青年的力量!
您需要登录后才可以回帖 登录 | 立即注册

Archiver|手机版|小黑屋|关于我们

Copyright © 2001-2025, Tencent Cloud.    Powered by Discuz! X3.5    京ICP备20013102号-30

违法和不良信息举报电话:86-13718795856 举报邮箱:hwtx2020@163.com

GMT+8, 2025-3-10 10:56 , Processed in 0.085377 second(s), 17 queries .