计算机从未到达的地方 - 彭博社
bloomberg
波音公司的工程师们可以使用世界上最快的超级计算机。例如,他们的900万美元的Cray Research Inc. Y-MP每秒可以进行13亿次计算。但这足够满足他们的需求吗?不。
当然,他们可以使用Cray来模拟未来大型喷气机机翼上的气流。但为什么止步于此呢?为什么不模拟整个飞机周围的气流,并计算机翼、尾翼和机身在超音速下的表现呢?如果有足够的处理能力,波音工程师最终可能能够告诉计算机他们希望飞机有多大,必须飞多远,以及燃油经济性应该是多少。最终,计算机可能会自己设计整个飞机。“我们想去没有人去过的地方。这是老版《星际迷航》的理念,”波音高速计算机程序经理肯尼斯·W·尼维斯说。“但我们需要宇宙飞船。”
在浮点运算方面的顶尖表现。别担心,它正在路上。它被称为teraflops计算机,每秒将处理惊人的1万亿次算术运算——比今天最快的机器提供的功率多出50倍以上,价格大致相同。它将在一秒钟内完成一个人用手持计算器每秒进行一次计算所需的工作,24小时不间断,365天,一共31,709年。这样的计算机将使研究人员能够处理几年前看似不可能的工作。例如,它可以评估未来100年的全球气候变化,或者利用量子力学来提高汽车的燃油效率。
然而,teraflops计算机不仅因其将要完成的工作而具有历史意义,还因其工作方式而具有历史意义。它将不再像几乎所有计算机现在操作的那样,通过单个中央电路逐个处理数据块,而是利用数百、数千甚至数万个强大的微处理器的力量——就像将一栋大型办公楼中的所有个人电脑放入一个盒子中,将它们通过微型网络连接在一起,并编程使它们在一个单一问题上协作。正如12个饥饿的人可以比一个贪婪的食客更快地吃完一盒甜甜圈一样,微处理器的团队可以在传统大型计算机的时间的一小部分内完成许多工作。
这种被称为大规模并行处理(MPP)的革命性设计,最终可能成为构建大型计算机的标准方式。目前,MPP在科学工作中取得了早期成功,而在过去近20年里,Cray和其他超级计算机一直占据主导地位。但随着更复杂的软件的到来,这些机器也可能在商业数据处理方面开辟出一席之地。例如,今年,Teradata公司将出售约3亿美元的专用MPP设备,用于在IBM和Unisys公司最大的主机无法处理的庞大商业数据中寻找模式。
MPP技术实际上标志着微处理器在计算机硬件全谱系中令人惊叹的横扫的最后阶段。自1970年代初作为一种仅用于控制交通信号灯等简单设备出现以来,微处理器在1980年代中期已开始取代整个小型计算机。现在,微处理器以大量聚集的方式,准备从根本上重写IBM和Cray Research主导的520亿美元主机和超级计算机市场的经济学。虽然英特尔、思维机器和nCube等公司瞄准这两家公司的市场,但AT&T的NCR即将推出一款通用版本的Teradata机器,专门针对主机进行攻击。同时,数据库软件公司Oracle公司正在为商业MMP机器开发软件。
COOKIE-CUTTING。没有人预测主机或超级计算机会立即消亡:它们运行着太多有用的软件,无法被抛弃。但MPP硬件的经济学每天都变得更加引人注目:基于专有设计的旧式机器无法触及微处理器巨大的制造规模经济。这些芯片每年像成千上万的饼干一样被生产出来。此外,使用一种称为精简指令集计算(RISC)的技术,微处理器的原始数据处理速度与传统大型处理器的速度相差无几。而且,看起来微处理器将在本十年剩余时间内每两到三年速度翻一番。
尽管经过多年的研究,将大量处理器协同解决单一问题仍然非常困难。到目前为止,研究人员仅识别出少数几类可以轻松拆分成多个部分并在多个处理器上比在单个处理器上运行得更快的工作。关键是使这些部分尽可能独立,以免浪费时间在数据传递上。因此,大多数MPP软件必须从头开始逐行编写,并由专家完成——这对投资数十亿美元于传统软件的公司来说是一项耗时且昂贵的提议。科宁公司的工程研究员迈克尔·泰特表示,MPP计算机“距离大规模实用还有几年。”
即便如此,负责跟踪超级计算机的美国商务部的乔纳森·P·斯特里特表示,“这个领域无疑已经从‘如果’演变为‘何时’。”目前,市场非常小:市场研究公司Smaby Group估计1991年全球MPP超级计算机的销售额为2.7亿美元,这只是220亿美元超级计算机总支出的一个小部分(图表)。但预计到1994年,MPP收入将以每年40%的速度增长,许多美国和欧洲的公司正在争相在市场中占据一席之地(表格)。
尽管MPP市场规模小,但却处于动荡之中。没有一种连接一堆微处理器的方式被认为是最具技术吸引力的设计。这意味着软件公司和客户都不确定应该押注于哪种技术。与此同时,新联盟似乎每周都会出现。虽然一些成熟的计算机公司自己在研究MPP,但他们也在争相与积极的初创公司建立联系。数字设备公司在加利福尼亚州圣尼古拉斯的MasPar计算机公司中拥有投资股份。IBM最近与Thinking Machines公司成立了合资企业,将后者的连接机器与IBM市场领先的主机连接起来。而日本公司现在正在政府赞助的现实世界计算项目中共同努力,开发MPP和其他技术。
富有的叔叔。MPP竞赛也出现了一些早期退赛者,包括Bolt Beranek & Newman、Floating Point Systems、Myrias和Teraplex。大多数公司无法筹集到在技术快速变化、短期回报极小的市场中生存所需的资金。BBN的高级计算子公司总裁Ben Barker表示,开发一个新的MPP设计可能轻松花费5000万美元。BBN的努力集中在一台名为Butterfly Machine的计算机上,损失了大约这么多,并未获得外部融资。“唯一能成功的人是那些有富有叔叔的人,”Barker说。最富有的那个是山姆大叔。自1980年代初“星球大战”战略防御倡议开始以来,五角大楼的国防高级研究计划局(DARPA)一直在为MPP研究注入资金。自1983年以来,DARPA在并行计算方面投资超过2亿美元。SDI项目又贡献了数千万美元。“高性能计算在21世纪对我们的国防至关重要,因此我们最好确保有一个技术基础,”DARPA计算系统技术主任Stephen Squires说。
政府在这个新兴市场中的角色颇具争议。由于DARPA将其部分MPP预算用于直接公司拨款,一些公司抱怨五角大楼在挑选MPP的赢家和输家。Thinking Machines和英特尔超级计算机(英特尔公司的一个部门)是五角大楼慷慨资助的两个主要受益者。它们在科学MPP市场中也占据了最大的份额。“这让我们失去了很多销售机会,”MPP制造商nCube Inc.的首席执行官Stephen Colley抱怨道。
抛开政治不谈,MPP正在彻底改变政府和私营行业解决从亚原子到星际问题的方式。以全球气候建模为例。科学家们定期模拟地球的气候模式,以预测污染物对臭氧层、全球变暖模式和酸雨水平的影响。然而,今天的模拟仅能准确预测未来十年的情况,这还不够。洛斯阿拉莫斯国家实验室的物理学家兼高级计算副主任大卫·W·福斯伦表示:“污染物在10年内可能不会造成太大影响,但在一个世纪内可能会产生相当大的影响。”
这就是为什么阿贡国家实验室的研究员里克·L·史蒂文斯正在进行一个100年的气候模拟,以绘制海洋和空气流动的相互作用。“我们想要解决的问题远远超出了今天计算机的能力,”史蒂文斯说。控制污染“需要相当大程度的合作,来自一个重要的群体。这些模拟是唯一能够非常有信心地说明公共政策后果的方法,”克雷研究公司的并行处理应用程序主任史蒂文·A·沃克说。
‘变得更便宜。’最终,teraflops计算机可能还会帮助捕捉能源的圣杯——受控核聚变。研究人员希望花费数十亿建造反应堆,以测试他们在这一领域的最新理论。teraflops可以通过模拟帮助提前识别最佳设计。“在我们花费数十亿之前,我们会对这个东西实际上能否工作有一些信心,”洛斯阿拉莫斯的福斯伦说。
泰拉浮动速度也可以帮助科学家计算毒素对人类的影响。如今的超级计算机可以模拟分子相互作用,但仅限于相对简单的分子。“像二恶英这样的毒素往往是更大、更复杂的分子,”阿贡实验室的史蒂文斯说。
MPP系统也在帮助企业。石油公司,传统上是超级计算机的大用户,正在转向MPP来分析地震数据。阿科的研究科学家查尔斯·C·莫舍说:“大规模并行计算便宜且越来越便宜。大型机和传统超级计算机的性能基本保持平稳。我不得不问自己:我想使用哪一种?”他现在使用英特尔iPSC/860来创建地质特征和油藏的三维图像。nCube计算机在壳牌石油公司也在做同样的事情。
不过,MPP的重大收益可能是在数据处理的平凡世界中获得的,在那里,企业使用大量大型机来处理工资支票等事务。到目前为止,管理大型数据库似乎为新计算机提供了最佳机会。这是因为,随着公司安装成千上万的桌面和手持计算机,它们积累的数据远远超过其大型机能够处理的量。但所有这些数据中的隐藏模式可能会带来更大的利润。
折扣零售商Kmart、沃尔玛和Mervyn’s,以及AT&T和其他电话公司,已经使用Teradata的MPP计算机多年。利用数百个英特尔486微处理器,Teradata机器可以在几个小时内识别瞬息万变的销售模式——而传统大型机可能需要几天时间。每天对哪些颜色和款式销售最佳的快速反馈帮助Mervyn’s,例如,从远东供应商那里订购服装。
如此超快速的数据搜索最终可能形成高管套房的“决策支持中心”的基础。商业研究院正在开发这样一个系统,让高管能够调用文本、数字、照片、地图,甚至视频片段——所有这些都连接到一个MPP数据库计算机上。
软件迷宫。最终,MPP机器也可能为计算机的构建方式增加极大的灵活性。可以想象,从桌面工作站到超级计算机的机器都可以由多个单一处理元素构建。这将意味着更低的制造成本和更大的灵活性,客户可以现在安装合适大小的计算机,并在未来进行扩展。
目前大部分只是谈论,原因有二:销售额微乎其微以及令人畏惧的软件问题。迄今为止,大多数MPP机器用于研究,而不是为了赚钱。例如,卡内基梅隆大学的罗伯特·舒马赫正在使用连接机器研究乐器的物理学。
在它们变得更易于编程之前,这些机器的唯一商业用途将是在特殊情况下——潜在收益足以克服创建软件的高成本。最近的两个例子:美国运通计划使用两台Thinking Machines CM-5计算机筛选信用卡记录,识别其个别客户的购买模式。而保诚证券公司则使用一台英特尔MPP机器来评估金融工具。
与此同时,针对软件问题的强烈努力正在进行。目前为止,只取得了渐进式的进展。在让100个,更不用说10,000个,不同处理器和谐工作这一极其复杂的问题上,没有迹象表明会有重大突破。大多数MPP程序的运行只能通过繁琐的反复试验来实现。但正如加州理工学院并行超级计算联盟的执行董事保罗·梅西纳所说:“普通用户并没有那么受虐。”
阿伯拉罕·佩莱德(Abraham Peled),IBM计算机科学研究的主任表示,能做的最好事情就是创建标准和更好的MPP编程工具——旨在帮助软件开发者跟踪无数细节并识别瓶颈的程序。“人们的直觉并没有为这种编程发展起来,”佩莱德说。与此同时,MPP硬件制造商正在大量投资,以为他们的机器编写有用的软件。以MasPar为例,它将75%的开发成本用于软件。
尽管如此,今天软件的问题并没有阻止计算机设计师勾勒出更大规模的并行机器。日本的真实世界计算项目谈到创建一台拥有100万处理器的机器,其理论峰值速度为每秒125万亿次操作——足以让你和你的计算器忙碌约400万年。
大规模并行人群
同步机器
一些并行超级计算机的多个处理器以同步方式工作,
每个处理器在同一时间做完全相同的事情,但处理不同的数据。
制造商:主动内存技术(Active Memory Technology)、MasPar计算机、思维机器(Thinking Machines)和波形追踪器(Wavetracer)
独立者
另一种并行设计风格让每个处理器遵循自己的
程序。这使得机器更加灵活,但编程难度大大增加。
供应商:Alliant计算机、英特尔(Intel)、美高(Meiko Scientific)、nCube、
Parsytec和思维机器。Teradata为商业数据处理市场提供高度专业化的
系统。
未来玩家
即将进入MPP市场的公司:超级计算机领导者Cray Research,初创公司
Kendall Square Research,AT&T的NCR部门,以及计算机巨头IBM