·首页 ·Linux ·新闻 ·论坛 ·博客 ·空间 ·存储  
ChinaUnix >> AIX用户俱乐部 >> 正文 AIX论坛 | AIX博客
 
[图]IBM杰出工程师,IBM系统与科技事业部Hye-Young McCreary 女士演讲
2006-09-15 11:03:11  来自:ChinaUnix.net
 

IBM杰出工程师,IBM系统与科技事业部Hye-Young McCreary 女士演讲

  图为:IBM杰出工程师,IBM系统与科技事业部Hye-Young McCreary 女士演讲。

  2006年9月15日,“IBM UNIX World 2006暨AIX 20周年庆典”大会在北京中国大饭店召开。2006年是业界领先的IBM UNIX操作系统AIX诞生20年,也是IBM UNIX World 大会的第六个年头。ChinaUnix网站对本次大会进行了图文现场直播。

  以下为其演讲全文:

  主持人:感谢Satya Sharma的精彩演讲,下面有请IBM系统与科技事业部杰出科学家,Hye-Young McCreary带来:用POWER赢未来,IBM最新POWER技术解密。

  Hye-Young McCreary:大家上午好,我非常高兴参加这活动,我是18年前加入IBM的,那是1988年,我们开始做了AIX20年的路程,我们在IBM工作的时间都是做AIX的,跟Satya以及其他的同事一起合作,刚才他跟我们介绍了一下总的战略他当时是我们开发的总裁,有了14年的AIX经历以后又做了新的工作,这是运营系统之间的,我们通过协作和合作可以为大家提供更多的价值,提供虚拟化,这都是基于POWER的技术。

  现在我觉得在这时候谈计算技术创新是非常合适的,涉及到的计算技术,谈到POWER技术是非常重要因为这给客户带来很多的价值。简单介绍一下创新,有多线程的处理技术,有硬件多线程,稍候看到这个技术是POWER技术的一部分,它已经不断改变了整个基准方面的性能提高了30%。第二个技术,所谓双核技术处理技术,IBM POWER4是第一个双核处理器,而且在POWER4上在90年代中期,IBM首次预测POWER的性能。还有一个技术是大家听到很多的。比如动态的逻辑分区提供了更多的灵活性,可以减少整个的拥有成本,还谈到很多随需应变的情况,也会谈到随需应变的能力,所有相关的技术都是基于POWER技术的。

  那么IBM的技术核心是什么?我们提供这样的创新,这会给客户提供很大的价值,我们做了巨大的科技方面投资,不光是科技方面投资,在技术背后要有好的人、要有热情,刚才Satya演讲非常有热情的。IBM在人和技术方面做了双重的投资,我的孩子在学校上学也是学电器工程的,他也是在IBM,他需要学习技术是什么样的趋势,他也经常跟我说,这是教育所在,我要努力学习,也会加入你们公司,加强创新和技术的发展。第二方面是传承主机先进技术,我的背景以及我的同事背景都是这方面的,我们在一起密切的合作,跟主机的同事在一起,学习他们的技术,汲取他们的经验教训。所以很多很多技术,比如可靠性、可用性以及服务性方面是基于主机的先进技术,这样我们就不用花太多的时间来开发这方面的东西。

  2006年下半年我们会提供一系列系统,比如有工作站的,还有入门级的,有中端有高端还有刀片等都是基于POWER系统。所有我们要关注客户的使用。

  看一下处理器发展的蓝图,从2001-2004年推出POWER4、POWER4+,使它性能和频率得到了提升,在2004年-2007年我们会推出使这个系统更稳定,使它得到加强。在2007年的时候将会推出POWER6的技术,当然你们可以想象一下基于IBM不断的投资技术,发展POWER7的技术离我们也不会太远了。看一下对于POWER4以及POWER4+上面技术是什么,你们可以看到有多处理,还有一些分区的技术。现在在POWER5上,还有POWER5+上有很多的可拓展、可升级性,有很多的性能提升,还有使得虚拟化、灵活性的技术成为可能,另外也希望明年再来到这儿,这时候就会给大家推出POWER6,谈到虚拟技术的加强,以及我们对于内存的加强提供了什么技术,对系统的耐力又有什么样的东西。

  下面谈一下POWER5的技术,谈到双核技术,四核技术,有POWER5和POWER5+ 技术以后,我们推出了QCM的技术,它会使得系统的性能得到提升。还有想指出的一点,有了POWER5、POWER5+ 的技术以后有了微分区技术的支持,每一个都是非常棒的,作为商业伙伴可以真正使用微分区的能力,稍候可以看到在处理器耗电使用方面可以看一下SMP的CPU使用,在运行应用的时候可以提高,大家在系统中做了很多的投资,就要充分利用投资的资源,基于我们的观察,我们认为微分区的能力能够确保把处理器分成多个分区,这样可以你可以充分利用你们的资源,这样可以给你提供更多的灵活性,以及整个拥有成本的合理化。

  Dual Stress的技术是什么?是基于Stress的技术,加快了20%的速度,而没有增加电耗,Ross谈到能源的问题,人们担心能源成本的问题,现在由于整个能源价格的上升,确实是人们关注的问题,我们经常跟客户的交流,90%的客户很担心数据中心对于电力的消耗,现在他们越来越依靠电脑技术,他们觉得在数据中心上、空间方面,耗电方面都是问题。使用电力也是他们担心的问题,IBM做些什么来改进他的能效呢?我们增加了20%的性能,并没有增加对于电力的消耗。我们需要确保,我们要很好使用电力,这技术可以提高性能而不提高耗电,同时可以预防漏电现象。

  下面再谈一下DCM/QCM的模块,四核模块刚才也说了,IBM的POWER4是第一个双核的处理器,我们在这个行业第一次推出,我们想确保双核性能应用最好的。同时我们发明了四核技术,我们关注系统的性能,而不是处理器的性能了。MCM是多芯片的模块,如果我们考虑可用性、可靠性的时候,如果在一个芯片上组件越小,发生故障的机率也会更小,这是多芯片模块的目的。可以考虑系统的封装,在高端需要可用性的功能特性,我们特别需要多芯片的模块放在高端系统当中,大家可以看到DCM、QCM的封装用在不同的服务器上,这取决于你的需求和应用,你可以做不同的选择。其实这方面我们有多种技术,还有同步的多线程技术,我们谈到软件的多线程,这里面可以看到的是硬件的多线程,确保我们不会浪费任何无用的周期,可以增强应用能力,增强同步的处理能力,在这儿大家可以看到在多个基准上,它都有很好的表现,由于有了多线程的技术,性能在各个基准上平均提高了30%。

  谈一下RAS的特性,也就是可靠性、可用性、和适用性。从设计角度要确保系统的核心能力表现在可靠性上,我们可以提供热插拔,这表现在风扇以及电源功耗的管理。我们要确保任何情况下硬件出现问题,都可以实现热插拔。硬件可以在不中断的情况下工作,软件也可以正常运行。多年以来我们要确保在任何时候,如果硬件组件出现问题的话,都不会给客户带来问题,我们要确保硬件全天后7×24的运行。我们要确保适配器的热插拔,还有磁盘的热更换,任何硬件都可以确保实时的维护,不会出现任何中断的问题。我们可以看到,Hypervisor是一个主机的技术,刚才听到了有关虚拟化的技术,还有FFDC,大家会听到更多这方面的介绍,也就是当出现故障的时候,我们马上有一个更换,这样可以提高效率,确保系统的稳健性。当你告诉我你系统出现问题的时候,我们不希望你系统再次出现问题,当你系统第一次出现问题的时候我们就可以捕获这个数据,我们可以做出相应的开发,我们可以及时解决这个问题,可以使客户的宕机时间缩短,我们提供的任何技术都是要避免出现任何可靠性、可用性的问题。

  在这里列出所有POWER5的RAS功能特性,以及未来POWER5提供RAS的能力。2005年的增强,包括服务处理器方面的冗余,我们希望系统当中一旦有一个系统出现问题的时候,另一个服务处理器可以自动的得到恢复,这是一个动态的故障恢复的机制。另一个增强的能力体现在同步的固件维护,刚才谈系统硬件的时候已经涉及这个话题,在2005年POWER5当中增加这样一个能力,可以同步的更新代码,这样确保维护,目前来说这个能力只局限在修复更新或升级,大家知道在主机当中可以做代码的更新,通过这种更新可以修复,也可以获得更多的功能特性。在POWER5系列增加了这样一个能力,我们可以为新的GA提供同步代码升级。

  谈一下随需应变的能力,这主要指容量的随需和能力随需应变。关键的问题就是随需应变的能力,我们希望按照客户的需求不断提升容量,这包括处理器的容量和内存的容量。当我们提供系统的时候我们会按照你的需求提供,我们确保这种随需性。当你觉得应用环境不需要很大内存的时候,我们可以提供适当的内存,另外还可以按照需求提供打开或者关闭适当的容量,重要的是我们了解客户的需求,我们确保按照你们的需求来提供不同的能力。比如我们给大家提供30天的测试,如果通过30天的时间,你通过使用我们的系统使性能得到改善你可以采用这个系统。你可以在我的内存当中,我希望有这样的容量增加,然后按照这种需求来付款,也可以采用租赁的方式,这样就可以随时打开或关闭这种能力,这也是我们新技术可提供的。最后一点它可以实现动态处理器的减少,这也是随需应变的一个特征,它还可以给大家带来更多的灵活性,当一个处理器出现问题,不能让系统中断,我们要确保提供24×7的系统运转,特别对于关键任务要有这样的保障,当我们看到处理器出现问题的时候,我们就会动态中断处理器的工作,我们会把工作转到同步的处理器上,关键是可以实现动态的更换,确保整个集群的正常工作,你的运行也不会因此受到影响。

  下面介绍一些技术的基准,我们刚才谈到RAS,也谈到随需应变的能量提供,我们针对不同的技术指标,POWER的结果是怎样,比如扩展性、频率以及性能的提高,我们看一下针对不同的基准和技术指标,大家可以看出相对于其他厂商的结果,SAP是一个重要的技术指标,IBM在这里面做到最好。用更少处理器和更少的端口可以达到更好的性能,相对于竞争对手来说,在处理方面和在线处理方面都比竞争对手做得更好。更重要的一项工作是功耗方面,这是对能源效率很重要的问题,首先我们怎么样衡量能源效率,在这方面有很多的技术指标,我们要了解处理能力、速度等,但是你怎么样能够衡量功耗或者你的能源效率呢?我们要以每瓦的性能来看待,用每瓦性能体现能源的效率,在这里有TPC-C的技术指标,我们针对这个技术指标,我们每瓦的性能又如何呢?在五个系统当中,IBM做得比其他的都好。

  这里有一些衡量指标,重要的是大家要了解为了使系统运转有怎样的耗电情况。大家可能经常听到Nameplate POWER,最大情况下,他的比例会占75%,在最耗电的情况下可能会使用70%,假如你要全面运行一个CPU要看最大耗电量多少,另外还要看一下通常情况下的功耗情况,看一下通常情况,或者平均值,以及实际的耗电情况。我们通过这种衡量就知道你的系统实际的耗电情况,比如各种配置各种负载情况下的耗电情况。衡量时候可以改成平均耗电,性能耗电或者每瓦的性能,另外还有SWaP的性能,有时候你会忽视一些内容,Sun做能源效率衡量的时候是采用SWaP的衡量方法,IBM主要是通过每瓦性能看功耗效率。

  看一下POWER4和POWER5在能源效率方面的情况,POWER4和POWER5以及POWER5未来的发展采用不同的技术指标衡量,一个就是SPECjbb,这个指标随着时间的发展,POWER4、POWER5系统每瓦性能在不断提高,最新的系统有更高的性能,也就是在一定的耗电情况下,你的性能是不是有很大的提高,因此我们能够看出从功耗上,系统设计的效率在不断提高,明年推出的POWER6当中,还会有一个全新的技术来解决功耗问题。

  从这张图上可以看到,我们不仅仅是在处理器上注重功耗,我们还在整体系统上注重能耗问题。根据我们的经验,系统的功耗和系统的能源效率不仅仅靠内存或者处理器就可以解决,必须从整个系统的角度加以考虑,它包括IO子系统、冷却系统,电源管理以及处理器和缓存的设计。在这里可以看到随着不同的负载会有不同的能源消耗需求,在IBM的做法是从系统角度降低功耗,使每个硬件组成部分都采用不同的技术,确保整个系统有最低的功耗和最高的能源效率。

  谈一下同步的部件维护,这是我们采用的一种机制,我们采用代码更新的方法来实现修复,目前提供代码之后可以做12个月的代码更新来满足客户的需求。我们推出了一种新的服务和支持周期,这也是为了满足客户的需求,首先要实现启动代码的更新,大多数的修复或者99%的修复都可以同步的完成,你只需要重新启动,大家用维护窗口就可以完成这项工作。现在看一下POWER5,POWER5+的情况,我们要确保100%的修复都是同时的,这技术是在POWER5上才有的,POWER6上会有同样的能力,而且我刚才也谈到了要确保不管是更新还是新码的使用都可以同时更新,这是我们需要更加努力工作的,我们也需要跟一些主机的同事学习。

  我们更新什么呢?这个领域是我非常熟知的领域,我们在做开发,下面有很多硬件,在上面有很多的操作系统,有不同的AIX、i5/OS,Linux,中间是软件和硬件的部分,在这中间可以提供硬件的OS,我们想确保的是提供多运营系统的OS看不到这个东西。在这里硬件的资源可以被调动起来,这是一个独特之处。所以我们会提供双重的能力,对于POWER5一直到POWER6、POWER7都提供这种能力,我们把所有独特的硬件东西都藏在里面,这样OS和其他的硬件应用不需要考虑改变属性,这里PFW的分区,还有把物理资源提供到分区上,同时是服务处理器上,我们可以减少处理器的重用性,我们POWER码也有,以便可以确保它是同时提供的,并且也是具有活力的,这就是它的组件,我们要不断的更新。

  谈一下虚拟化,我们看一下走过的历史,90年代的时候我们当时正忙于做SMP的能力,我们当时非常高兴,我们可以做多处理,我们可以理解CPU使用的量,在很多情况下可能20%都不到,我们希望你投资是有效率的,希望你付出硬件投资之后要充分利用,但是看起来没有充分利用,所以在POWER4实践框架中提出了分区的能力,这样大家可以运行不光一个运行系统,可以确保你们动态分配CPU,我们对此不是满足的,我们又进一步往前发展,要看一下我们是不是能做微分区,以便能够确保你不需要这块东西的话,那么给你提供一个自我的CPU分区,你对于某一次的工作量进行自我的调节,所以我们可以看到以前是一个运行系统,后来在POWER4的时候,我们可以有4个分区在一个服务器里。以后有了微分区的技术,你可以有40多个区,而且这是非常棒的,可以看到客户的能力得到提升。

  我们再看一下架构,在下面有了网络和磁盘,左边有硬件管理HMC,我们也承认我们需要做更好的工作,从系统的管理方面,系统管理可用性方面,HMC是一部分,我们提供的能力可以使你更好管理你的资源,以及更好的分区能力。你在实验室的时候,可能没有更多考虑客户的需求,现在也把开发商推到客户那里去,让他们实际考察看一下,你发明的这些技术客户怎么使用的?有了HMC我们也不断地改进,还想进一步对它改进,使它更加有可用性,因此我也期待着你们来看一下POWER6的系统有了HMC,有了可用性以后,它就大大的得到了提升。我们也想倾听你们的意见告诉我们所做的东西够不够,我也知道客户能够对于管理性,用户性的技术满意之后我们才会满意,因此这有硬件还有Hypervisor,以及中间的处理器,他们可以提供这种能力。我们还提供专用的处理器能力,如果你想有一些分区,如果你需要专用的也可以,我们也提供共享处理器的能力,当你监督使用的时候,如果应用不是特别忙,你就动态使用分区的处理器,你可以看到在考虑做专用的,在这种情况下客户想共享他们的处理器,这取决于你的政策。对于分区我们有Capped和on Capped区分,有时候不需要太多的功耗,这时候需要分区最大,你可以具体制定一下我们说的Capped,有时候性能是非常重要的应用,对于这部分分区来讲,资源不能分享到其他地方去,因此在这里可以看到在真实情况中,特别你们工作环境中需要什么东西,以及我们有什么的技术,以便可以应对你们的需求,所以这些也是IBM的创新,而且这不光是软件或者其他的更新,这是基于POWER技术的一种创新。我们从实验室中,从系统中,一直到系统架上都提供这种技术。

  再谈一下功耗方面的能力,刚才也谈到了历史的发展情况,所以我们会简单的看一下,很重要的是我们有微分区,有指定的和非指定的,今天下午还有一场专门谈虚拟化技术,我们未来的趋势,当然这也是基于你们需求做的,会谈到分区的移动性,谈到整个的应用,这是非常重要的。分区的移动性应该是动态的,你有必要把分区,特别有OS窗口的时候,不会影响到你的运行,因此移动性应该是动态的。

  我们谈了网络,还有其他的东西,这些就不逐一重复了,基本来说,如果你需要物理资源的话,我们想确保你不需要停下系统来增加物理资源再启动你的系统,我们有虚拟的一块可以给你提供所需要的资源,因此我们可以分配和使用现有的物理资源,以一种动态的方式使用,而且不会使你运用系统下来这是非常重要的。

  看一下第三方机构的调查,这是基于Gabriel的调查,这个调查中问了很多的问题,问了客户,比较一下和其它UNIX供应商的情况,谁给你提供最一致的随需应变的系统,提供这样的属性,所有的方面都可以看到IBM是做的比其他竞争对手好得多。这也是基于供货商偏好的调查得出的结果,我们非常高兴今天请到了你们,这表明你们非常信任IBM的,你知道我们能够提供一致性的技术,随需应变,我们给你及时提供相关的产品。所以我讲的主题就是POWER技术以及它的价值,它能够给您的帮助。这些是对于价值的相关总结,以及p系统带来的好处,以及性能,这些就不需要重复了,你们见证了我们的性能,我们所做的,不光在以往的基础上满足,我们要提供更多的东西,我们要确保这些技术是可靠的,给你们提供服务性,我们也谈到FMDC,来确保我们有可靠性,同时我们要有灵活性,我们通过虚拟工具来降低你总体拥有成本,使它不是跟其他人一样高,另外还谈到科技含量不详细谈,这里提供的就是POWER技术,可以看一下其他供应商,其他都没有提供这么专用的技术、含量这么大的蓝图,我们在POWER技术上,自从我加入IBM开始就进行这方面的开发,我们仍然不断在这方面加强我们的技术,也是基于你们的需要加强我们的技术,所以可以看到今后的发展路径,正如Ross所说在20年之后,我们也希望再次回到这儿带来更先进的POWER技术和更新的技术图,我也知道这对于你们来说非常重要的,你们会迁徙到新的技术上,我们会提供一致性的技术路线发展图,不能把以前的技术放掉,由于这样会给你们带来很多的成本,所以我们要使技术非常有兼容性的,我们技术路线图,非常专著于技术的发展,也是有一个坚实的技术路线发展图,我们也有能力提升性能关注可靠性和灵活性。

  给大家看一下这个图,在右手边有很多好的技术,我们给你们提供这么多东西,哪些技术需要更好的可用性,更好的可管理性,我们需要倾听你们的意见,这些系统也是基于我们的技术,更好的性能,还有最优的性价比,以及最低的入门成本,所以我们提供的是不同的系统,你们可以使用不同的技术,

  我非常荣幸参加今天这个活动,给大家介绍了POWER的技术,以及给你们提供的价值,当然如果各位不告诉我们哪些是你们喜欢的,哪些是我们需要进一步改进的是不行的,所以我们需要听你们告诉我们的技术哪些方面需要进一步改进的。谢谢。

  主持人:感谢大家光临,上午会议到此结束。



 发表评论 | 查看评论
 
 
    

 网友交流更多>> 
· 急!P570无法启动,前面板报错B..
· I/O瓶颈问题?
· 主机液晶面板显示10011BOB错误,..
· 重装需要注意哪些问题细节
· 大家帮分析下AIX的售前好还是售..
· hacmp中db2的进程监控脚本要怎么..
· HMC 的区别?
· 谁动了我的文件?
· 170 跟150 2台机器,靠自带的CO..
· 关于 tar 命令的高级使用
· 购买150
· vmstat分析
· 关于nfs的问题
· 根据时间删除的脚本
· HA启动问题
· smitty install 异常中断....
· 准备买台学习机,有几个问题请教..
· 备份环境的尴尬.....
· 如何查看是否安装了GB18030字符..
· 223学习中,哪里有免费的AIX主机..
· aix5.3有个硬盘报错,哪位达人给..
· AIX 7026-6H1 硬盘报错
· 怎麽升级HACMP啊?
· 如何建立Aix的超级用户?
· lslpp -l 输出为什么是这样?
· 想修改persistent IP
· 怎麽给一个分区装操作系统啊?
· mirrorvg 时出的奇怪问题
· 关于文件系统的奇怪事情
· f85电源灯闪烁,经常坏,很郁闷..
 最新文章更多>> 
· IBM、惠普、Sun 三大服务器厂商..
· 用户相关文件
· 用户相关文件
· AIX系统ROOTVG镜像操作
· UNIX与ORACLE备份与恢复
· IBM红皮书上翻译的HACMP原理1
· IBM红皮书上翻译的HACMP原理2
· vi编辑器
· Install WebLogic92 on AIX
· Fragment size, 逻辑块,及存放用..
· IBM Power服务器:统一就是力量
· IBM五大系列服务器发展概述
· UNIX引领新一代数据中心未来发展
· 技术追踪:追溯POWER的前世今生
· 挥向中小企业的Power刀片
· 大型主机刀片:敢问路在何方?
· AS400之-AS_400的迅速发展及未来
· 解决部分镜像问题的方法
· RAC环境下创建物理DATAGUARD
· 关于vea界面无法正常显示的问题..
· How to verify Legato NetWorke..
· 通过HMC升级和更新P5主机微码
· 探索 AIX 6:新特性概览(下)
· 探索 AIX 6:新特性概览(中)
· 探索 AIX 6:新特性概述(上)
· AIX+HA,如何调整文件系统空间
· Maximum allocation for logica..
· 在AIX下归档大于8G的文件
· AIX 常用命令汇总
· IBM AIX V5.3 系统管理(Test 22..
· IBM AIX V5.3 系统管理(Test 22..
· AIX ,FQA第2期
 

Copyright © 2001-2018 ChinaUnix.net All Rights Reserved

感谢所有关心和支持过ChinaUnix的朋友们