上传时间:2012年2月6日 关键词:处理器、系统架构、AMD
  AMD公司副总裁暨终端部门技术长 Joe Marci 稍早前表示,简化平行运算的编程,同时让软件工程师能尽情发展他们的想象力,是这家公司下一个要追求的圣杯。  在稍早前的 DesignCON 大会上,Marci表示,AMD的工程师目前正在努力的目标,是让今天的CPU程序设计师们都能运用异质系统架构(heterogeneous sySTems architecture, HSA)开发该公司的加速处理单元(APU)。  Marci表示, HSA 结合了 CPU 上的纯量处理和 GPU 上的平行处理能力,同时能在更低功耗下提供更高的存储器存取频宽。他同时指出,硬件编程必须更加简单,而且还必须更容易达到最佳化和负载平衡,但这一切都极具挑战性。尽管这些任务看起来困难重重,但Macri表示,硬件开发人员们并不需要重头开始,因为凭借着该公司超过40年的处理器开发经验,工程人员可以开发出一种极具扩展力的系统。  Macri也指出,不断地思考并完善硬件设计,也将使软件开发人员能更自由地运用硬件来进行开发。“软件工程师就象是现代的米开朗基罗,”他表示,AMD对HSA架构的期许,就是要让软件开发人员能更专注地进行开发,实现他们的愿景。“如果在软件开发过程中还必须考虑到硬件,将会抑制这些工程师的创造力或想象力,”他说。  当然,所谓的‘愿景’也不断在产生变化,如最近一段时间以来,人们与计算机的互动方式产生了很大改变,如迅速崛起的手势触控等。  “你需要能在低功耗下执行的功能,而且还要为消费者提供良好的使用经验,”Macri说。而这将需要极大的并行处理能力。

  AMD将CPU和GPU融合在单一芯片而成的APU仅仅是个开端,Macri说,而未来的APU则将再纳入HSA,他同时希望能尽快HSA成为业界标准。“标准有助于建构完整的生态系统,让所有厂商在公平的环境中竞争,”他解释道,AMD正在推动真正开放和实际上的标准,让整个产业都可以使用。“时间会证明,开放标准终将获得胜利,”Macri说,因为软件开发人员也希望他们的应用程序能在多个硬件厂商提供的平台上执行。  Macri认为,所谓的“架构时代”(architected era)将包含完整的C++,并使用GPU作为协处理器。它还涉及统一的一致性地址空间、任务平行运行、巢状资料平行编程、使用者模式调度、抢占(pre-emption)和环境切换等。  “今天,我们开发的每一种设备,都受到一定的功率限制,因此,动态功率平衡是至关重要的,”他表示。同样地,在GPU中使用可寻址存储器也代表着向前跨出了一大步,Macri说。尽管一致性并不能确保元件执行得更快,但却能让软件开发人员更加专注于他们的领域。并非取代OpenCL  Macri进一步指出,HSA也不会取代OpenCL,相反地,HSA将会是为OpenCL最佳化的一种平台架构。“如果你想写OpenCL,这将会是一种能让OpenCL执行得更好的硬件。”  事实上,在HSA上使用OpenCL将能避免不必要的拷贝,并具备低延迟调度、改善记忆模型,以及能在CPU和GPU之间分享指针等优势,他说。此外,HSA也为那些希望能在最后阶段进行控制并调整性能的开发者提供较低层的编程界面,同时,经过最佳化的库也可以选择这些较低层的界面。  今天的命令和调度流程步骤都太多了,Macri认为这很浪费,因为用了这么多开销,却仅能执行部份功能。  他指出,在采用HSA之后,应用程序便能直接进入硬件队列,不需要多余的驱动器。“没有API来处理这些,也没有核心模式驱动器,更没有软件队列,只要直接存取硬件就好了,”他解释道。


  但重点是要切换运算,而不是搬移资料。今天,所有的处理器都同时执行串列和平行核心,每个核心都应该能以不同的性能水平运作,而且也应该很容易编程。其架构必须能支援以编程模式为基础的大规模资料集和任务,但同时维持开放性。

  “未来的芯片架构路径非常明确,”Marci说。“这条道路将从建构在对称多处理器(SMP)系统上的可编程模式朝异构领域转移。这种架构将会是开放的,它将拥有公开规格和开放原始码软件堆栈,异质核心将能运用一致性存储器良好地相互运作,且延迟极低,也不会有软件相冲问题。  不过,Macri也表示,这个愿景恐怕不会很快来到。