【ZiDongHua 之自动化学院派收录关键词: 北京大学 EDA 人工智能 边缘计算
  
  新闻 | 北京大学无锡EDA研究院3篇论文入选第61届设计自动化会议(DAC)
  
  6月23日至27日,第61届设计自动化会议(DAC 2024)在美国旧金山召开。在本次大会上,来自电子设计自动化EDA)与集成电路领域的高校、公司及研究机构群英荟萃,分享了EDA技术的最新发展和广泛应用,讨论了本领域进一步发展的前景和方向。
  
  在本次大会上,北京大学无锡EDA研究院共有3篇论文入选。相关介绍如下:
  
  1. 系统级顶层布线
  
  随着现代片上系统(SoC)规模的不断增长,多实例化分块技术因其可以有效降低不同部分的耦合度,显著降低了芯片开发的时间和人力成本。然而,不同分块之间关键连接的顶层布线带来了新的挑战。由于多实例化分块内部的路径会在其他相同模板的分块中复制,因此可能会产生布线资源的拥塞与浪费,甚至造成短路。针对这一难题,林亦波研究员团队提出了基于组搜索的带布线拓扑哈希的布线方法。该方法通过在双层稀疏格点图上的组搜索,能够鲁棒地解决由于布线路径复制导致地短路问题。同时,该方法通过对线网拓扑哈希的方式,有效减少了布线时间和线长。结果表明,与EDA菁英挑战赛赛题的获奖者相比,该算法能够在保持鲁棒性的同时,减少12%,32%,10%的总线长。该工作以《Top-Level Routing for Multiply-Instantiated Blocks with Topology Hashing》为题发表(博士生王嘉睿为第一作者,林亦波研究员为通讯作者)。
  
  2. 可综合模拟存内计算
  
  模拟存内计算(ACIM)是一种新兴架构,可用于执行高效的人工智能边缘计算。然而,目前的 ACIM 设计通常具有不可扩展的拓扑结构,并且仍然严重依赖人工操作。这些弊端限制了 ACIM 的应用场景,并延迟了设计者的设计时间。针对该问题,林亦波研究员-王润声教授团队提出了一种基于可合成架构的端到端自动化 ACIM(EasyACIM)。在给定阵列尺寸和定制单元库的情况下,EasyACIM 可以端到端自动生成具有各种设计规范的 ACIM 布局。利用基于多目标遗传算法(MOGA)的设计空间探索器,EasyACIM 可以基于所提出的可合成架构获得高质量的 ACIM 解决方案,从而满足各种应用场景的需求。与最先进的(SOTA)ACIM 相比,EasyACIM 提供的 ACIM 解决方案具有广阔的设计空间和极具竞争力的性能。该工作以《EasyACIM: An End-to-End Automated Analog CIM with Synthesizable Architecture and Agile Design Space Exploration》为题发表(博士生张昊懿为第一作者,林亦波研究员为通讯作者)。
 
  
  3. 大语言模型隐私计算
  
  近年来,大语言模型兴起并被广泛应用于日常生活中,这些应用可能涉及数据的隐私信息。为了解决隐私问题,同态加密结合两方安全计算技术(HE+MPC)作为一种有前景的解决方案但代价是用户和模型提供方之间高额的通信量。尽管已有大量的工作尝试降低通信开销,我们发现大模型隐私推理中的词嵌入查找的优化被忽略了,而且实验表明这一过程的通信量和延迟与一层transformer层相当。基于此,团队提出了FastQuery框架,通过网络协议协同优化来降低词嵌入查找过程的通信量。在模型层面,FastQuery提出了通信感知的词嵌入表量化,通过逐通道细粒度的量化保证模型能力的同时显著降低明密文的位宽,进而降低通信开销。在协议层面,FastQuery提出了累加位宽减少以及将多个低比特元素排布进一个高比特元素中的协议优化,完全利用明文空间并降低通信开销。我们在LLAMA-7B和LLAMA-13B模型中验证了FastQuery的有效性。在模型准确率上,相比于ZeroQuant,FastQuery用更低的位宽取得了相当的PPL指标。与先前最先进的HE+MPC的框架相比,FastQuery取得了20-76倍的通信量降低,带来了1.3到4.3倍的延迟降低。该工作以《FastQuery: Communication-efficient Embedding Table Query for Private LLM Inference》为题发表(博士生林辰启、许天识、杨泽斌为共同第一作者,李萌研究员为通讯作者)。