芯东西(公众号:aichip001)
作者 | ZeR0
编辑 | 漠影
芯东西8月22日报道,8月16日,2023英特尔(中国)学术大会在南京开幕。与会专家学者们在主题报告中分享了前沿科研成果和技术解决方案,展示了产学融合创新的进展与方向。
“从注重前沿探索的“最初一公里”,到聚焦商业落地的“最后一公里”,学术界、产业界在创新链条中密不可分。”英特尔公司高级副总裁、英特尔中国区董事长王锐在视频致辞中谈道,“对英特尔来说,我们将更好地发挥在半导体技术、软硬件产品、可持续计算、开放生态等方面的优势,与大家一起为智能而加速。”
在主题演讲环节,英特尔研究院副总裁、英特尔中国研究院院长宋继强探讨了英特尔在制程技术、类脑芯片、集成光子、量子芯片四大技术创新领域对推动算力提升的探索,并分享了英特尔在助力高质量数字人才培养方面的长期实践。
会后,华东师范大学副校长周傲英,英特尔院士、大数据技术全球CTO戴金权,英特尔研究院副总裁、英特尔中国研究院院长宋继强,英特尔公司副总裁、英特尔中国软件生态事业部总经理李映,英特尔院士、首席编译器性能架构师田新民等与会嘉宾,就人工智能(AI)大模型、大数据、开源软件等行业前沿话题与芯东西等媒体进行深入交流。
一、关注AI不能只看表面的喧嚣,应该思考其底层逻辑
AI变成了“全民热词”,AlphaGo和ChatGPT预示着一个新的时代到来。华东师范大学副校长周傲英认为,科技发展已经进入了一个崭新的阶段,基本特点就是由以前的“科学引领技术”,发展到现在的“技术倒逼科学”,本质是回归技术发展的正确路径,那就是,科学与技术相互促进,形成正循环,快速发展。
“在这个新时代,关注AI不能只看表面的喧嚣,而是应该思考其底层逻辑。AI本身就是一场新的科技革命,数据是这场科技革命的底层逻辑。”他谈道,“数据就是人类的经验,从这个意义上来说,我们进入的新的经验主义时代,新的经验主义呼唤新的理性主义,新的科学呼之欲出。”
周傲英对此大数据的概念进一步作解释:大数据主要不是说数据的大小,而是说数据很重要。大数据是指数据的采集、汇聚、关联和使用,其中使用是最重要的。数据是为应用而生的,因为应用,人们才有目的地去收集数据,汇聚数据和把数据关联起来,数据打通了才叫大数据。
数据是能源动力,AI是数据驱动的引擎,数据驱动的人工智能是当前这个数智时代的重要特征。AI是数据驱动的工具,驾驭AI这个数智化工具,必须理解其背后的道理,必须提高数字素养和数字技能。具备数字素养,就是理解计算机的工作原理,认知和理解数据是一方面,另一方面就是培养编程思维。全民计算机科学教育就是全民编程教育,目的不是把大家都培养成程序员,而是为了培养大家“分而治之、循序渐进、试错迭代”、以及异常处理的思维方式。
周傲英强调道,要想在这场以人工智能为代表的新科技革命中抢占先机,必须坚持“应用场景+科技创新+产业发展”一体化部署,整体性推进。大学和科研院所不能满足于“两头在外”的科学研究,必须立足于应用场景,以产业发展为目标,只有这样才能完成真正的科技创新。
“这也是人工智能时代,我们这个行业践行“创新驱动发展”国家战略的基本路径,“场景驱动应用,应用驱动创新,创新驱动发展”,这是完整的驱动链条,也符合“知行合一”基本理念和正确的认识论。”周傲英说。
二、英特尔的“硬实力”:让生成式AI无处不在,底层技术创新推动算力提升
计算高质量数据,离不开高效算力的支持。英特尔院士、大数据技术全球CTO戴金权分享说,英特尔在硬件能力上已经能够做到支撑最新的大模型,其AI训练芯片Gaudi 2在前不久的权威AI基准测试MLPerf中是世界唯二提交了GPT-3预训练场景的硬件。在AI推理市场,通用处理器至强的市占率长期是第一。
戴金权谈道,英特尔可通过最新的内置高级矩阵扩展(AMX)和对Bfloat16的支持等技术,在数据中心提供更快的AI加速计算能力支持。为了让AI无所不在,英特尔将跑生成式AI的能力搬到了今天无所不在的客户端、设备端,通过英特尔的客户端产品,在笔记本、轻薄本上,无需任何外置的硬件,通过CPU集成显卡、BigDL等软硬件即可提供对大模型的高效支持,这样才能真正做到让生成式AI在日常生活中被用起来。
英特尔研究院副总裁、英特尔中国研究院院长宋继强说,做硬件的底层是要推进半导体方面的一些技术创新,英特尔通过制程技术、封装技术等多种技术,把不同的计算资源、不同的架构整合起来,这是英特尔长期推动的一个战略。
英特尔的愿景是到2030年在单一计算设备中集成1万亿颗晶体管,单一计算设备指的是单个封装中所有芯片的总和。英特尔在Intel 20A和Intel 18A这两个更先进的节点引入全环绕栅极晶体管RibbonFET和背面供电技术PowerVia,并在工具层面启用High-NA EUV光刻技术。综合这三个方面,英特尔有信心在Intel 18A阶段重夺制程领先性。
目前英特尔采用一种模块化开发方法,使用了一个内部工艺节点来解耦Power Via和RibbonFET的开发与测试,并通过接近产品级的测试芯片来快速解决背部供电的技术挑战。这样逐步测试不同技术的稳定性,能降低直接抵达新节点所带来的风险。
宋继强说,在努力提高工艺的良率和稳定性方面,需要通过大规模芯片制造来进行验证,这个验证不仅仅限于英特尔内部的芯片,而是扩展到了更广泛的范围。英特尔的IDM2.0战略采用了内部代工模式,使制造部门能够同时对内部和外部客户提供产能,因此未来在Intel 20A和Intel 18A上将不仅仅生产英特尔自身的产品,还将为外部客户提供英特尔代工服务。
就英特尔代工服务设置的模式而言,英特尔首先会告诉客户英特尔有很好的防火墙,能够把内外之间知识产权、产品开发工具包(PDK)等完全隔离开来,确保外部客户了解他们的知识产权和设计在英特尔是完全保密的,同时英特尔提供的资源和工具与英特尔内部团队使用的一样出色。
在先进封装方面,英特尔在其产品路线图已经导入Foveros Omni技术,它可以把凸点间距缩小到25微米,Foveros Direct则通过混合键合技术进一步把凸点间距缩小到10微米。此外,英特尔目前在实验室里研发的下一代混合键合技术,还可以进一步把它缩小到3微米,因此能大幅度减少芯片封装时需要的尺寸。
英特尔FPGA等相关产品已将不同种类的架构封装在一个芯片里,未来随着在CPU、GPU里都使用模块化设计,就更容易把不同的计算能力通过Chiplet的方式整合在一个单芯片封装中。宋继强相信这类方式未来会越来越多。
英特尔未来的目标是整合不同程度的AI能力。神经拟态计算是一种类脑计算,通过模仿神经元的结构构建硬件,同时采用脉冲式神经网络这些新的技术,可实现实时在线学习,也可以把多种不同的模态整合在一起。英特尔研究院的最新神经拟态芯片Loihi 2采用Intel 4制程工艺,相较上一代芯片能效和密度均有数倍提升。
其最新成果是Kapoho Point开发板,每个板把8个芯片直接叠起来互连,整个计算密度很大,能效比也非常高,因为它是一个全闭路的设计,不工作的时候是完全不耗电的,在交通、金融以及通讯领域都有很好的应用前景。基于此的英特尔神经拟态研究社区,有近200家创业公司、大企业和学校的参与。据宋继强透露,目前英特尔神经拟态计算芯片Loihi在推动软件生态更多的兼容,以便能与更多不同类型的硬件组合使用。
在研发路线上,宋继强分享说,英特尔的设计思路是让神经拟态计算芯片能够灵活地规模化,先设计一个小的芯片,让它既能够在线学习,又能够把多种不同的学习模式整合进去,同时也能够在存算一体的设计上模拟神经元真正工作的机制,还加了异步电路的设计。英特尔先把这些整合在一个小的芯片设计中,通过集成这些小的芯片,构成一个更大规模的神经拟态计算模块。
英特尔正在探索通过异步电路设计,可以更好地模拟人脑。未来英特尔希望可以在不同的组合片区中放入不同的功能,比如在这个组合片区里放触觉的,在那个片区里放嗅觉的、视觉的,最后能够同时达成一些目前还做不到的、多个模型互相产生的协同作用。
在应用层面,Loihi芯片已经与一些仿生型传感器做搭配,从而更好地处理传感数据并降低功耗。在很多机器人应用中,Loihi非常适用于做视觉或其它运动控制,能够实现快速的自适应调节。此外,在云端做大规模优化和系统调度,也是Loihi非常有潜力的一个应用方向。
英特尔神经拟态研究社区的成员已经发展到接近200家。“目前来讲,在业界能够达到比较规模量级的神经拟态计算芯片,英特尔的Loihi 2肯定是排在很前面的,这是我们很自信可以说的事情。”宋继强谈道。
三、英特尔的“软实力”:积极参与中国本土创新,为下一代AI技术铺平道路
芯片做出来是第一步,需要支持并能够适配不同的垂直软件堆栈,才能在实际应用中发挥价值。
英特尔在全球拥有超过两万名软件工程师,其中在中国有三四千人。英特尔公司副总裁、英特尔中国软件生态事业部总经理李映分享说,英特尔软件业务主要集中在三个方面:一是底层软件,把算力、硬件、芯片能力更加高效地发挥出来;二是中间软件,保证中间的框架、编程语言能够在最好、最高效的硬件环境下进行运行和实施,并通过对开源社区的贡献,让开源软件框架得到更大的扩展;三是创新层软件,与合作伙伴一起推进软件创新,在软件即服务、安全、AI等方面都有很多进展。
开源社区在中国正蓬勃发展。李映说,过去一年,英特尔将国际上开源社区的合作经验带到中国来,与中国新成长的开源社区进行合作交流,共同成长。英特尔正积极参与中国本土创新,积极融入到中国的创新生态中,结合中国本土和英特尔自身的技术能力一起推动技术发展。
今年,英特尔在英特尔中国2.0战略的背景下成立了开源技术委员会,真正组织起来了英特尔中国的技术专家团队。英特尔开源技术委员会主要有四个部分的工作:一是创新,通过与业务部门及研发部门合作,发掘、培养创新项目;二是标准,和开源标准组织产生紧密合作;三是社区,与合作伙伴、包括CSP和客户之间的开源组织进行更多合作,加速业务发展;四是流程,和总部建立联系,把英特尔整个全球的开源策略和开源流程在中国落地,以保证整体的一致性。
面向未来异构计算时代,英特尔正致力于在全球推广开源且基于标准的统一软件框架oneAPI,让软件方面的编程与投资能无缝迁移到CPU、GPU、类脑计算、量子计算等各种不同的硬件架构上。在中国,英特尔和北大、中科院计算所分别合作成立了oneAPI卓越中心(CoE)。
英特尔院士、首席编译器性能架构师田新民谈道,oneAPI的最初设计理念就是帮助大家提高生产力、可移植性和性能,oneAPI从体架构设计的基础上尽可能实现很强的可扩展性,不只是针对英特尔的硬件架构,同样也包括非英特尔的硬件架构,从而让更多社区、研究所、大学、企业能够充分利用oneAPI的优势,为下一代的AI及高性能计算技术铺平道路。
据他分享,为了支持友商的硬件架构,在整个oneAPI的体系结构设计上,英特尔考虑到了如何进一步扩展软件,从而让开发者只需很小的软件上的调整,就能支持友商的硬件架构。
在助力异构计算发展方面,oneAPI从编程模型和编译器模型两方面来做工作,帮助用户和开发者从原有的计算模式转移到异构计算模式上。
oneAPI提供了两种编译方式来支持异构计算,一种叫Just-In-Time(JIT),一种叫Ahead-of-Time(AOT)。Just-In-Time是指很多软件在静态编译时没法生成优化代码,在运行时,让编译器来实时编译。因为运行时做编译优化需要有一些额外的开销,开发者觉得对运行时的负作用比较大,就会选择Ahead-of-Time的支持,即在运行前就尽可能地让编译器生成所有的可以最终执行的代码,不需要生成中间表示(IR),再在运行时生成代码。
对于学术界而言,oneAPI使更多的学生认识到,要想更好地融入AI时代,就需要更深入地学习、加强基础训练。oneAPI让大家无需再花费时间来做优化矩阵计算性能这种基础工作,而是可以将精力投入到更具前瞻性的研究中。反过来,学生们在使用oneAPI的时候,肯定会发现很多oneAPI需要改进和完善的地方,有助于英特尔不断完善软件系统,实现共赢局面。
在软件支持生成式AI方面,田新民说,下一步,英特尔将聚焦在性能的进一步提高上,有一些具有针对性的模型,比如在医疗领域相对小的模型,不需要用英特尔的GPU Max系列,用Arc就可以解决,而且已经有很多的使用实例。
李映谈道,大模型并不是只有某种卡或是只有GPU才能支持,而更多是根据一个是模型本身的特点和部署的环境,找到最适合的部署方案。比如,规模很大的大模型更适合用Gaudi 2,车载、客户端则可以用Arc来跑一些中等规模的模型,数据中心可以用Max GPU和至强CPU。
田新民补充说,oneAPI从正式发布到现在大概两年半的时间,还有很多需要改善和完善的东西,因此需要在中国有更多的合作者来用oneAPI,来帮助英特尔发现更多的问题,进而能更好地帮助开发者提高生产力和性能。
结语:搭建更大规模产学界交流平台,推动从前沿探索到商业落地创新
从2003年启动以来,英特尔(中国)学术大会已经成为研究和展望技术发展趋势的重要窗口。
大会当天,英特尔还举办了“英特尔学术英才计划”颁奖典礼,共有6位来自国内高校和科研院所的青年才俊获得了英特尔提供的技术指导和奖励资助。接下来,“英特尔中国学术英才计划”将通过组织技术研讨会、学术沙龙、能力提升论坛等方式,搭建更大规模的产学界交流平台。
此外,英特尔宣布全面推出“英特尔创新飞轮计划”,探索挖掘学术界种子项目,促进其产业化落地,推动产学界合作进一步升级。无论是数字人才的培养与发展,还是产学界融合创新,都是久久为功。英特尔表示将继续致力于搭建更广泛的平台,促进更多交流合作,从前沿探索到商业落地,形成更强合力,推动更多满足本土需求的创新。