新冠肺炎疫情叠加国内经济形势的变化,使“新基建”走上快车道。继今年3月在顶层设计被频频提及后,日前,国家发改委首次明确了“新基建”的范围,主要包括三方面内容:信息基础设施、融合基础设施和创新基础设施。
解读人工智能在其中的定位:一是新技术基础设施,二是可被深度应用、可支撑传统基础设施转型升级而形成融合基础设施。这其中,算力作为底层支撑需要继续夯实,当前算力已经无法满足智能化社会构建。根据OpenAI统计,从2012年至2019年,随着深度学习“大深多”模型的演进,模型计算所需计算量已经增长30万倍,无论是计算机视觉还是自然语言处理,由于预训练模型的广泛使用,模型所需算力直接呈现阶跃式发展。不论是边缘加速、云端推理、边缘计算、端侧加速等,算力都是AI新基建首先聚焦的。
4月16日,<电子发烧友>以“AI‘新基建’规模落地破局方向在哪里?”为主题进行线上直播,邀请了嘉楠海外销售VP姚显骏、新思科技(Synopsys)中国区IP Solution销售总监钟香建、深聪智能商务总监王宏松,由电子发烧友分析师张慧娟主持,就AI新基建的机遇和挑战,以及业界如何共同推进AI新基建的规模落地进行了深入探讨,三位嘉宾分享了各自的思考和精彩观点。本次活动参会人数达到11587人。
AI新基建的迫切要求和建设重点?
嘉楠海外销售VP姚显骏认为,在新一轮基础设施的升级背景下,AI企业和行业主要有三大升级方向:一是提升整体的数字化能力,因为AI的很多应用场景中,本质是对大量数据进行处理,所以前端、后端的工具等,都需要提升数字化能力。二是搭建专家团队,由于AI技术的落地需要结合实际场景需求,企业对于既懂AI技术,又有行业知识积累的人才需求迫切;三是各行业都需要加快相关技术数据使用协议的制定,AI在不同行业的应用场景和程度都不尽相同,各个行业内部有待形成统一的行业标准。
嘉楠海外销售VP 姚显骏
新思科技中国区IP Solution销售总监钟香建表示,传统基建更聚焦于提升民生的硬件基础设施,而新基建更大的比重是利用新兴技术,比如5G、IoT、AI、大数据等,创造新的生产工具和生产方式,从而促进产业的升级,达到整个社会生产力和智力的提升。目前还处于弱人工智能阶段,所以需要整个产业继续努力,通过通用人工智能、强人工智能的产品和应用持续去发展。AI是改进生产工具、生产方式,最终促进产业升级、社会生产力提升的技术基础,AI新基建对AI企业和行业的迫切需求是构建完善的AI技术底座,使得各行各业加快和普及AI应用落地。
深聪智能商务总监王宏松谈到,深聪智能是思必驰旗下的AI芯片企业,专注于智能语音算法及芯片的软硬件优化。智能语音面对的是传统家电、家居、IoT设备厂商,作为基础设施,语音不是简单的技术或产品类型来推进,而是应该看行业是否具备语音的接入能力或具备语音智能的程度。新基建给行业、企业提出了思考的方向:自己的技术能不能达到行业对AI基础设施属性的要求?如果能达到,说明技术就找到了落地的方向。深聪智能对于语音芯片架构规划和落地方面在不断进行思考,也在做取舍和平衡,例如信号处理哪些放在前端、哪些放在云端等,这既是思考的方向,也是行业现在对于语音芯片技术研究的目标和方向。
谈及AI新基建的建设重点,钟香建认为从人工智能产业链的构成来看,主要包括基础硬件数据算法、平台、软件、应用等四个层次,其中硬件数据算法、平台、软件这三部分,分别对应了人工智能的算力、数据、模型三要素,这三要素正是AI新基建的建设重点。AI芯片对性能、功耗、带宽有较高要求,新思科技在EDA工具方面进行了优化,另外还有专门针对AI的IP解决方案,涵盖112G/56G SerDes、HBM接口、处理器等,持续解决算力数据和模型上遇到的挑战。
新思科技中国区IP Solution销售总监 钟香建
姚显骏分析,AI技术体系大致分为基础层、感知层、认知层、平台层和应用层。基础层主要是AI加速器和数据中心的建设,感知层和认知层主要是基于AI的通用技术,平台和应用层则具体到落地层面。目前在基础层上,芯片是AI新基建发力的重点。在AI应用的第一阶段,应用场景主要为训练和推理,在模型训练方面,算法模型需要对海量数据进行处理,这往往依赖于高吞吐的大规模服务器集群完成,云端芯片是AI算力基建的重点,诸如CPU+GPU、CPU+FPGA使得异构计算成为目前AI的主流计算架构。随着算法模型应用趋于成熟,AI应用步入第二阶段,AI算力基建偏向于推理芯片的建设。AI与IoT的结合将赋予设备更多数据处理和通信能力,因此AIoT芯片的建设非常关键,需要芯片在架构和功能上的创新。
算力、算法、数据——谁是AI新基建的基础?
姚显骏认为,AI的发展过程中,数据是AI发展的基础和先导。这一轮AI的发展主要依靠深度学习技术的突破,没有数据AI便是无源之水。算法是处理数据的方法,算力则是根据算法进行数据处理的能力。随着算法模型趋于成熟,现阶段AI面临的主要矛盾是无限数据和有限算力之间的矛盾。因此AI新基建的基础重在底层计算架构的突破。
钟香建表示,在不同的行业,算法非常多样,目前比较成熟。最大的矛盾还是数据和算力之间的矛盾,这种矛盾驱动着AI技术的发展。这其中,数据是基础,对于数据的采集、汇聚、存储、挖掘,是非常重要的一个驱动因素。算力由硬件平台承载,算力够不够、算力能效比,这两个问题在驱动算力不断发展。AI新基建的发展技术,技术资源层是算力和数据,技术层是模型和算法,更基础的还是算力和数据。
王宏松认为,算法、数据和市场三者之间是互动的关系。首先算法需要和市场互动,找到真实所需;其次,对于AI的训练和算法的演进需要一定的数据支撑;第三,提供算力的芯片,其架构、工艺等,都是AI新基建的基础因素。
深聪智能商务总监 王宏松
AI新基建对产业有哪些拉动效应?
王宏松结合AI智能语音的应用谈到,在语音识别、声纹识别、语音合成、语音NLP的处理方面,技术成熟度很高,用户接受度也比较高。特别是在疫情的非接触需求下,智能语音相关应用加速落地。在新基建背景下,AI语音的落地是面向全行业的,甚至是产业赋能的效果,所有电子相关产品,都需要思考有没有机会和语音进行结合,很多商业机会有待发掘。芯片产品化和产业化的机会,具体体现在从IoT到AIoT产品形态转变中。以传统家电市场为例,应用会进一步细分,例如针对儿童的产品可能会率先爆发,这些都是AI语音的机会。
钟香建由我国与美国在人工智能方面的发展情况谈及,我国在AI应用方面相对领先,而美国在基础资源层面做得更好,主要包括硬件算力和数据。这方面的差距也正是我们当前在AI新基础建设中要更为注重的。在总体战略的推进下,GPU、FPGA、ASIC芯片,大数据采集汇聚、存储和挖掘这些领域将迎来新的机会。语音识别、计算机视觉、认知计算、情感感知等,这些领域都会作为中间层技术,在基础层和应用层之间提供接口。智慧家居、智慧城市、智慧办公、智慧医疗、自动驾驶等等,这些领域都会因为AI基础层和技术层面的发展,迸发更强的活力。同时,其他领域也会间接受益,比如大数据、IoT以及支撑AI技术和应用的上下游企业都有很大的机会。
姚显骏认为AI对产业的拉动效应可以从两方面来看。一方面是对强数字属性产业的拉动,例如对互联网、金融等数字化程度较高的产业,拉动主要体现在用户体验和企业服务水平的升级。另一方面是对弱数字属性产业的拉动,制造业、交通、能源和政务等数字属性较弱的传统领域,AI对产业的拉动主要表现在降低企业成本,以及生产效率的提升。例如在高端制造业领域,AI可用于基于算法的建模、设计,生产自动化,高精度的质检等,实现对生产链各环节的优化。传统行业前几年IoT谈得比较多,AI兴起后引入了AIoT的概念。从IoT到AIoT类似于从互联网到移动互联网的发展,整个产业的变化非常巨大,对于生产力和社会运营的效率有巨大的提升。这其中,边缘侧的处理能力非常重要,能够给整个社会的发展做出巨大的贡献。在嘉楠最近落地的一个项目中,是把城市运营的水电表进行了AI图象识别处理,虽然应用比较简单,但是实现了智慧城市意义上的管理,能耗以及消耗的热力图、异常报警功能都可以给政府提供相关参照。
AI如何与IoT、大数据等融合,构筑稳固的技术底座?
姚显骏认为,未来的技术底座虽然构成多元,但主线是一贯的,本质上是对数据资源的利用。在这样的框架中,会看到大数据是数字经济的战略资源;5G、云和芯片是基础设施;AI与物联网、边缘计算的融合是新的生产力;区块链则有望成为下一代互联网的基石组件,构建基于机器信任的生产关系。技术大融合的趋势中,企业要想站稳脚跟,应该关注底层共性技术。
钟香建分析,在新基建的七大核心板块中,与半导体集成电路产业直接相关的有四项:5G、人工智能、大数据、物联网。它们并不是独立的技术,而是相互融合、叠加的。新基建的新愿景,应该是利用基础技术推动新的技术平台和应用的落地,AI方面除了原有的训练、推理等技术分类,在新基建方向下应该有新的技术分类,比如AI5G、AI云计算、AI存储、AIoT等等,是基于已有的5G、云计算、存储、IoT等去升级且应用。因此技术底座更注重的是基础资源层,包括计算平台、数据采集、数据汇聚、数据存储、数据挖掘等,AI基于原有的技术,去构筑这个技术底座。
王宏松以智能语音与其他代表性技术的融合为例谈到,一方面体现在多模态的方案中,除了基于声学的音频,还有视频的识别,再加上感知层的传感器、边缘端的计算、本地的算力等,让AI的识别效果在端侧就提高到一定程度,这也需要算法的不断演进;另一方面,不论是端侧产生的还是处理之后的数据,到云上再做处理时,与传统直接在云上处理的数据不一样。在进行大数据处理、语义理解、知识图谱等处理时,距离理解话语中的含义、文化背景等还有较大差距,AI在这方面应用离需求还有明显的距离,需要从业者不断演进模态的融合和数据结构化的处理。
如何正视AI“理想”与“现实”之间的距离?
王宏松说道,AI技术还有点像三岁小孩,比原来智能了,但还达不到那么高的预期,仍在持续演进中,不过这个演进的速度是非常快的。以算法的推进为例,有的算法是按小时迭代上线的,有的是按周来迭代上线的。对于芯片企业,常常跟不上算法对芯片的直接要求。最终将产品、服务提供给客户时,算法和芯片最后融合成什么样,往往在客户、普通消费者眼里会产生理解或感知上的偏差。但是,AI被纳入新基建范围中,必然会加速行业的应用和落地,会越来越接近甚至超出我们的预期。
钟香建表示,现阶段人工智能在各行各业的普及和应用率还是很低的,这也是理想和现实中存在的差距。造成这个现象的原因还是整个生态链不够健全,需要更完整的生态链的互动、合作和融合。以EDA工具为例,也在被AI革命性地改变,它可以通过大规模扩展对设计工作流程中选项的探索,同时自动化较少的决策,彻底改变芯片的设计。SoC团队能够以专家级的水平去进行操作,可以把专家需要耗费一个月才能完成的设计,压缩到短短三天。我们要坚信AI是无处不在的,它可以改变我们的生产方式和提升我们的生产力。
姚显骏谈到,AI真正落地需要打通从云到端的壁垒,其中带来的问题是多样的。算法方面,将算法迁移部署到设备端,但在实际推理过程中往往影响算法模型的性能。算力方面,设备端对功耗的限制不支持高能耗的AI芯片。数据方面,端侧场景需要实现基于小样本数据的推理,与服务器高吞吐的训练场景不同。为了克服这些差异,需要研发基于端侧设备的芯片。AI芯片在指令集架构的选型、功耗和算力的规划上要贴合端侧场景,以最大程度满足设备端的需求。其次在应用方面,AI行业应用需要在成本、效率和数据安全之间取得平衡。
AI企业如何打造生态圈?
王宏松认为,AI作为技术和服务的一种形式,是呈现给行业合作伙伴和企业的,最终消费者并不知道或不在意其中用了什么样的AI技术,而是注重获得了什么样的服务体验。对于AI企业来说,就要努力打造生态圈,让企业之间、行业之间的融合和推进更加顺畅,共同提供好的技术和平台服务。
钟香建认为在新基建的背景下,不管什么行业的人都用同一种思维方式、同一个目标去思考问题,这就是一个生态圈。要打造成功的生态圈,可以从几个层次展开:首先是如何创造出新的智能应用系统,这是企业、从业者需要常常思考的问题;再高一个层次,需要思考如何应用这些新技术、产品,在哪些领域可以把智能贯穿下去;更高层次的思考是,如何让社会更智能化、增加社会的智力,比如智慧城市、智慧国家的概念,这需要基于底层从一个个产品、技术、行业,进行更高维度的思考,大家需要有这样统一的思考方式去带动AI进入各行各业。因此,生态圈建设应该囊括如下领域:基础资源层生态的融合,包括芯片、IoT、5G等;不同技术层面的全套解决方案的融合,包括算法模型、大数据、语音识别、视频识别、事件识别等;应用层面要做到跨行业的融合,需要在生态圈纳入各个领域的系统公司、方案公司。
姚显骏表示,建立生态圈首先要推动基础设施标准的建立。新基建技术类别众多,不同行业、企业之间的实际应用场景也各不相同。以物联网为例,不同细分行业中的设备和系统繁多,彼此之间割裂,协议互不相通。只有在行业中形成统一的协议标准和数据使用标准,才能真正意义上实现万物互联。同理,在其他技术领域中也需要加快标准研发,从而形成行业合力,真正推动新基建建设。当在基础标准有了统一的标准指引后,再往下到行业、产业、各种不同的平台和应用就会容易很多。