从算法到芯片,为什么是这些AI公司的必经之路?
2019-01-14 23:56:27
  • 0
  • 0
  • 0
  • 0

在国内AI领域,思必驰就像一个低调沉稳的“老男孩”,低调稳重理性十足。

成立十年,从剑桥走出的这家AI初创公司如今已经稳居国内语音交互第一梯队。在国内智能音箱市场,除百度之外,包括天猫精灵、小米小爱同学、华为、腾讯、联想等大部分主流智能音箱都采用了思必驰的语音技术解决方案。

1月4日,一直专注智能语音算法的思必驰跳进了一个全新的领域,发布第一款自主研发的AI专用芯片,目标指向智能家居领域。至此,以思必驰为代表的国内AI 语音公司几乎全部加入造芯行列。

为什么AI语音公司不约而同地闯入造芯新赛道,此前并不具备任何芯片研发经验的初创公司造芯,胜算几何?

智能进化论通过对思必驰CTO/深聪智能CEO周伟达博士、深聪智能执行副总裁吴耿源先生的采访,希望透过思必驰的造芯思路,得到些初步答案。

1

低调组公司,验证“软件定义芯片”

周伟达拥有20多年语音算法经验,吴耿源和朱澄宇(深聪智能CTO)分别拥有20多年半导体不同的从业经历,合组深聪智能前,彼此对于对方的专业并不熟悉。吴耿源坦言,在与思必驰合作前,对这家低调的AI初创公司了解的并不是很多。

三人中,周伟达是一位低调的算法大牛,他同时担任思必驰CTO和深聪智能CEO。这位西安电子科技大学博士,2009年加入思必驰,是思必驰的技术元老,领导思必驰对话交互技术研发。

朱澄宇是芯片大牛,深聪智能CTO,美国普渡大学电子工程硕士,曾任SMIC设计服务副总裁。

吴耿源则是深聪芯片商业落地的幕后推手,20年半导体行业经验,台湾清华大学工程学位,2002年加入中芯国际,职业经历横跨芯片工程、战略规划。

推动三人走到一起的是一个叫“软件定义芯片”的趋势。

近年来,“软件定义芯片”成为不少AI顶级专家强调的趋势,比如清华大学微电子所所长、芯片行业顶级大牛魏少军教授。不久前,在清华大学与北京未来芯片技术高精尖创新中心联合发布的《人工智能芯片技术白皮书(2018)》中,对“软件定义芯片”做了定义:

“软件定义芯片”中的“软件”是为了实现不同目标的AI任务,所需要的AI算法。AI芯片必须具备一个重要特征:能够实时动态改变功能,满足软件不断变化的计算需求。

2018年3月,思必驰携手半导体专业投资公司中芯聚源,共同注资成立上海深聪半导体有限责任公司,开始造芯之路。不过双方并没有对外公布,而是希望通过低调的实践对软件定义芯片做一次验证。

目前,这家成立不到一年的公司有近三十人的规模,绝大部分为研发人员,一半是算法研发,一半是芯片研发。股权方面,思必驰控股,另一大股东是中芯聚源,中芯聚源的背后则是知名的大基金。

从三个核心人物的分工,可以看出深聪做芯片的思路:“软件定义芯片”,软硬件结合。

2

算法公司必须也只能自己造芯

“对思必驰来说,做芯片是一条必经之路。”周伟达表示。

2016年,思必驰就考虑做芯片,当时的思路是想与芯片企业合作,但在考察了近一年时间,走访近100多家芯片公司后,发现行不通。

第一,合作造芯,无法解决硬件与软件融合的问题

AI算法更新以周为周期,不断迭代优化。芯片的更新以季度为周期,而且硬件制造的规律要求必须有明确的产品参数。“芯片公司给我们提的要求很直接,你就告诉我需要多少算力,需要多少带宽,需要多少内存,剩下的事交给我们来做。算法还在不断的进化完善的过程中,芯片该怎么来做?”周伟达表示。

第二,通用芯片无法满足很多垂直场景市场需求

比如,支持6-8个麦克风采集的远场交互场景需求,很多通用芯片都无法满足。而且,当语音交互算法加入通用芯片后,还面临功耗占比太高等难点。让AI算法按现有的芯片硬件规格去套,会产生“过犹不及”,算法功能不能完全发挥,同时造成成本效率浪费。

第三,双方企业开放Know how的障碍

“需要开放我们的算法,需要芯片公司重新架构CPU或者计算单元,我们发现这一步很难迈出去。”周伟达说。

可以说,算法、市场需求和数据安全多方面的驱动力,让思必驰走上造芯之路。吴耿源认为,“所有头部的算法公司,都在考虑做芯片。”

深聪智能执行副总裁吴耿源

3

面向智能家居的AI专用芯片

此次发布的TH1520是思必驰第一款端侧的前端语音交互芯片,提供算法+芯片的整体解决方案。主要面向智能家居、智能终端、车载、手机、可穿戴设备等各类终端设备,其中,电视、盒子、白电是TH1520的核心应用终端。

该芯片进行了算法硬件优化,基于双DSP架构,内部集成codec编解码器以及大容量的内置存储单元。同时,TH1520采用了AI指令集扩展和算法硬件加速的方式,使其相较于传统通用芯片具有10X以上的效率提升。

TH1520能够实现语音处理、语音识别、语音播报等功能。信号处理层面:支持单麦、双麦、线性4麦、环形4麦、环形6麦等全系列麦克风阵列的语音采集、信号处理、降噪。语音交互层面:支持唤醒、声纹、本地识别。

周伟达告诉智能进化论,TH1520的技术架构是深聪自研。尤其是针对麦克风正面采集、低功耗、VAD、信号处理、唤醒等部分算法,对硬件做了深度的优化。通过这种软硬件结合实现优化,可以让芯片的计算效率更高,功耗更低。

据悉,TH1520 always-on监听阶段的功耗低至毫瓦级,典型工作场景功耗仅需几十毫瓦,极端场景峰值功耗不超过百毫瓦。采用片内内存满足语音算法需求,不需要片外内存。“片内功耗比片外功耗小两个数量级,对于提升性能跟降低功耗可以说起到了决定性的作用。”低功耗也让很多智能设备不插电,便携移动成为可能。

数据安全方面,深聪的“太行(TAIHANG)”系列芯片将采用三层数据安全保护,第一层,在芯片中加入了芯片密码,只有取得芯片密码的应用才可以启动芯片;第二层,声纹;第三层,随着算力的提高,深聪希望未来尽可能在本地做通用的语音识别,尽可能少地往云端传数据。

4

双向优化:算法是灵魂,芯片是架构

观察TH1520的时间表,发现明显比传统芯片周期快了不少:

2018年3月,深聪公司成立;

2018年8月,完成流片;

2018年11月,点亮验证;

2019年1月,发布。

周伟达表示,做芯片最大的挑战,其实是前期的决策,到底要不要自己做芯片。决策明确后,怎么做相对顺利。深聪只做最核心的部分,即芯片的产品定义,设计AI架构。TH1520设计跟验证、demo、测试以深聪为主,由中芯国际代工生产。其他封装等流程交给成熟的合作伙伴,加快进程。

另外,软硬件结合也极大加速了造芯速度。

深聪把算法团队和芯片团队放在一个团队中,在双方痛苦的磨合中,摸索出了一套软硬件结合的方法。一路走下来,算法团队更了解芯片的硬件流程,硬件团队也更明确了算法背后的市场需求。算法在遵守硬件规律的前提下,对未来2-3年市场需求做预测,由此倒推对硬件团队提出需求。

深聪的这种造芯模式,吴耿源称为“通用——专用——架构”趋势下的双向优化。软件定义硬件,硬件反馈软件。算法探索机器学习的特定架构,架构再回馈给算法去优化,实现双向优化。这种模式,极大提升了深聪造芯速度。

如果选择通用芯片,AI算法对接芯片,人力物力的投入大概需要3-6个月,去匹配硬件的架构。而深聪芯片架构一开始就是根据算法的需求去定义 ,所以只用了一个月就对接完毕。

思必驰CTO/深聪智能CEO周伟达

5

三大阵营角逐,AI芯片大战在即

2018年,出门问问、Rokid在内的国内AI语音公司纷纷踏入自研芯片这一新赛道。但这些芯片距离真正量产交付,到达实际消费场景,接受首批消费者检验都需要一段时间。所以,2019年,才是真正验证各家AI语音芯片成败的时间。

深聪智能执行副总裁吴耿源告诉智能进化论,目前,国内AI芯片市场的玩家大致分三大阵营:

一、 BAT+科大讯飞,科技巨头和行业龙头。他们的AI芯片主要用于云平台。

二、 传统芯片设计公司。目前中国芯片设计公司有1600多家。吴耿源认为,其中大部分不理解AI算法,以及背后的市场需求,也接触不到大数据。未来,芯片公司要增加竞争力只能靠自研算法或购买算法公司,但两条路都不好走。

三、思必驰这样的AI算法初创公司。垂直深耕是他们的机会和差异化竞争力。

吴耿源认为,端侧的AIOT领域属于“碎片化市场。每一个场景都不够大,但累积起来很大。这样垂直特定应用场景,需要实力玩家做整合。BAT进不来,因为他们忙着大战场。”

通过对算法的工程实现、芯片的配置架构以及芯片的物理实现的融合,思必驰迅速推出了第一代芯片,目的是快速量产,落地到广泛的智能家居场景中。2018年8月,深聪已经开始规划第二代芯片。预计2019年上半年,完成对第二代芯片的定义。更远的未来,深聪希望通过视觉、类脑等多模态融合,实现拟人化交流体验。

2019年,必然是AI算法公司造芯成果接受市场检验的关键一年。通过芯片这一关,语音交互才能奔向更好体验、更高效率和更低功耗的场景落地。


 
最新文章
相关阅读