8月16日,由深圳市人工智能行业协会主办的全球人工智能创业者大会在深圳成功举办。大会期间,猎芯网有机会采访到了云知声联合创始人、副总裁康恒。作为一家成立于2012年的企业,云知声在7年的时间里已经成长业内少有的拥有完全自主知识产权的智能语音识别AI技术企业,其语音识别、语义理解、语音合成、声纹识别和离线操控等技术已经获得了市场的高度认可,产品在智能家居、智能车载、智慧医疗、教育机器人等领域被广泛应用, 目前合作伙伴数量超过2万家,覆盖用户超过2亿,融资已经超过20亿。
随着AI科技浪潮的涌动,巨头们纷纷加码布局AI芯片,从2014年提出“云端芯”,潜沉数年的云知声在2019年年初,一口气发布了雨燕Lite、海豚(Dolphin),以及雪豹(Leopard)三款AI芯片,毅然决然的投身到新一轮的中国芯片大战中。
面对前有Google、微软,后有BAT百亿资金加持的AI芯片领域,越来越多的企业选择跨界进入,云知声选择做AI芯片背后的驱动因素是什么?云知声在其中的定位是什么?其中有哪些独特的思考?人工智能行业怎么保证安全?猎芯网编辑带着这些问题和云知声联合创始人、副总裁康恒进行了探讨。
沉下心自研芯片,寻找最佳平衡点
康恒指出,云知声的初期是做基础语音技术的研发,在发展的过程中发现仅仅靠提供一个技术性的平台已经满足不了AI应用的需求,人工智能技术要落地的话必须要跟行业去做深入的结合。
在选择行业发展方向时,云知声发现物联网对人工智能有非常明确的需求,其产品的多样性和碎片化更突出了语音识别在人机交互中的重要性。在和众多的物联网行业的企业进行沟通和探讨人工智能如何落地的时候,大家都不约而同的提出一点要求就是希望云知声能够提供整套的解决方案。当时大家用的都是第三方芯片和通用芯片,市面并没有现成的适用于物联网、人工智能的芯片,这也是云知声沉下心做芯片的根本原因。
对于芯片研发遇到的困难,康恒认为最难做到的就是让用户体验和成本达到最完美的一个平衡点。云知声在规划做芯片后就一直致力于解决这一问题,目前提供的整套解决方案中已经把软件算法、芯片平台已经做到了用户体验和性能的最佳平衡点,为客户省去了漫长的研发过程,能够快速集成云知声的解决方案到产品当中,除此之外,价格也在用户可以接受的范围之内。
AI芯片大战中,云知声对芯片的定义
除了Google、微软、BAT、华为等巨头外,同行思必驰、猎户星空也都选择在AI芯片领域大干一场,如此激烈的竞争下,云知声凭什么杀出重围?从康恒的介绍中我们得知,云知声决定做芯片,并不是因为风口,是深思熟虑过的。
他指出,做芯片是一件投入非常大且研发周期较长的事情,从2015年规划做芯片,2016年正式开始做芯片,到2018年4月云知声的第一颗芯片雨燕流片,这两年多的时间,云知声做的最重要的一件事情就是去定义芯片。通过反复把芯片、算法和应用场景相结合,找到最佳的平衡点,最后定义出一款符合市场上需要的芯片。
对于新进入人工智能行业的企业来说,都需要经历这样以一个过程。从云知声的角度来看,算法和芯片的研发都是可控的,最重要的就是产品的定义,而云知声已经在行业里扎根了很长时间,对客户需求、市场需求、产品形态、成本和功耗都理解的比较透彻了,这也是云知声的优势所在。
对于大量资金和企业转入AI芯片行业,康恒告诉猎芯网,这其中很大的一个挑战就是创业者是否有足够多的应用场景和足够多的的客户来使用这颗芯片,其中必要的要求就是要有客户的基础,有大量资源的支撑,一股脑投入做芯片并不是明智的选择。而云知声在通用芯片平台的时候,就已经积累了大量的客户和应用场景,可以从需求和应用场景出发去做芯片,然后为客户提供更好的解决方案。
领先行业的布局:多模态AI芯片战略
在年初,云知声一口气发布了雨燕Lite、海豚(Dolphin),以及雪豹(Leopard)三款芯片,目标领域为智能家居、智慧交通和智慧城市,其中“海豚”和“雪豹” 兼具AI语音和AI视觉的能力。
作为一家以语音识别技术为核心能力的企业,云知声突然而来的视觉识别技术能力也让业界为之一震,然后话题就聊到了云知声的“多模态AI芯片战略”上了。
康恒介绍,5G即将迎来爆发,应用场景将不断丰富,未来对于人机交互的需求会越来越强烈,单一的语音技术将满足不了交互的需求,具备多维度AI数据集中处理能力的多模态AI芯片将成为主战场,通过多模态能够提升智能化产品的交互体验,云知声往这个方向走是自然而然的事情。
康恒表示,AI与IoT的叠加要求传统解决方案朝五大方向转型:从通用架构-AI架构、从依赖硬件到软硬件一体、从PPA模式到垂直场景模式、交互从单模态转向多模态、设备从独立到协同。为此,云知声提出了AI On Chip概念,打造了DeepNet2.0多模态神经网络处理器IP,兼容多种神经网络。应用该成果,云知声实现了超听限同向降噪等技术。云知声今年还将基于该IP推出新的AI芯片“蜂鸟“。
对于下一阶段的发展目标,康恒强调了两点,首先是在技术方面继续夯实云知声的全栈技术,在技术的多样性和全面性方面进一步提升,并在已有技术优势上进一步夯实自己,朝着人工智能语音行业中技术领头羊的目标继续努力。然后在行业落地中,继续扩大AI与行业结合的力度,提升与行业结合的深度,为企业提供能够提升他们产品价值的解决方案。
人工智能数据安全隐私问题
关于最近几年行业内爆发出了一些数据隐私泄露的相关问题,康恒表示,云知声对数据安全和隐私非常的重视,可以从两个方面来尽量减少这样的隐患发生。
第一方面取决于企业的技术能力,对于一些online应用,在技术架构、软件架构和质量、网络协议等方面都需要充分的考虑防攻击的问题。云知声从做语音云平台开始就充分考虑了安全的问题,从网络协议、系统底层开始设计的时候就十分的重视。
第二个就是企业自律,很多企业数据泄露的原因是因为自身的不自律,有些企业在设计和实现产品的时候故意留有后门,这样大大的增加了隐私泄露的风险。康恒指出,当下除了一些行业的自律公约外,还需要政府牵头出台来形成一些法律法规,一些强制性的要求可以促进行业健康长远的发展。
小结
从“云端芯”到“多模态AI芯片战略”,领先的战略也让云知声成为了行业中的独角兽企业,目前正在科创板上市准备中。在发展的过程中,云知声坚持从应用场景、行业需求中去定义AI芯片,最后为客户提供一个集性能、功耗和成本最优的全栈式解决方案。在采访中,康恒多次提到了夯实这个词,这也体现了云知声对技术和产品的坚持,相信云知声能够在自己的赛道上跑出风采!
(审核编辑: 林静)