思必驰赵恒艺:国内智能语音行业发展前景广阔 原创

思必驰赵恒艺:国内智能语音行业发展前景广阔

原创
作者:杜美洁 2017-07-28 14:29:56
新闻
人工智能
语音识别 近日,在由51CTO主办的2017WOTI全球创新技术峰会上,记者有幸采访了思必驰副总裁赵恒艺,针对全球智能语音行业的发展现状,思必驰DUI (AISpeech Dialogue User Interface)开放平台以及思必驰未来的发展规划等问题进行了深入交流。

【51CTO.com原创稿件】随着人工智能的快速发展,作为人工智能领域中最先落地的应用之一,语音交互开始成为很多设备的标配,被越来越多的人关注。微软、苹果、IBM、思必驰、科大讯飞等国内外厂商都在研发语音交互技术的新策略新算法,似乎人类与语音的自然交互渐行渐近。

近日,在由51CTO主办的2017WOTI全球创新技术峰会上,记者有幸采访了思必驰副总裁赵恒艺,针对全球智能语音行业的发展现状,思必驰DUI (AISpeech Dialogue User Interface)开放平台以及思必驰未来的发展规划等问题进行了深入交流。

[[198405]]

思必驰副总裁赵恒艺

据赵恒艺介绍,目前,思必驰主要针对车载、家居、机器人/故事机等产品做垂直领域下的对话式交互,根据各个垂直行业做场景化的语音技术创新、优化,做差异化的语音解决方案。

全球智能语音行业的发展现状

据今年年初,调查公司VoiceLabs发布的《2017年语音报告》显示,2015年和2016年智能声控设备的销量共计650万,2017年该数字将达到2,450万。

目前,几乎国内外所有的IT巨头都在积极布局人工智能领域,并都相继进入了智能语音市场,全球智能语音市场竞争日益激烈。在国外,苹果收购英国对话公司VocalIQ并曝出在剑桥设有秘密研发地,据了解,思必驰的首席科学家俞凯是剑桥大学语音博士,也曾为VocalIQ的创始人之一;IBMWatson在英文语音识别领域也进行着不断地升级,带来更好的体验。在国内,BAT已在人工智能领域全面布局,智能语音成为其必要一环;作为专业的语音公司,思必驰在其垂直细分领域的表现十分抢眼。

针对国内智能语音行业的发展,赵恒艺认为,一方面,从智能语音这个行业来讲,整个华语行业有非常举足轻重的作用。目前,在华语行业,特别是在语音行业的一些科学家都是黄皮肤、黑眼睛的黄色人种,中国人在行业的发展中扮演着重要的角色。而且,汉语言是非常具有自身特色的语种,具有自己的研发规律和特点。另一方面,从国家层面来讲,我国首部国家级人工智能发展规划——《新一代人工智能发展规划》,更是将新一代人工智能发展提高到了国家战略层面,为国内智能语音行业的发展提供了很好的环境,同时也为中国引领智能行业创造了机会。

人机如何更好的实现对话交互?

如何通过人工智能技术实现更自然的人机交互,这是企业都希望自己能够做到的。赵恒艺表示,现在,人机交互到了一个比较关键的时期。随着移动互联网技术的快速发展,人们不再局限于鼠标键盘的交互方式,实现了智能终端触摸屏的交互方式。如今,伴随移动智能设备的快速发展,以及无屏化、小型化的场景开发,自然语言的交互必将成为主流的交互手段之一。但是现在仍然是一个开始,思必驰一直认为语音交互是非常重要的手段。

赵恒艺强调:“声音蕴涵着内容,通过口语式的对话能够从我们的设备端去连接到更大的世界,我们希望跟设备做一个很好的打通,语音除了服务之外,就是连接各种各样的设备,比如智能中控可以控制家里所有的设备,就是很常见的一个场景。然而,目前在这个行业仍然没有真正的打通,中间还有非常多的路要走,需要业界同仁一起携手去推进整个行业的发展。”

以对话为核心的DUI开发者平台

语音交互将使人机交互以人类最天然、熟悉的方式进行,这是未来智能生活的必经之路。作为在语音行业里比较有影响力的公司,思必驰推出了一站式对话定制开发平台——DUI开放平台。该平台由赵恒艺带领公司100多人的技术团队,历时大半年完成。平台集专业技能商店、多场景覆盖、一站式开发、数据可视化等优势于一体,不仅面向普通开发者、企业用户、也面向第三方平台公司,提供语音识别、语音合成、语义理解等基础技术能力,带来一整套标准化方案,帮助企业根据产品具体需求,去实现更细致入微的智能交互。

赵恒艺表示,相对于市面上其他的平台,DUI平台的优势在于我们不仅仅是一个对话式的定制平台,也在于:

第一,本地和云端均可以进行相关的对话定制。现在,非常多的语音相关运用都是云端,思必驰DUI开放平台既提供云端服务,也提供本地技能服务,以车载上的应用为例,DUI平台可以在弱连接的情况下做到对话和运用,确保在网络不佳甚至是无网的环境下,基本功能仍然可用。同时,DUI平台支持全流程的定制,包括语音识别、语音识别前的信号处理、语音唤醒、对话逻辑等很多工作的参数定制,可支持整个对话流程中所有的技术细节的灵活设置。

第二,全流程可控。语音操控只是一个入口,在用户通过语音跟设备对话的过程中,思必驰关注的不仅仅是设备获取信息,获取到什么样的信息和内容,还包括如何形成最后设备端的出发与反馈,实际上,这仍然是需要在DUI开放平台来解决的一些问题。满足这些需要,就要连接到第三方设备、服务、数据,从后端的技能出发连接更多、更大的资源。

第三,可以做用户运营。DUI平台支持数据可视化,思必驰大数据团队可以做到实时的数据更新,比较复杂和基础的数据都可以做运营管理和呈现。比如:可以给产品者发季度报表,同时开发者绑定思必驰微信服务号的帐号之后,就可以在手机上看到自己产品的数据,从而时刻关注自己产品运行的情况,从而帮助开发者加快研发迭代,为他们的用户能够提供更大的价值。

展望未来,夯实技术基础仍是重中之重

目前,思必驰已经与众多业界一流公司达成合作,包括阿里、腾讯、小米、乐视、君正、联想等等,帮助数亿用户通过思必驰自然语言交互技术,实现与智能家居、车载等智能终端的互动交流,在业界获得了很好的口碑。

谈及思必驰在未来两三年内的发展规划与目标,赵恒艺表示:“首先,夯实我们的技术基础是重中之重,因为我们是技术驱动的公司。我们希望研究能力及核心的算法能力仍然保持在行业的领先地位,这是我们一定要做的事情。其次,在业务上,我们希望能够做的更好,与我们的行业合作伙伴一起推进基于DUI开放平台的交互。我们希望在整个DUI平台的产出量上十亿的规模。”

【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】

责任编辑:蓝雨泪
来源: 51CTO.com
智能语音
语音识别
语音交互