百分点刘译璟:人工智能或许应该这样看
原创
作者:刘晶晶 2017-07-12 15:30:59
人工智能 随着各行各业数据量的急剧增加,大数据技术发展以及高性能计算硬件的成熟运用,人工智能技术在诞生至今的60年中终于重新吸引了大众的目光,从今年上半年多场有关人工智能的技术分享、主题论坛活动就能深刻感受到行业的火热。
【51CTO.com原创稿件】随着各行各业数据量的急剧增加,大数据技术发展以及高性能计算硬件的成熟运用,人工智能技术在诞生至今的60年中终于重新吸引了大众的目光,从今年上半年多场有关人工智能的技术分享、主题论坛活动就能深刻感受到行业的火热。
技术关注必然会带来资本追捧,人工智能也不例外,但客观地讲人工智能距离真正大规模运用并带来多种应用的成功落地还需要大量时间,例如人工智能在商业领域的价值还未得到充分验证,如此火热依旧是技术驱动而不是市场驱动,客户需求没有得到充分满足,没有看到新的商业模式,应用领域比较狭窄集中在精准营销、个性化推荐等互联网场景中,例如自动驾驶和金融等领域……百分点集团技术副总裁兼***架构师刘译璟表示,当前的人工智能技术还只能在较窄的场景下应用,要想更好地解决现实问题,还有很长的路要走。
知识图谱会成为推动人工智能发展的利器
业内表示,现在人工智能的发展并没有出现算法和模型上得革命性变化,深度学习早在八十年代就已经出现,如今被广泛关注大部分的原因还是数据量的激增,在继续发展的过程中,AI发展还有很多理论、技术方面的问题没有解决,这些问题逐一解决有可能推动AI的发展。
“照目前的形势发展,AI能够用出效果并产生商业价值一定是在垂直行业,但是垂直行业的数据量并不算庞大,通过构建知识体系把小数据好好用起来就很关键。知识体系是AI中非常重要的技术领域之一,被称为知识表示。众所周知,2012年谷歌的知识图谱越来越得到行业的认可,以知识图谱为代表的知识工程会得到更多关注。”刘译璟对记者说。
人工智能中的知识表示理论研究的是如何将人类体系中的知识用计算机可以理解的语言表达出来,以及如何让计算机在基础上进行推理,典型技术包括本体、语义网以及知识图谱。建设一个实用的知识图谱并不是一件简单的事儿,需要人们将已有的知识进行体系方面的梳理,再用属性、关系等方式描述,目前像 Google、微软这样的巨头企业已经着手建设自己的知识图谱,可以预料的是人工智能的进一步发展定会依赖于各行各业知识图谱的建设。
深度学习虽好用,但说***?大错特错
长期以来,视觉和自然语言处理原本是两个独立的学科,深度学习将两者有机相连,为彼此带来了突飞猛进的发展。对图像、视频的理解从简单的独立标签到连贯的自然语言描述,深度学习只用了几年。
深度学习赋予了单一维度图片数据、以及二维视频数据更强的被理解、被识别的能力。这次人工智能热潮让“深度学习”广泛传播,有的人认为深度学习是实现人工智能的***武器,***的程度不可想象。对此笔者专门在采访中向刘译璟咨询了深度学习是否真的有那么神奇。
深度学习作为机器学习的一种,可以算作是连接主义的一种方法,但并不是所有的方法,这种方法只能解决的是归纳,完成归纳设计,这也是***的局限。我们知道深度学习需要海量样本进行训练,例如AlphaGO的自我对局,如果学习的样本越多,效果就会越好;而且深度学习的层数越多、特征越多,需要的数据量就越大。但在真实的业务场景中,真的有这么多数据吗?
例如围棋、游戏这种不需要多次重复的场景,可以在短时间内完成数据的积累,但现实中我们面对的是投资理财、灾害评估这些场景,数据在少得可怜的情况下,又能怎样做?即使能够积累足够的数据,时间的长短也很难把握,在这些场景下,深度学习是无能为力的。
刘译璟补充道:“随着学习的深入,深度学习在技术方面的局限还会有很多,归根到底深度学习是一个优化问题,这个优化用怎样的方法还亟待选择。例如,随机梯度下降的方法,训练时间很长,消耗的资源也很多,很难用到现实中迅速需要做出决策的场景中,是否有一些新的优化技术?有没有一些像量子力学的计算方法可以让这件事情做得更快,这也是目前很大的局限之一。”
此外,深度学习是一种端到端的学习方式,以神经网络著称,从输入到输出是一个完全自动的过程,不可解释和缺乏反馈机制又成了局限。简单来说,我们既不知道模型学到了什么,也不知道它归纳出了什么,更无法将得到的结果举一反三,我们还无法对学习到的知识进行评估并优化……“深度学习是一个很好的工具,至少在某些领域里很好,但深度学习只是很小的一个技术点,离实现人工智能还很遥远。”刘译璟总结道。
边缘计算或成为人工智能落地的技术支持
如今,“万物上云”已经成为企业竞相追逐的焦点。将各个终端数据汇总在云端进行集中建模来实现人工智能的部分技术,事实证明确实不靠谱。简单来说,数据汇总到云端还是存在隐私泄露危险的,无疑带来了数据安全以及法律道德等诸多问题,增加了行业风险;像自动驾驶以及智能语音等应用的落地,存在快速的响应的问题,云端这种部署确实很难达到;此外,云端建模的方式也会极大影响效率,根本在于应对个性化的终端以及数据,这种方式很难Hold,分分钟bug丛生。
如何解决人工智能云端部署,刘译璟表示可以采用集中式建模(云计算)+ 微建模(边缘计算)结合的方式进行历史和现场建模的同步实现。边缘计算可以对一些简单问题进行自处理并将结果上传云端,也就是说边缘计算是云计算的“缩小+加持”版本,可理解为是靠近设备的小型数据中心,这或许会成为人工智能在商业应用落地重要的技术支持。
谈及百分点对人工智能的布局,刘译璟表示,百分点从2009年就已经在利用人工智能技术,致力于自然语言处理、知识图谱方面的推进。如今会更多强调自然交互,完成产品在各种场景使用的需求,例如新发布的智能交互分析引擎,现在的数据分析技术确实还需要更多的专业性要求,百分点希望解决的是从非常模糊的语义到精确的计算机操作,这种过程的转变,为此会在自然交互领域的研发投入更大的精力。
【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】