公司动态 投资企业 原创研究 媒体聚焦
【行业聚焦】深度好奇:让机器善解人意
2019 10 28

注:近日,深度好奇联合创始人兼CEO李祥生在天堂硅谷信息技术闭门会上做了精彩发言,以下根据其讲话实录整理而成。


【行业聚焦】深度好奇:让机器善解人意


深度好奇有一个企业愿景和目标:“成为中国认知智能领域的领军力量”。这首先代表深度好奇必须做出真正的认知智能硬核技术,在国内国际上达到一个水准。我们的主要方向是自然语言处理(NLP),这是认知智能的核心,包含不同技术领域。而在我们最擅长的部分,必须做到比巨头更强。


在介绍深度好奇的技术和产品之前,首先,我想谈几个基本观点。

第一个观点:人工智能的发展就像爬楼梯,左脚是感知,右脚是认知,两个脚要交替上升。

经历以视觉、生物识别为代表的感知智能前几年的迅速发展普及之后,我们认为,认知智能,即将或正在成为人工智能发展新的重心。而且中长期市场容量可能比感知要大,会再上1-2个数量级。市场容量跟着要处理的数据量走。随着5G到来、智能应用深化,数据量剧增,其中很大一部分是非结构化数据,而文本和语言信息可能占了大头。我们知道,不能结构化的数据,机器是没法处理的。数据是矿,储量迅速增大,但采矿能力严重不足。这就是我们今天做认知智能、做自然语言处理的核心需求驱动。


第二个观点:认知智能落地,要和行业逻辑做深度的结合。认知关乎于主题、对象、知识和知识的关系,许多都带有非常鲜明的行业和领域特征。所以深度有两个含义。第一个含义是,从通用领域到细分行业,从广到深,涉及内容指数级放大,容量/量级就上去了。第二个含义是,对行业深入其中,做认知智能要吃透行业。要有深度好奇,深入其中,才会有深度认知。


第三个观点:自然语言处理是认知智能应用必须要突破的瓶颈。“语言是认知之母”,从知识表示、到大脑理性的思维活动、表达、沟通、推理、决策……,都是以语言为主要载体。而语言的难度、复杂度、多样性,决定了所需要的技术高度、难度和复杂度。所以比尔盖茨说“自然语言是人工智能皇冠上的明珠”。这是一个需要突破的地方,瓶颈突破,后面蕴含的巨大价值才能够被释放出来,而掌握瓶颈技术的人,可能有优先获取权。

深度好奇就在做这件最难的事情。深度好奇的创始人、CTO吕正东博士在这方面的工作,具有国际一流的水准。在过去五年的ACL(自然语言处理国际顶会No.1)排名前30的高引用论文中,有四篇来自大中华区,其中有三篇来自正东和他带的团队。所以,在自然语言处理的技术高度上,我们还是非常有自信可以站在国内最强者之列。


通过这几年积累,深度好奇发展出自己独有的一套自然语言处理技术框架——面向对象的神经规划OONP(Objects-OrientedNeural Programming)。结合了人工智能中的符号主义(符号智能)和连接主义(神经网络)。通俗一点说,符号智能力图将一切都清晰地形式化、规则化;而联结主义则更喜欢别想那么多、跟着感觉走。比如在什么情况下出门要带雨伞?如果要把规则写下来告诉计算机,会发现要考虑非常多的因素:天气、心情、为了防雨防晒防身还是伪装、温度、季节、气候可能变化。。。这个规则很难穷举。而跟着感觉走,并不代表随机选择,也是有道理的,只是道理没有显化,这就是神经网络(模糊逻辑)的方法。清晰和模糊、规则和感觉,二者结合,才更接近人脑,也是我们认为处理语言的最佳方式。


这也是人工智能发展的下一代范式。而全球范围里面目前深度好奇可能是唯一一家把这件事情做到落地的。在这个技术框架支撑下,我们得以突破在自然语言理解里面最难的一些部分,开始做到对语言“真正的理解”。我们现在可以实现复杂文本理解、篇章级文本理解、多轮对话、长距离的推理……这个实用价值是非常大的。

在落地场景和行业上,我们现在做了两个行业:公安、金融。现有产品面向前后两端。前端做交互,比如语音调度、多轮对话……,使得交互更加便捷。后端就是基于语义理解,去做非结构化数据的结构化并延展到其他多模态数据。

今天时间有限,我主要介绍一下我们现在的两个产品:

第一个是公安案情解析研判系统。就是对公安案件处理中涉及的各种文本,案情描述、笔录、勘察报告之类,进行语义解析,重构知识和关系,用于理解案情、发现线索、分析串并、侦破推理。

我们的系统最近在上海青浦部署,刚刚上线没多久,就从当地上百起的偷油案中,通过特征抓取识别出一个偷油团伙。这上百个偷油案件,信息非常庞杂。我们产品部署上去之后,基于语义进行各种比对和碰撞,就发现:有四个人在一连串的案件中都在案发地附近出现。我们从案情文本构建的知识图谱中识别出嫌疑人、关联人来,再和手机信息建立关联,再结合各种信息不断发现特征模式,缩小嫌疑人范围,从几千、几百到几十,最后到4个人。。。我们还发现了其他一些关键信息,譬如同一辆外地牌照的车也都在好几个地方出现。。。这些关键信息给到警察,后面的事情一下子就变得容易了。

这个真实案例所印证的技术原理,从刑侦到反恐、网安,包括舆情监控,实际上都一样。

第二个产品是我们叫信贷智能视频审核系统,就是利用人工智能机器人进行线上的视频审核。我们称之为信贷风险审核3.0。1.0就是线下的面审,2.0是大数据风控。在面审这个环节,之前由线下门店来做,人、信息、业务都是分散的,无法标准化、集中化,也存在道德风险。我们现在打通线上线下,由机器人对信贷申请人,进行身份核实和多轮的审核问答,最终形成一个综合评估分数,融合到模型里面去做风控,现在这个系统已经在我们的合作伙伴那里全面上线。我们的多轮对话、语音语义联合处理的技术,和其他周边AI技术结合(比如微表情、声纹识别等),深度进入行业之后,把我们合作伙伴的风控KS指标,提升了5%-8%,这个在业界是非常不容易的。

最后,作为今天发言的一个结尾,我想说一句话:认知智能是一条长程赛道,我们要让自己长出翅膀来。

做NLP,尤其我们去做语义理解、复杂文本理解,难度很大,所以是一个长跑,靠深度、厚度和积累,去实现突破,并且持续地向上走,让天花板和壁垒变得更高。尽管难,我们选择这件事,也会持续不断的去把这件事情越做越好。这是一个基于自身优势的主动选择,也是一个立足于市场环境的竞争策略,因为当你做到最强的时候,就是一片蓝海。当然,在这一点上,我也要感谢我们合作伙伴和客户的支持,特别是今天一起与会的中奥科技给我们的长期支持。

在NLP市场和技术伴随发展的这条长程赛道上,我们要让自己长出翅膀。风来了猪都会飞,但风一停,没有翅膀的猪一定摔得很惨。所以要无惧风起风落,我们得有翅膀。这个翅膀,对于深度好奇来讲就是:硬核技术+行业深度。这是我们自己的理解。

就讲这么多,谢谢各位。

----------------------------------------

Q:我刚才看了你很多应用在公安系统的。比如说有一个犯罪团伙,是几个地方的人构成,北京人、中原往西部的人、华南人……比如说我说一句话,我说我先走就这个意思,北京说我先颠了(音),中原西部的人说我先撤了,广东人会说我走先了,你们是如何把这种方言,不同的表述来达到一致,就说这些人他们先走了?

A:会通过一个学习的过程,方言也要学习,学习之后就可以识别。我们的系统北方方言、南方方言(比如浙江台州话)……,都可以支持。


Q:一般要训练多少次以后能达到这种真正比较精准的认知。因为有些地方方言它其实差别非常大?

A:这个从技术角度,一方面要看问题本身的复杂度,另一方面结合我们给机器提供的学习信息,信息越精准,学习速度就越快。为了精准学习,我们都是自己做标注,人员学历全都是本科以上。所以,从纯粹训练次数上来讲,这个仍然是一个综合概念。就目前而言我们自己系统的一些核心功能,大概训练几千到1万次,就可以达到非常好的效果。这是深度学习的一个优势。


Q:刚刚王总提的其实是通用领域的认知,李总解决的是垂直领域,是有边界的。在没有边界的领域做智能,我们发现虽然大厂都在做,其实解决问题的效果没有那么好,所以我们后来也在往垂直领域在看,看是不是说技术能够在某些行业内找到一些解决方案,问题又刚好是痛点。

A:是这样的。我们知道聊天也好,对话也好或者理解也好,背后一定是依赖于一个知识集,如果是开放式的聊天机器人,想聊什么就聊什么,背后要求的知识其实很高的。所以我们在做方向选择的时候,首先就把开放领域的聊天过掉了,因为我们非常清楚技术应用的边界。


相关新闻