公司动态 投资企业 原创研究 媒体聚焦
【行业聚焦】 海致星图CEO杨娟:知识图谱应用的最好时代正在来临
2019 10 23

注:近日,海致星图CEO杨娟在天堂硅谷信息技术闭门会上做了精彩发言,以下根据其讲话实录整理而成。


【行业聚焦】 海致星图CEO杨娟:知识图谱应用的最好时代正在来临


在2018年和2019年Gartner的新兴技术曲线当中,连续两年出现对知识图谱的评估。知识图谱仍然处于促动期(Technology Trigger)。Gartner的预计是5年之后,知识图谱将进入实质生产的高峰期((Plateau of Productivity)。作为知识图谱这个领域的资深从业者,我认为这是对知识图谱这门技术的一个非常客观的评价。2016年,海致星图成为国内将知识图谱应用于金融领域的先行者。百度出身的创始团队和拥有IBM、阿里云等产业背景的运营团队联手之下,海致星图短短三年间发展迅速:从招行打开局面后,现如今已经服务于四十余家金融机构,覆盖银行、券商、证券交易所、保险等场景。

 

众所周知,知识图谱被誉为认知智能的核心技术。然而认知智能之路,远比计算智能、感知智能要漫长,知识图谱这门技术也在不断演进之中。在过去几年当中,知识图谱较为成熟的落地场景主要集中在图相关的领域,知识图谱的极大魅力在于它的图结构,可以在知识图谱上运行搜索、随机游走、网络流等大规模的图算法,使得知识图谱与图论、概率图等碰撞出火花,解决了面向复杂关系的分析与发掘的难题,在企业股权关系透析、欺诈团伙发现、客户亲密度检测等领域释放出巨大价值,得到金融机构的广泛认可。这些在过去传统数据技术条件下无法实现的智能化分析,依靠知识图谱得到了解决。例如,在招商银行信用卡中心,海致星图知识图谱平台之上构建了一张20亿节点、300亿条边的客户网络,在网络上运行了数十个面向关系挖掘的业务模型,在精准营销、贷中预警、贷后失联修复等领域释放出巨大的业务价值。

 

随着时间的推移,知识图谱的相关技术也在不断发展。在技术层面,知识图谱技术和方法除了进一步与自然语言处理技术深度融合,另外一个更加明显的趋势是和深度学习在更多层面形成互补,通过表示学习的手段把知识图谱中的离散符号(实体、属性、关系、值等)用连续型数值进行表示,从而提升深度神经网络的可解释性,以及将图神经网络方法应用于知识图谱的推理与挖掘分析,利用知识图谱里面所蕴含的丰富关联性知识帮助减少少样本和零样本学习的难题。

 

具体到行业应用层面,体现在金融因果关联图谱的精细化构建及深入应用,包括围绕事件构建事理知识图谱、利用事件抽取技术提升新闻事件识别的敏感度、建立事件因果推理知识库、利用事理图谱分析技术对事件影响力传导进行深度分析等,挖掘事件之间随着时间推移的相互影响,基于动态的事件本体构建以及关系抽取、动态推理,来进行违约概率关联波动、授信客户欠息/逾期关联代偿效应、风险事件传导强度估计与传染广度等分析。

 

事件的影响分析有两个维度,一是事件回测,二是事件传播影响。事件回测是对历史上同类事件的发生做一个数据统计分析,对于上市公司而言,回测的目标可以是设定为行情的收益率、波动率或者某个金融工程的具体模型,目的是看历史上同类事件发生后,对于相关公司会有什么样的影响。事件传播影响则是通过事件识别命中某个事件主体,将该主体关联到图谱里,可以查看跟这个事件相关的企业链信息、股权链信息和产业链信息。事件自身的正负面、影响度、热度会沿着知识图谱实体的关系网络进行传播,对这个传播影响进行定型或者定量的分析。例如深圳证券交易所与上海证券交易所均与海致星图合作构建了风险事件传导推理平台,对于市场突发事件,例如p2p暴雷、中美贸易摩擦等,通过知识图谱量化预测它的影响范围、影响力、传染路径,加强对上市公司的监管。

 

随着金融监管政策以及数据隐私保护政策的不断加强,数据智能技术在个人消费领域应用进入了平稳期,而在产业端的广阔应用前景则被刚刚打开。在工业制造及能源领域,针对设备智能化运营的知识图谱正在蓬勃兴起,例如在“设备一致,网架统一,关系联通”的总体原则下,构建变电站、线路、变压器、杆塔、通道、用户、电能表等实体的关系网络,实时检测线损相关的电量异常数据,并确保各设备横向保持一致且纵向关联无断点,提升输电线路工程建设和巡检的智能化、自动化水平。


产业端的复杂程度较之消费端呈指数级上升,对复杂事物的理解与认知,需要融会贯通机器知识与专家知识,实现真正的“人机通行”,这正是知识图谱应用的最佳领域。我们相信,知识图谱应用的最好时代正在来临。


相关新闻