在过去很长一段时间里,人们从数据中获取价值都是依靠数据分析来完成。但传统的数据分析只是给人们提供一系列的报表,一切判断还需要人根据这些报表来完成;机器学习的出现,改变了这一状况。
事实上,机器学习的出现由来已久,作为一门多领域交叉学科,机器学习专门研究计算机是怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,使之不断改善自身的性能。
也就是说,机器学习可以让电脑表现得更像人类。不过这样一来,传统的数据分析已经无法满足机器学习发展的需要,人们需要更加高级的数据分析。日前,笔者采访了Teradata天睿公司首席技术官宝立明(Stephen Brobst),他向笔者详细描绘了人们在未来,该如何运用分析处理引擎实现机器学习和深度学习,展现出一个全新的数据分析时代。
Teradata天睿公司首席技术官宝立明(Stephen Brobst)
从描述到预测 高级分析增强企业洞察能力
传统的数据分析,主要是从海量数据中获取有效的、新颖的、潜在有用的、最终可理解的信息,更多着眼于对过去的总结;但现在人们对数据分析的期待已经不止于此了。
宝立明特意用一个例子对此进行了形象的描述:过去,企业大部分都是看报告或者报表,但这些报告和报表都是属于描述性的分析,就像我们在车里看后视镜一样,所看到的都是过去发生的事情;如果只看后视镜肯定会出事故,所以一个好的司机一定是在需要的时候看一下后视镜,大多数的时间还是要往前看。
对于企业来说,往前看意味着要能够做出预测性的判断,从而避免“交通事故”。如今的现状是,大部分中国企业还停留在看“后视镜”上,还没有建立起预测性判断和分析的能力。
事实上,这里隐含着传统数据分析技术向高级分析的演进。在权威机构Gartner看来,高级分析是使用超越传统商业智能(BI)的先进技术和工具,对数据或内容进行自主或半自主检查,以发现更深层次的洞察,作出预测或生成推荐内容。
也就是说,高级分析是指用于为企业提供比原先更强大的数据洞察的广泛分析技术,这是一个大的技术合集,不仅包括数据挖掘、大数据分析等技术,还包括位置分析、预测性分析、机器学习和高级可视化技术等。
在宝立明看来,高级分析可以分为描述性、预测性和指导性分析三大阶段。其中描述性分析主要是洞察过去,而预测性分析则是为了了解未来,指导性分析更为强大,它可以为可能发生的结果提供建议。
这无疑将企业带来前所未有的帮助,比如在金融领域,高级分析可以让金融企业提前洞察潜在的欺诈风险;而在医疗领域,高级分析可以辅助医生开展疾病治疗。借助高级分析,企业不仅可以预测未来业务的发展状况,甚至还可以预测企业的发展方向。
瞄准下一代分析平台 Teradata Vantage释放数据价值
回顾过去三十年数据分析发展的历程,宝立明将其总结为三个阶段,第一个十年,主要是一些描述性、报表性的数据分析;在第二个十年,实时、动态的数据仓库、数据分析成为主流;而第三个十年则属于机器学习、深度学习的时代,可以给企业提供预测性、指导性的高级分析。
如今,很多企业还徘徊在第一个十年里,少数公司已经进入第二个十年,而Teradata则已经走到了第三个十年。尤其是Teradata Vantage的推出,更是标志着下一代分析平台的诞生。
作为一个面向未来的数据分析平台,Teradata Vantage实现了在一个统一的分析平台中进行数据的融合、分析,这得益于平台支持几乎所有主流的开发语言和工具,以及兼容不同的数据接口,从而实现了以完全开放的架构连接其他平台和数据。
更重要的是,Teradata Vantage借助容器技术的应用,整合了众多最佳分析功能和领先的分析引擎。机器学习引擎和图引擎便是其中的代表,机器学习引擎由广泛的分析功能组成,除数据准备、非结构化数据解析功能外,还涵盖人工智能、统计、文本、情感判别等各种分析类型,可以用于分析成果归类、情感强度评估、客户路径行为、欺诈监测等。
相比较而言,图引擎则聚焦在关系分析层面,以及了解网络用户、产品、过程乃至任何联网实体中这些关系将怎样影响结果。图引擎分析主要应用于网络威胁监测、购物篮服务、社交媒体网红行为等层面。
在制造业,许多大型的制造企业都希望通过物联网分析搞清楚设备使用状况,从而避免出现机器故障给企业造成损失。高级分析借助不同传感器的信息,可以给制造企业提供一些指导性的意见,提醒企业及时开展设备维护,避免出现故障。
在零售业,每个零售商都会通过多个销售渠道来销售商品,高级分析的应用能够将不同渠道的不同商品与顾客信息集成在一起,从而可以帮助零售商更加清晰地了解顾客的渠道来源、购买习惯等,进而有针对性地进行商品推荐、广告等。
除此之外,在金融、电信等行业,越来越多的高级分析需求正在涌现出来。客户行为洞察、客户体验提升等都需要相应的分析引擎作为支撑。如今,各行各业的数据分析的需求不断提高,高级分析技术也将随之不断进化。
正如宝立明所说,随着技术的不断演进,Teradata Vantage除了在效率、价格等方面继续优化之外,也将根据实际的业务应用发展更多新的分析引擎,以满足企业对高级数据分析的需求。
(审核编辑: 林静)