点击上方“公众号” 立即订阅哦!MARTIN HACK, Skytree机器学习公司联合创始人及首席执行官
Image: manoftaste.de/Flickr
当亚马逊向您推荐了一本您可能感兴趣的书;当谷歌预测到您现在应该出发以准时参加会议;当潘多拉神奇地为您创建了您喜欢歌曲的播放列表,这些都是基于大数据技术的机器学习的最佳范例。根据高德纳公司统计,大数据预计将推动企业实现2420亿美元的IT支出,大数据就是未来。因此,越来越多的各种规模的企业都参与进来,不想错失良机。对许多企业来说,大数据代表着战略资产,它反映了该企业的整体经验。每一位客户、合作伙伴或供应商的反应或无反应、交易、流失、信用违约和投诉都能够为企业带来可以从中学习的经验。从客户角度来看,每一个在线完成的行动、每个销售流程、产品互动、处方药品和环境异常,都能够从多方进行追踪。近年来,许多企业专注于如何存储和管理这种数据。我们应该如何最好地架构我们的企业堆栈,以通过Hadoop 、复杂事件处理、NoSQL和传统数据仓库从大数据中获得尽可能多的价值。我们应该在内部部署还是在云端部署数据?这些都是我们要回答的问题,但都不是为什么大数据如此重要的核心问题。只有通过先进的分析,尤其是机器学习,企业才能够真正运用他们的丰富经验,利用它自动发掘见解,生成预测模型,从而充分利用这些模型捕捉到的所有数据。这种先进的分析技术意味着企业不用再紧盯着过去以获得结果报告,而是可以基于对现有数据的分析来预测未来将发生的事情。机器学习的价值源于它可以创建精确的模型来指导未来的行动,并发现我们之前从未见过的模式。
机器学习的定义关于大数据生态系统中机器学习的定义,目前还相当混乱。许多软件供应商都声称,他们能够做预测分析、深度学习、规范性分析和机器学习。我们现在是时候该对这些术语进行定义,以便供应商和买家能够知道一个既定的软件解决方案能做什么,以及它的价值在哪里。
机器学习是从数据中找到模式并进行预测的先进科学,它基于多元统计、数据挖掘、模式识别和高级预测性分析等方面的工作。机器学习方法在我们需要从大型的、多样的、快速变化的数据集(即大数据)中发掘深度的预测性见解的情况下尤其有效。在这些类型的数据领域,机器学习在准确性、规模和速度方面可以轻松战胜传统方法。例如,当刷信用卡消费的几毫秒过程中发现盗用行为时,机器学习不仅掌握了与交易相关的信息,例如金额和地址,同时还会衡量用户的消费记录和社交网络数据,以对潜在盗用行为进行准确的评估。机器学习方法在分析潜在客户流失率方面拥有巨大优势,它可以从多个信息源进行数据分析,例如交易信息、社交媒体和CRM等。高性能的机器学习可以分析整个数据集,而不是简单的其中一个数据。这种可扩展性不仅可以使基于精密算法得出的预测性解决方案更加准确,也提升了软件速度的重要性,包括对数十亿的行和列进行实时消化以及分析实时流数据的速度。对于我们这些实践和开发机器学习技术的人来说,仅仅具备提供最精确、最快速、最具扩展性的预测性见解的能力还远远不够。归根结底,为了使机器学习能够以真正有意义的方式改变我们生活的世界,我们必须使它更智能、更实用。为了让包括拥有博士头衔的数据科学家和企业用户在内的所有人都能够利用最先进的机器学习技术,我们将把这项技术真正地推向大众,并帮助各种规模的企业显著提高获取洞察力的速度。大数据分析软件对比在考虑购买大数据分析软件时,企业应记住以下三点:1最一流的机器学习软件。由于大数据的规模、种类和速度不同,许多传统技术往往会遇到瓶颈。基于机器学习的分析解决方案最适合快速变化的数据、大量的非结构化数据以及与大数据相关的单纯性扩展问题。2为企业服务的机器学习。通常情况下,企业使用机器学习软件来开发预测模型,并将其用于多个应用程序,例如客户流失分析及预防、实时推荐、欺诈分析及预防等。因此,能够将基于机器学习的技术轻松地整合至企业软件环境中是一个非常重要的要求。
3可访问接口。在竞争异常激烈的市场上,企业需要快速部署先进的分析解决方案。因此,基于机器学习的分析平台必须既能够被不同的用户简单使用,也能够使其快速获得洞察力。我们生活在大数据时代。在此之前的业务模式转变是由蒸汽机、碳素制品、电力、半导体、计算机和互联网推动的,而我们目前正在经历由大数据驱动的时代热潮。我们拥有巨大的机遇来发掘那些能够使我们做出更快、更好的业务决策的洞察见解。在这个大数据的时代里,通过机器学习这样的先进分析方法,企业将能够更快地从其数据资产中实现宝贵的价值,从而成为市场中的赢家,将竞争对手甩在身后。所以摆在面前的问题是:您只是想存储您的数据,还是希望利用数据创造真正的企业价值?
Learn OracleFrom Oracle
微博:@甲骨文大学官微微信:@甲骨文中国培训服务@Oracle 职业发展力计划
优酷视频空间:@甲骨文大学长按二维码进行识别点击“阅读原文”浏览英文原文