几个机器学习的成功案例
人工智能(AI)和机器学习(ML)(人们曾认为这两者是公司不切实际的项目)正在成为主流。
有越来越多的企业正在利用这种模仿人类思维的技术来吸引客户并加强业务运营。而这种趋势只会越来越受欢迎。Forrester的研究称,全球数据和分析技术决策者中有53%的人正在实施实施人工智能或大规模使用人工智能,另有20%的人计划在未来1数月内实施人工智能。
无论是好是坏,通过人工智能、机器学习和机器人所实现的自动化正在兴起。正在试验、创建、甚至是申请新人工智能和机器学习技术专利的首席信息官们与记者分享了机器学习用例和一些实用建议。
1、“数字预言者”软件可以预测哪些职责将变得无足重轻
人们最初十分担忧机器人会抢他们的饭碗,但这种担忧渐渐缓和了,因为机器可以和人类协作,这种可能性极高。埃森哲的首席技术官兼首席创新官Paul Daugherty今年早些时候在福布斯首席信息官峰会上表示,就重塑员工技能(而这些员工的工作很可能被自动化)而言,企业已经落后了。
埃森哲也难免受到影响,这家咨询公司已经将大约23,000个职务自动化并重新对员工进行了部署。 Daugherty希望为这家拥有45万名员工的咨询公司重新分配职责。
Daugherty说:“我们认为,我们要学习新技能,因为技能实在是不够用。”
为了帮员工开展这项事业,埃森哲创建了一个应用程序,该应用程序使用机器学习对简历进行扫描并对这样的现象进行预测——员工的工作过多久会落伍,Daugherty这样说道。
该应用程序会考虑员工的工作经验,并为此打出风险分数——他们的职务在多大程度上已经落伍。例如,该应用程序将注意到,由于人工智能或其它自动化事物的出现,员工的技能将在18个月内过时。
Daugherty说,该应用程序不仅仅是一个数字预言家,它还考虑了员工的集体工作经验,并对相近的技能提出建议,从而使公司的员工能跟上节奏并与时俱进。
重要建议:首席信息官必须为企业的人工智能战略挑起重担,并与业务部门的主要利益相关方合作,从而确他们能达成共识并且业务不会中断。首席信息官还必须快速发现并消除人工智能算法中的偏差,这些偏差会随着解决方案的扩展而激增。Daugherty说:“称职的人工智能必须融入组织。”
2、信用报告公司构建机器学习分析引擎
在信用卡报告巨头Experian那里,数字化转型为彻底利用机器学习功能的新战略产品铺平了道路:Ascend Analytics On Demand(这是一个自助式分析平台)使公司能够建立预测模型,以确定关键因素,如 2.2亿消费者是否有资格获得他们所要求的信贷额度。
Experian的消费者信息服务总裁Alex Lintner表示,客户可以在几分钟内对所有数据展开复杂的分析,而目前这一过程需要几周时间。理想情况下,该工具将使消费者能够在需要时获得信贷资格。
Gartner表示,由于人工智能技术几乎在所有新的软件产品和服务中渐渐得到普及,Ascend也随之诞生。
Experian Global的首席信息官Barry Libenson(他负责监督该平台的建设,该平台使用Hadoop和其它分析工具)说:“客户希望能够实时查看大量信息,由我们指定规则的时代已经一去不返。当客户想要信息时,他们想实时地得到信息,以他们想要的方式进行。”
重要建议:你无法在遗留软件上构建新的分析平台并指望它们能够很好地运行。为了支持Ascend,Experian采用了混合云的方法并对开源工具进行了投资,包括容器、API引擎和微服务。Experian还对构建和使用软件的方式进行了标准化,全球员工和客户都可以重用其应用程序和代码。
3、信用卡公司用机器学习打击欺诈
与信用监控公司一样,信用卡公司也在打击欺诈者。
万事达卡的技术与运营总裁Ed McLaughlin表示,当很多专家都谴责数字化是网络隐私和安全方面的祸根时,机器学习和人工智能工具却可以使这些服务比塑料信用卡要安全得多。
万事达卡使用多层机器学习和人工智能工具清除恶意用户,并防止他们造成严重损害。 McLaughlin表示,万事达卡的保护措施的核心是一个内存数据库系统,自2016年以来,该系统使万事达卡避免了约10亿美元的欺诈损失。该软件使用200多个属性向量来设法预测和阻止欺诈。
这个核心处理系统(它与标记化、生物识别技术、深度学习和其它新奇方法相结合在一起)帮万事达卡保住了声誉,即促进了价值数十亿美元的安全交易。
重要建议:就网络安全而言,人类是最薄弱的环节。McLaughlin说:“尽可能地将人排除出去,这才是最重要的”,他补充说,机器学习、人工智能以及自然语言处理软件都是万事达卡工具包中的关键组件。
赛车公司利用机器学习分析来获得和赛车有关的洞察
Mercedes-AMG Petronas Motorsport正在使用机器学习功能将赛车的性能可视化。
该公司的IT负责人Matt Harris表示,为了做出关键决策,公司在其一级方程式赛车上对多个数据通道进行收集,有时每秒多达10,000个数据点。
Mercedes-AMG Petronas使用Tibco软件将可能产生影响的变量可视化,如天气、轮胎温度和燃料量对赛车的影响。该软件还使工程师能够仔细分析赛车齿轮的性能和磨损等细节。赛车手通常每圈要换档100次,每次换档时,该软件会收集大约1,000个数据点。
Harris说:“当你将数据可视化时,你实际上可以让变速箱更经久耐用,或者更重要的是,以更快的速度换挡。然后你会发现,如果你将变速箱设为某个模式,每圈的速度大约会快50毫秒。在资格赛中,哪怕是千分之一秒也足以分出胜负,所以50毫秒很重要。”
Harris说Mercedes-AMG Petronas正在构建机器学习算法来帮忙“做人类无法做到的事情,或者做代价高得令人却步的工作”。Harris认为这些功能最终会成为使团队具备竞争优势的关键因素。
重要建议:为什么要构建一些不属于你核心竞争力的东西?在使用Tibco之前,Mercedes-AMG Petronas使用自行开发的可视化软件,事实证明,这种软件效率太低,时间越久越不易维护。有了Tibco,Mercedes-AMG Petronas可以专注于自身的实力:打造高性能赛车。Harris说:“让人们发挥创造力,思考如何解决问题,而不是靠编写软件来解决问题,这才是最重要的。”
4、机器学习预测员工何时辞职
和大多数汽车维修公司一样,Calibre Collison长期以来一直面临着巨大的问题。机械师、油漆工和客服人员往往入职不久就辞职了,有时,在其600多个分店中每年的员工流失率高达40%。
Calibre发现,部分问题在于其维修车间有时没有那么多车辆供员工修理,这导致工资不固定。首席信息官Ashley Denison想知道:如果Calibre可以预测员工何时辞职并进行干预又会怎么样?
Caliber开始与技术顾问Sparkhound合作,后者创建的软件可以从Calibre所使用的人力资源软件Workday中提取员工数据,并与Microsoft PowerBI结合起来,从而创建一个定制的回归模型,这个模型可以预测员工是否会考虑离职。然后,Calibre(通过数字调查或个人联系方式)会向员工提供帮助,帮他们登记在册。
例如,如果员工的工资在几周后下降,Calibre的区域经理可以确保有更多的车辆可供他们修理。相反,如果员工的工作负担看似过重,公司就可以将一些工作重新分配给他们的同事。那么结果如何呢?由于人员流失率降低了,Calibre每年可节省的费用高达100万美元。
重要建议:在人们过度炒作机器学习算法时,通过防范问题的做法来节省资金是使用机器学习算法的可行方法,Dennison说:“一旦员工入职,我们就可以轻松地留住他们。”
5、机器学习有助于预测性维护
机器学习是雷诺士国际有限公司(Lennox International)的数字战略的核心组成部分,该公司使用Databricks提供的软件Spark来分析商用供暖系统和空调系统的信息流,雷诺士的IT主管Sunil Bondalapati这样说道。实时地监控机器的性能有助于公司预测机器何时出现故障,使雷诺士能够提前四小时通知客户(如房主和购物饮食街的管理者)。
Bondalapati说:“Databricks使我们能够使用数据,并在设备即将发生故障时以90%的准确率作出预测”。他还补充说,雷诺士之前能猜到机器何时会出现故障并联系经销商。此类事件通常包括误报,而这使各方都感到沮丧。我们过去一直在努力预测设备故障。”
在使用Databricks的过程中会遇到有很多分析工具,每个工具都用于解决单一用例,例如供应链或物联网(IoT)。但Bondalapati表示,Databricks提供了一个统一的平台,公司可以在该平台上管理来自数百个数据库的数百TB数据,并且它可以在Microsoft Azure上运行,因此雷诺士无需维护系统。
有了Databricks,Bondalapati的团队和业务部门就可以共同为数据流建立模型。基于Spark的软件可以为IT和业务人员转换数据并提供洞察。Bondalapati说道:“Databricks提供的协作模式对我们来说至关重要。”
重要建议:Bondalapti表示,首席信息官必须让这些新工具发挥看家本领,当风险巨大时,尤其要这么做。例如,Bondalapati对包含100亿条数据记录的概念验证进行了监督。Bondalapati说:“我们试探性地做这样的事情,但结果却令人大开眼界。”
来源:企业网
推荐 | 最棒的30个机器学习实例
在过去的一年里,我们比较了近8800个机器学习开源项目选出了其中最棒的30个 (几率只有0.3% )。
这是一个非常具有竞争力的名单,名单是从2017年一整年间发布的最佳的开源机器学习库,数据集和应用程序当中仔细挑选出来的。 Mybridge AI 通过考虑使用频率,参与度和新近度来评估总分。针对总评分给你一个意见, Github stars平均表现是 3558。
年度 Python 实例 (平均 3707 ): 这里
在过去的一年中从顶级文献学习机器学习: 这里
开源项目对于数据科学家来说可能是很有用的。你可以通过阅读源代码以及在现有项目之上构建一些东西来学习。 给机器学习的项目留出足够的时间吧,你可能已经错过去一些年了。
<推荐学习>
A) 神经网络
深度学习A-Z™:动手的人工神经网络 [68745推荐, 4.5/5 ]
B) TensorFlow
用Python进行深度学习的TensorFlow完整指南 [17834 推荐, 4.6/5 ]
No 1
FastText:快速文本呈现和分类库。 [在 Github 有 11786 ]。 由 Facebook Research 开源
……… [ Muse: 基于快速文本的多语言无监督或监督词嵌入。在 Github 有 695 ]
No 2
深度图像风格转换:纸张的代码和数据“深度 图像 风格 转换” [在 Github 有 9747 ]。 致谢 Fujun Luan,Ph。D。 康奈尔大学。
No 3
世界上最简单的面部识别API:Python 和命令行 [在 Github 有 8672 ]。 致谢 Adam Geitgey
No 4
Magenta:智能的音乐与艺术创作 [在 Github 有 8113 ]。
No 5
Sonnet: 基于TensorFlow的神经网络库 [在 Github 有 5731 ]。 致谢 Deepmind 的 Malcolm Reynolds
No 6
deeplearn。js: 为web提供硬件加速的机器智能库 [在 Github 有 5462 ]。 致谢 Google Brain 的 Nikhil Thorat
No 7
TensorFlow的快速风格迁移 [在 Github 有 4843 ]。 致谢MIT的 Logan Engstrom
No 8
Pysc2: 星际争霸 II 学习环境 [在 Github 有 3683 ] 致谢 DeepMind 的Timo Ewalds
No 9
AirSim: 基于Unreal Engine的开源模拟器,用于Microsoft AI & Research [在 Github 有 3861 :star:️]。 致谢 Microsoft 的 Shital Shah
No 10
Facets: 机器学习数据集的可视化 [在 Github 有 3371 ]。 由Google Brain提供
No 11
Style2Paints: 图像的AI彩色化 [在 Github 有 3310 ]。
No 12
Tensor2Tensor: Google Research的广义序列到序列模型库 [在 Github 有 3087 ]。 致谢Google Brain的 Ryan Sepassi
No 13
PyTorch中的图像到图像转换 (e。g。 horse2zebra, edges2cats, and more) [在 Github 有 2847 :star:️]。 致谢 Berkeley 的 Jun-Yan Zhu博士
No 14
Faiss: 用于密集向量的高效相似性搜索和聚类的库 [在 Github 有 2629 ]。 由 Facebook Research 提供
No 15
Fashion-mnist: 类似MNIST的世上产品数据库 [在 Github 有 2780 ]。 致谢 Zalando Tech 的研究科学家 Han Xiao
No 16
ParlAI: 在各种公开可用的对话数据集上训练和评估AI模型的框架 [在 Github 有 2578 ]。 致谢 Facebook Research 的 Alexander Miller
No 17
Fairseq: Facebook AI 研究序列-序列工具包 [在 Github 有 2571 ]。
No 18
Pyro: Python and PyTorch 的深度概率编程 [在 Github 有 2387 ]。 由 Uber AI Labs 提供
No 19
iGAN: 由GAN支持的交互式图像生成 [在 Github 有 2369 ]。
No 20
Deep-image-prior:使用无需学习的神经网络进行图像还原 [在 Github 有 2188 ]。 致谢 Skoltech 的Dmitry Ulyanov 博士
No 21
Face_classification:使用具有keras CNN模型和openCV的fer2013/imdb数据集的实时人像监测和情感/性别分类 [在 Github 有 1697 ]。
No 22
Speech-to-Text-WaveNet : 使用DeepMind的WaveNet和tensorflow进行端到端的句子级英语语音识别 [在 Github 有 1961 ]。 致谢 Kakao Brain 的 Namju Kim
No 23
StarGAN: 用于多域图像到图像转换的统一生成对抗网络 [在 Github 有 1954 ]。 由韩国大学的 Yunjey Choi 提供
No 24
Ml-agents: Unity 机器学习代理 [在 Github 有 1658 ]。 感谢Unity 3D深度学习团队的 Arthur Juliani
No 25
DeepVideoAnalytics: 分布式可视化搜索和可视化数据分析平台 [在 Github 有 1494 ]。 感谢康奈尔大学的 Akshay Bhat 博士
No 26
OpenNMT:火炬中的开源神经机器翻译 [在 Github 有 1490 ]。
No 27
Pix2pixHD: 使用条件GAN合成和处理2048*1024图像[在 Github 有 1283 ]。 感谢 Nvidia的AI Research 科学家 Ming-Yu Liu
No 28
Horovod: TensorFlow的分布式训练框架[在 1188 有 845 ]。 由Uber Engineering提供
No 29
AI-Blocks: 强大的直观的界面,允许任何人创建的机器学习模型 [在 Github 有 899 ]。
No 30
采用Tensorflow的深度神经网络进行语音识别 [在 Github 有 845]。 感谢 Kakao Brain 的 AI 研究院的 Dabi Ahn
博客原址 https://medium.mybridge.co/30-amazing-machine-learning-projects-for-the-past-year-v-2018-b853b8621ac7