国外公开课

CDA编译团队倾力打造,精选编译国外优质公开课视频

美国数字营销公司HubSpot以六分钟动画的趣谈AI。当中揭示了AI的实质,以及AI给我们生活带来的影响。
李开复在MIT麻省理工学院“人工智能与未来工作”峰会上,发表了主题演讲。在演讲中,李开复从人工智能的技术、市场、产品、资金和政策5个方面分别讲述了中国人工智能发展的现状和未来趋势。
机器学习的发展涉及到各个方面,从语音识别到智能回复。但是,这些系统中的“智能”实际上是如何工作的呢?还有什么主要的挑战?在本讲解中将一一解答。
李飞飞在谷歌CloudNext17上发表主旨演讲。她在会上发布了谷歌云面向机器学习和人工智能的一系列新API以及收购机器学习竞赛平台Kaggle的消息。主旨演讲中,她提到了自己加入谷歌云的初衷,强调了“AI民主化”概念。
在O’reilly举办的AIConference上,吴恩达进行了主题为“AI是新的电力”长达25分钟的演讲,演讲中吴恩达亲自板书,内容也是干货满满了。在主题为“AI是新的电力”的演讲中,吴恩达主要探讨了以下四个主题。·AI能做什么?·AI和产品·互联网公司和AI公司·给AI领导者的建议
毋庸置疑,Python是用于数据分析的最佳编程语言,因为它的库用于存储、操作和获取数据的洞察力。本视频来自PyDataSeattle2017,当中介绍了Python的发展历程以及最新发展情况。
TensorFlow是世界上最流行的开源机器学习框架。在这段视频中,AndrewGasparovic介绍了TensorFlow以及发展的最新成果。他还介绍了一些例子,演示了如何在谷歌和现实问题中使用TensorFlow。
在MIT的机器学习导论课中,Grimson教授介绍了机器学习,并展示了使用特征向量进行监督学习的例子。

一对一、包学会

老师一对一手把手教学,让教学变得更有针对性、更个性化

最新资讯

主要面向数据分析、机器学习、深度学习、人工智能等前沿技术话题

我们都熟悉“人工智能”这一概念。毕竟,这个词常常在热门电影中出现,如《终结者》、《黑客帝国》、《机械姬》。但最近你也可能常常听到其他术语,如“机器学习”和“深度学习”,这些词有时与人工智能交替使用。首先我将简单介绍一下人工智能(ArtificialIntelligence),机器学习(MachineLearning)和深度学习(DeepLearning)三者的区别。然后,我将分析人工智能和物联网为何是不可分割的,技术的不断进步和融合逐渐为为人工智能和物联网爆炸奠定了基础。三者的区别人工智能(AI)“人工智能”这一概念于1956年首次被计算机科学家JohnMcCarthy提出。指的是在处理任务时具有人类智力特点的机器。包括具有组织和理解语言,识别物体和声音,以及学习和解决问题等能力。我们可以把人工智能分广义和狭义两方面来理解。广义上包括上述所有人类智力的特征。狭义上的指在某些领域具有人工智能,且能在这些领域发挥到极致,但仅局限于此领域。例如一个极为擅长识别图像的机器,但在其他方面表现欠佳,这就是狭义上的人工智能。机器学习(ML)机器学习是一种实现人工智能的方式。在人工智能这一概念出现后不久,ArthurSamuel在1959年提出“机器学习”这一概念即“(计算机)无需专门编程就能自主学习”。你可以在不使用机器学习的情况实现人工智能,但这意味着需要编写数百万行规则复杂的代码。因此,和传统编程以明确的指令使计算机完成任务不同的是,机器学习通过“训练”使其学习如何完成任务。“训练”包括向模型中载入大量数据,并且能够自动调整和改进算法。举例来说机器学习已经被用于改进计算机视觉(机器通过图像或视频识别对象的能力)。人们收集数十万甚至数百万张图片,并一一标记。比如,人类可以标记当中有猫的图片,而不标记那些没有猫的。那么,算法尝试建立一个模型,就可以实现像人一样准确地标记包含猫的图片。一旦达到一定的精确度,我们就可以认为机器现在“学会”了识别猫的样子。深度学习(DL)深度学习是实现机器学习的途径之一。其他途径包括策树,归纳逻辑程序设计,聚类,强化学习和贝叶斯网络等。深度学习这一概念的灵感来自大脑的结构和功能,即众多神经元的相互连接。人工神经网络(ANNs)即为模拟大脑生物结构的算法。在ANNs中,存在具有独立处理层的“神经元”,且这些“神经元”与其他“神经元”相接。其中每个处理层具有特定的学习特征,如图像识别中的曲线/边缘。正是这种分层赋予深度学习这一概念的名称,其中的深度是通过使用多个层而不是单个独立层实现的。人工智能与物联网不可分割人工智能与物联网之间的关系正如人类的大脑和身体。我们的身体获取感官输入,如视觉,听觉和触觉。我们的大脑进一步处理这些数据,使其具有意义。如把光转化为可识别的对象,把声音变成可以理解的语言。然后大脑做出决定,发送信号给身体,发出指令运动,如捡起一个物体或说话。构成物联网并相互连接的传感器都像我们的身体,它们提供了来自外界的原始数据。人工智能就像我们的大脑,处理这些数据并决定要执行的动作。这些传感器又再次像我们的身体一样,进行物理动作或与他人沟通。释放彼此的潜力人工智能和物联网由于彼此实现自身的价值和愿景。机器学习和深度学习已促使人工智能在近年来实现了巨大的飞跃。如上所述,机器学习和深度学习需要大量的数据来工作,这些数据由数十亿在物联网中持续链接的传感器所收集。因此,物联网促进人工智能的发展。同时,改进人工智能也将促进物联网发展,从而创造一个良性循环,这将大大促进两者的发展。这是由于人工智能使得物联网更实用的内因。在工业方面,人工智能可以用于预测机器何时需要维护,或者何时需要分析制造进程,从而大幅度提高效率,节省成本。在消费者方面,不是让人类去适应技术,而是让技术适应人类。摒弃繁琐的点击,输入和搜索,我们可以直接给机器下达指令,实现我们的需求。比如询问天气信息,或者营造更好地入睡环境如发出一系列指令(关闭恒温器,锁上门,关灯等)。技术的进步与融合计算机芯片的变小和制造技术的改进意味着带来成本更低,功能更强大的传感器。迅速改进的电池技术意味着这些传感器可以不需要电源使用很久。智能手机的出现带来的无线连接,意味着数据可以以更低的成本实现高容量的传送,同时使发送数据到云。而云计算的出现为我们提供了几乎无限的存储空间和计算能力处理数据。人工智能对我们的社会和未来带来的影响是不可预计的。可以肯定的是,随着人工智能和物联网的进步和持续发展,带来的影响必将是深远的。

作者:CDA管理员

Kaggle机器学习大调查:中国从业者平均25岁,博士工资最高,最常使用Python笔者按:Kaggle是互联网上最著名的数据科学竞赛平台之一,用户数量超过了100万人。最近,这一社区首次进行了机器学习/数据科学现状调查,向我们提供了有关从业者人群、业界最新动态以及如何进入该行业的洞见。在超过16,000名从业者的详尽答卷中,我们可以一窥目前业内的发展趋势。报告包括以下重点内容:Python可能是当前最常使用的机器学习工具,但更多的统计学家仍然用R语言。总体来说数据科学家平均年龄在30岁左右,但随着不同国家这个具体数值也在变化,例如,印度的受访者总体比澳大利亚平均年龄小9岁。受访者学历占比最多的似乎是硕士,但是工资最高的(年薪150K以上)则更多是博士学位获得者。雷锋网编译和解读报告内容如下,后台回复关键词“Kaggle调查”获取。一、数据工作者是什么样的?观察数据从业者的方式有很多,但本文将从人口统计学信息也就是数据科学从业者的工作和背景开始。你的年龄是?如图可见,本次调查对象的平均年龄大约30岁,但这个值在各个国家之间有变动。中国机器学习从业者年龄分布较为集中在20-45之间,中位数年龄非常年轻,在25岁左右,而美国的年龄分布则较为广泛,从图表上看起来,不乏百岁长者和稚子。你目前的就业状况如何?受调查者中,有65.7%表示自己有全职工作。但当将国籍选定为中国之后,这一数字的比例下降到53.5%。你的职位是什么?我们发现,数据科学领域可涵盖的工作非常多。比如在伊朗和马来西亚,数据科学从业者最流行的工作头衔是「科学家或者研究者」。在中国,最流行的头衔前三位是“机器学习工程师”、“数据分析师“以及”数据科学家“。你的全职年薪是多少?中位数$55,441,不过由于很多人没有全职工作,所以这一数字不见得准确。就平均收入来说,美国的机器学习从业者薪资最高,年薪11万美元。中国则明显低于这个数字,平均不到$30K.印度则只有$11K,你的最高学历是什么?总体来说,数据科学从业者中最普遍的学历是硕士,但是获取最高薪水($150K-$200K和$200k+)的那些人多是有着博士学位。中国的机器学习从业者学历以本科(39.5%)和硕士(40.5)为主,博士学历仅占比11.2%。美国对应的学历百分比则分别为26.5%,44.5%,和20.7%。总体来说,被调查者的平均水平是数据科学家职称,30岁左右,硕士学历,年薪$55,000左右。但实际情况并不如此平均。这些最初的几个人口统计学问题只是展示了复杂的Kaggle数据科学社区在年龄、性别、国籍、工作职称、薪水、经验和学历方面的表层差异。二、数据科学家的工作内容是什么?我们把数据科学家定义为写代码以分析数据的一群人。他们的日常工作内容是什么?以下是我们的调查结果。这一部分的问题受访者不再以国籍分类,而是以所在公司规模、行业等。工作中你使用什么数据科学方法?Logistic回归是工作之中最为常用的数据科学方法,不过军事领域和国家安全领域中神经网络使用则更为频繁。总的来说,数据科学中更常见的还是使用经典的机器学习算法,简单的线性与非线性分类器是数据科学中最常见的算法,而功能强大的集成方法也十分受欢迎。我们看到目前神经网络模型的使用频率要高于支持向量机,这可能是近来多层感知机要比使用带核函数的SVM更加广泛的表现。工作中你使用最多的工具语言是什么?Python是数据科学家最常用的语言,也是最常用的数据分析工具。不过,还有很多数据科学家对R语言仍保持着较高忠诚度。在工作中你常用的数据类型是什么?关系型数据是开发者在工作中最常用的数据类型,大多数产业工程师都十分关注。而学术研究者和国防安全产业则更关注文本与图像。如何分享工作中的代码?超过一半数据工作者(58.4%)使用Git分享代码。不过,大公司的工作者更喜欢将代码保留在本地,并将代码用邮件分享。而初创公司可能需要在云中共享以保持更加敏捷的反应。工作中遇到的障碍主要是什么?脏数据(dirtydata)以占据接近一半的比例位列第一,脏数据(DirtyRead)是指源系统中的数据不在给定的范围内或对于实际业务毫无意义,也就是说数据科学家一般最常见的困扰就是需要对数据进行大量的预处理工程。紧随其后的是“缺乏数据科学天赋”、“缺乏资金和管理支持”“缺乏一个能明确回答的问题”以及“数据不可用或无法获取”。值得注意的一点是,当调整公司规模到中小型企业,“缺乏资金组建数据团队”这一选项立刻跃居第三。看来资金和人才始终是创业公司面对的一大难题。这也意味着新的数据科学家很幸运。他们进入了一个抢手的行业。三、数据科学家新手如何入行?寻求新的职业发展时,看看别人的成功秘诀往往很有帮助。我们调查了在数据科学行业工作的人们,询问他们是如何“成功”的。以下是我们觉得较好的几条建议:你建议数据科学家新手最先学哪门语言?每一位数据科学家对于如何选择第一门语言都有自己的想法。事实证明,那些使用Python或R语言的人们做出了正确的选择。不过如果你问一下使用过R和Python的人们,他们推荐Python给你的概率可能会大两倍。你们使用哪些数据科学学习资源?数据科学是一个快速变化的领域,有很多有价值的资源可以帮助你学习并保持业内顶尖的位置,从而不断提升自己的竞争力。已经在数据科学领域中工作的人更多使用StackOverflowQ&A,Conferences和Podcasts,以在这个新人辈出的行业保持与时俱进。如果想要发布内容或开源软件,请记住,刚进入这个领域的人们通常更多使用官方的文档和观看Youtube视频。你们在哪里获取开源数据?没有数据,就没有数据科学。当需要学习数据科学技巧的时候,知道如何找到干净的开源数据集用于练习和开发项目相当重要。我们很高兴的得知,我们的数据集聚合器(datasetaggregators):https://www.kaggle.com/datasets正发展为数据科学社区成员中最频繁使用的工具。你们怎么找工作,以及怎么找到的?找工作的时候你可能会到公司网站上,或寻找指定技术方向的招聘信息,但是根据已经在数据科学领域工作的人们的经验,这些方式是最差的选择。而通过建立自己在这个行业的关系网络、直接联系招聘者或建立自己的网络以进入这个领域才是他们的首选。注:少于50名受访者的组别被合并进了「Other」类中。其中一些柱状图为了美观而做了缩放处理,希望查看所有问题和结果的原始数据可访问源网页查看。原报告后台回复关键词“Kaggle调查”获取。

作者:CDA管理员

AI、机器学习和深度学习的未来虽然尚处在开发和使用的早期阶段,AI、机器学习和深度学习已经影响了我们的生活,工作和娱乐。你是否已经准备好接受和利用这些颠覆性创新了呢?美国的HansonRobotics公司研发的机器人Sophia在上个月正式被沙特阿拉伯授予了公民身份,而沙特阿拉伯也成了世界上第一个赋予机器人公民权的国家。Sophia以奥黛丽·赫本为原型设计,这位沙特公民如今已经成为了家喻户晓的网红,出现在各个电视节目和全球性会议上。其实Sophia并不孤单。事实上,数十年以来人们在日常生活的方方面面都会使用到AI。从智能手机上的语音识别,房间清扫机器人,再到提醒你会议召开的虚拟助手,AI已经证明自己是信息、学习、推理、计划和交流的重要提供者。AI被定义为通过计算机有效地模拟人类智能的过程,AI还包含机器学习和深度学习的概念。通过机器学习,AI能够让无生命系统进行自动学习并改进经验(非常“人性化”的特性);而深度学习则使计算机能够在没有被明确地编程时进行学习。机器学习能够帮助Uber等公司确定乘车时间,估计UberEATS(Uber的送餐应用)的送餐时间,并计算出最佳上车位置。谷歌把深度学习用于语音和图像识别算法,亚马逊使用它来确定客户接下来想看什么或者买什么。AI影我们的三种方式AI、机器学习和深度学习可以组合在一起运用,从而帮助企业发展得更智能,更好,更快。虽然这三者仍处于技术发展的初期,但已经在不知不觉中影响我们的生活。主要体现在以下三点:1.简化我们的日常生活根据《福布斯》杂志的一篇文章,糟糕的客户服务已经造成了620亿美元的损失,而且这一赤字将持续增加。AI能够做到人类无法完成的事情,从而改善这一情况。数字助理已经成为日常生活中被大众普遍认可的得力助手。我们可以期待AI将在未来的生活中发挥更大的作用,但这还只是一个开始。普华永道(PwC)最近的调查显示,大部分消费者认为,不久的将来AI将大大简化人们的日常生活。2.让公共部门更有效率AI和机器学习能够显著减少和控制公共部门机构的运营成本。比如下面的例子:美国陆军医疗部正在开发可穿戴式监视器,这种监视器使用机器学习算法来衡量伤口的潜在严重性,帮助医疗人员优先处理。白宫、美国海关和移民局使用聊天机器人(chatbot)来回答基本问题,把复杂的问题留给人工客服来回答。美国邮政服务采用手写识别的方式按邮政编码分类邮件;有些机器每小时可以处理一万八千封邮件。根据德勤最近的一项研究显示,使用AI来自动处理联邦政府的工作任务,每年至少可节省9670万工时,节省成本33亿美元。3.解决企业面临的巨大挑战以制造业为例。工业革命使我们从大规模生产转向自动化。从第一批机器人在生产线上工作以来,已经有半个多世纪了。如今,被称为工业4.0的制造通过运用AI、机器学习和物联网将变得更加智能。来自客户、合作伙伴、市场、工厂车间和仓库的数据都可以进行收集、整合、分析和预测,从而使公司更有效、准确地改变制造和运输产品货物的方式。制造业不是使用AI的唯一例子;AI影响着市场的各个领域,用来解决复杂的业务问题。例如,许多大型金融机构已经通过投资AI系统来协助其投资实践。《美国银行家日报》的一篇报告指出,财富管理公司BlackRock的AI引擎Aladdin如何帮助制定投资决策;同时该公司还将该系统提供给客户,已有近3万人使用该系统。Aladdin具有很多功能,包括使用自然语言处理来阅读新闻,券商报告和社交媒体信息等文本。该系统还能帮助用户做出投资决策。你应该怎么做?使用AI需要高度专业化的技能。因此人们必须把AI与如何有效地运用于私人或公共部门联系起来。随着AI、机器学习和深度学习的不断发展和成熟,每个企业都应该开始尝试这些技术,从而让公司发展得更智能、更好、更快速。那么你该怎么做?首先应该从业务策略开始。你的公司可能没有一个正式的、系统化的方法方法来预测未来,但肯定有商业策略。这些策略来自于关于将来发生变化的假设。这一过程需要自我反省。包括以下这些步骤:1.仔细审视目前的策略。你的团队在执行目前计划时表现如何?需要做些什么改变?从当前情况考虑,利用AI技术能够使公司运作更高效。2.分析你目前的工作对于团队,合作伙伴和客户的影响。在哪些方面,你的工作可以被显著提高?3.评估你现在的能力,并做出改进。在开始尝试AI时,你有什么资产和资源?你对未来的假设会直接影响到现在正在做的事情。请仔细地重新审视目前的策略和流程。任何未来转型的必要组成部分都需要左脑(分析)与右脑(创造)相结合的人才和文化。AI的价值创造过程也不例外。它始于产生正确的想法,并以执行有效的方案结束。

作者:CDA管理员

2017年薪酬最高的15门编程语言你从事的工作是基于哪一门编程语言?你的薪酬是多少?在所有编程语言中排名多少呢?作者在本文列举出了2017年薪酬最高的15门编程语言,你的语言上榜了吗?虽然去年我曾经也讲过这个话题,但是薪酬最高的编程语言在2017年已经发生了变化,下面所列举的编程语言都是获得了最高的薪水。如果你正在考虑从事技术职业,请考虑学习这些编程语言以确保尽可能高的工资:你从事的工作是基于哪一门编程语言?你的薪酬是多少?在所有编程语言中排名多少呢?作者在本文列举出了2017年薪酬最高的15门编程语言,看看你的语言排名多少吧!以下为译文。科技一直在经济领域和社会领域占据着主导地位,数百万人因此寻找到了自己的第一份职业,有的人甚至跨领域重新进行学习,就是为了从事计算机科学、编程和其他与技术相关的工作。尽管如此,企业还是在寻找高技能的程序员,有的企业为了找到合适的员工还会提高薪酬。由于科技还会继续扩展到新的平台和行业,因此为了将赚钱潜力最大化,同时也为了确保在技术领域的未来还能够占有一席之地,选择学习哪一门编程语言是非常重要的。但不管怎么样,经验还是很重要的。科技领域有大量的资源可以使用,同时还提供了专门的分类标准,以找到你当前最适合的职业。虽然去年我曾经也讲过这个话题,但是薪酬最高的编程语言在2017年已经发生了变化,下面所列举的编程语言都是获得了最高的薪水。如果你正在考虑从事技术职业,请考虑学习这些编程语言以确保尽可能高的工资:GoGo语言的薪酬平均每年在11万美元以上,近年来已经高居榜首。2009年创建于谷歌的开源开发平台,之后一些著名的服务商如Uber、SoundCloud、Netflix、谷歌和Dropbox利用了Go语言的元素,实现了内部和基础设施功能。Scala开发的目的是解决许多Java问题,熟悉Scala的程序员每年可以获得高达11万美元的收入,当然这还要取决于经验和专业知识。与Java的互通性是Scala的一个关键特性,因此熟悉这两门开发语言的开发人员在寻找工作的时候都将在竞争中占据重要的优势。Objective-CObjective-C是一门问世时间最久,也是程序员们最熟悉的编程语言之一,同时它也是最赚钱的语言之一。Objective-C程序员使用Apple平台使用的基准语言,预计每年的薪水在100,000到110,000之间。CoffeeScript作为一门编程语言,CoffeeScript可以完美地转换成JavaScript,而且由于它的可读性和精简性,它已经在行业中广受欢迎了。拥有CoffeeScript专业知识的程序员每年的收入可能高达105,000美元。R作为一门主要用于统计计算和图形的开源语言,随着数据驱动分析和预测建模已经深入到了许多行业,R语言也变得越来越重要。R语言程序员的平均年薪是10万美元。(具体课程可参考官网cda.cn)TypeScriptTypeScript是一门Microsoft维护的开源编程语言,用于在客户端和服务器端开发JavaScript应用程序。如果你能流利地使用TypeScript,那么你每年可以挣到10万美元。SQL自1974年以来,SQL这40多年间一直是成千上万的程序和数据管理解决方案的基础。像Google,Helix,IBM,Microsoft,Oracle和Amazon这样的技术巨头还在继续使用SQL,并为SQL程序员提供了70,000-90,000美元的年薪。Java世界上最流行的编程语言之一,同时也是最赚钱的语言之一作为客户端-服务器Web应用程序领域的主要参与者,估计有900万开发人员使用Java,其中最合格的候选人薪水高达117,000美元。Python作为一门大受欢迎的通用编程语言,Python的代码可读性和语法的简易型相比较于C++或Java,可谓是更进一步。Python专家的期望薪水接近9.9万美元。(具体课程可参考官网cda.cn)JavaScript尽管在过去的几年中,JavaScript的流行度在HTML和CSS的精简版本中大幅度下降,但是大多数现代网站仍然使用它进行各种交互元素。拥有JavaScript专业知识的程序员得到的报酬高达11万美元。C++通用,快速,便携,广受欢迎,C++仍然是一门很重要的编程语言,那些在C++方面保持专业水平的人们可能会看到年薪在9万到10万美元之间的职位。C#作为微软.NET框架计划的一个产品,C#仍然是面向对象编程的主流解决方案,它的语法与C++和Java非常相似,但是那些具有C#专业知识的程序员每年可以挣到10.7万美元。Perl由于Perl的功能强大和可靠性,因此它被称为脚本语言中的的“瑞士军刀”,主要用于系统管理、网络编程、财务和图形用户界面。熟悉Perl语言的人年薪差不多高达11万美元的薪水。PHPPHP是一门占主导地位的编程语言,主要针对服务器端的web开发,依赖于C和C++。熟悉这三门编程语言的开发人员能够很容易就找到一份专注于PHP的高薪工作,薪水可能高达12万美元。iOS/SwiftSwift是近年来发布的最重要的编程语言之一了,苹果将其用于现代操作系统,如macOS和iOS。从事Swift开发的相关人员平均年薪通常达到8万美元,但某些高端职位的年薪可能高达12万美元。由于目前市场上合适的顶尖技术人才非常短缺,企业又希望能够在软件开发项目中填补关键空白,从而提高自己的竞争力,因此只要你擅长以上编程语言中的某一门,那么在薪资谈判方面会有很大优势。提高自身的技能,掌握这些语言,最后你的钱包会告诉你这些付出都是值得的。

作者:CDA管理员

李飞飞丨谷歌在AI领域的强势举措李飞飞在谷歌CloudNext17上发表主旨演讲。她在会上发布了谷歌云面向机器学习和人工智能的一系列新API以及收购机器学习竞赛平台Kaggle的消息。主旨演讲中,她提到了自己加入谷歌云的初衷,强调了“AI民主化”概念。CDA字幕组对该视频进行了汉化,附有中文字幕的视频如下:李飞飞-谷歌在AI领域的强势举措针对不方便打开视频的小伙伴,CDA字幕组也贴心的整理了文字版本,如下:大家早上好,我是李飞飞。我是谷歌云、AI/ML的首席科学家。用谷歌的话来说,我仍然是一个Noogler(Noogler:NewGoogler的缩写,意为谷歌新员工)。很荣幸能站在这个舞台上,与你们分享一些我关于AI、机器学习以及谷歌云的想法。世界正以惊人的速度变化着,有人说我们正处于第四次工业革命。而这在很大一程度上是由惊人的计算机技术所推动的。作为一名在机器学习和计算机视觉方面,从业接近20年的AI技术人员,我见证了这一领域从一个崇高的学术追求,成为这一改变的最大驱动力。这一变化发生在许多维度上,需要调动你的想象力才能窥其全貌。我们举个熟悉的例子:自动驾驶汽车。它的魅力显而易见,借助传感器和算法,自动驾驶汽车能够降低事故风险。让我们在通勤的路上能够有更多的时间工作、社交以及休息。这对于一个司机来说是非常棒的,但如果成千上万的人都有呢?通过协调这些车辆,能够减少交通拥堵,并且停车过程也将被大大简化。如果成百上千万的人都有呢?城市将被重塑,基础设施的使用将发生根本性的转变。AI的参与度不同规模的区别在于其参与(Participations)。随着技术触及的人群越多,它的影响就会越深远。这也就是为什么AI的下一步,必须是民主化(Democratization)。降低进入门槛,让更多的开发者、使用者以及企业能够接触到。谈到AI的民主化、触及更多的人。谷歌云平台已经为客户提供了大量的应用,每天为超过十亿的用户提供服务,这是大量的参与。可以想象将该平台的影响力与AI的力量相结合,让更多人有机会接触AI。然后我们可以见证生命质量的大幅度提高,比历史上任何一个时期都要高。从金融到教育、从制造业到医疗、从零售业到农业等等。这就是为什么通过谷歌云传播AI/ML,让我感到兴奋不已。这意味着我终于可以分享,作为一名AI研究者我在斯坦福多年的技术和见解。我也是在这里开始与李佳博士在AI领域的合作。她在多年前是我的第一名博士生。我也很高兴她和我一起加入谷歌。她目前担任AI机器学习和谷歌云的研发主管,她也是在计算机AI领域的"狠角色"。我们身边不缺少AI解决现实问题的例子,例如我们刚刚看的演示。通过谷歌Home和eBay网店交流等等。这些成就让人印象深刻,但这仅仅是整个行业转变的起点,AI解决了越来越多的问题。我们用来开发AI解决方案的工具,这些工具功能越来越成熟,但在使用上越来越容易。这将给世界带来巨变,这一变化发生的速度远比人们想象的快。让我们看几个例子。零售业从AI诞生之日起就开始影响零售业。例如,机器学习的算法已经开始发生作用,在购物中给用户提供相关信息。但是还有很多方面有待解决。比如,供应链的路线和库存最优化;或者预测随着时间发展的需求变化;以及运用无人机导航和自动驾驶汽车,运送用户订购的商品;用于预防损失和安全的智能分析,理解用户行为以及感知库存,从而优化货架空间利用和摆放。媒体和文化另一个例子是媒体和文化,它们也已经受到AI的影响。你家里有青少年吗?想不想知道,Snapchat应用中让他们着迷的猫耳朵和彩虹滤镜是用的什么技术?这是一个很聪明的计算机视觉技术。机器学习已经让谷歌照片实现图像标签的自动化,以及生成YouTube的推荐列表。媒体会更多地利用这些技术,AR和VR技术将依赖计算机视觉进行动态追踪、环境监测以及游戏。越来越多的新闻内容可以自动生成,让记者聚焦于大新闻和深度故事。AI也可以在帮助我们设计和个性化我们自己的内容。比如音乐、视频和艺术作品方面。金融业在金融服务业,机器学习已经在大量地、智能地起作用。为信用卡申请者预测信用卡风险,甚至预测现有顾客拖欠还款。类似先进的应用也出现在工作中。保险赔偿将会由智能代理来进行评估。随着对话机器人接管客服中心,银行业会更加虚拟化,甚至由个人银行管理财务。正如之前汇丰银行(HSBC)所说,这些智能代理可以增加我们的感知,标识一些犯罪行为。比如洗钱或欺诈等。医疗最后还有医疗,这是AI最关键的应用场景之一。这真正提升了人们的生活。近几年该领域出现了许多出色的AI成果。几个月前我在谷歌大脑的同事展示了通过使用深度学习算法。计算机能够探测出糖尿病性视网膜病变,这种疾病可能导致超过4亿人失明。想象一下,这种洞察力可以扩展整个医疗行业。大量视觉诊断类的工作将会很快被自动化。这能够帮助医生并减少开销,将服务扩展到没有条件接受治疗的人群。机器还可以做一些文书的工作。比如帮助记录医生访问、管理一些慢性病,带来更多可靠且迅速的服务,进而促进在家庭建立全面的智能医院。通过智能传感器追踪医疗行为,保证患者安全,确保卫生操作,增加手术方案。面对AI和机器学习带来的机遇,希望你们和我一样感到兴奋。但是这依然是一个高门槛的领域,它需要大量专业知识和资源,很少的公司有能力承受。AI民主化这就是为什么云是AI的理想平台,这也是为什么我们在云AI/ML上大量投资。这会在接下来的几年里,提供强大的、易用的工具。让每位云的用户进入该领域的机会。换句话说谷歌云正在将AI民主化,这主要需要四步:·计算的民主化·算法民主化·数据民主化·人才和专业知识的民主化让我们一一讨论一下当中深意。首先也是最重要的,AI要求巨大的计算量。如今,深度学习算法能够轻易处理数千万个参数和数十亿的连接。训练和使用这样的模型需要计算资源。当然,这也是云要提供的主要功能。我们提供了测试版的云ML引擎。ML引擎今天我在这里宣布它的主要功能。云ML引擎是一个平台,能够利用所有的计算能力并透明地提供传递给你。简单来说,你以任何一种你喜欢的方式建立机器学习模型。你自己所在环境熟悉的工具,比如TensorFlow库。机器学习引擎让你能够专注于解决方案的创造性,将基础结构部分留给我们。需要训练模型时,将这些上传到云里。机器学习引擎可以更快、更大规模的处理。最后将结果从你的设备部署到移动设备,从而把训练结果用于解决现实问题。尽管有了大量的计算能力,AI依旧是计算机科学中最复杂的领域。这对于许多企业用户来说,仍然是一个很大的障碍。对那些还没准备好建立自己模型的开发者来说,应用AI最简便的方式就是通过使用谷歌提供的API。使用训练好的机器学习模型去解决常见的问题。API就像一个开关,可以立即激活任何设备上的智能的部分,使其理解语言、图像或者翻译文字,难懂的自然语言。但谷歌AI技术的深度和广度远远不止如此。我们在谷歌有许多研究小组,进行大量的AI研究,涉及AI和机器学习的众多领域。这些研究者均在顶尖AI期刊和会议上,发表多篇学术论文。我们的团队常常获得最佳论文,并且是AI比赛中的常胜将军。因此这些研究的成果很快会转化为能够提供给用户的产品和服务。VisionAPI很高兴向大家介绍这方面的一些最新产品,VisionAPI目前正在稳定开发中。它具有一些新的性能,首先是API元数据的扩展。以便从谷歌知识图谱的百万千万的实体中,识别网上的图像。如今在整个谷歌图片搜索中,我们均使用相同的元数据。其次增强了光学字符识别(OCR)功能,能够从有大量文本文件的图片中提取文字。比如法律文件或其他复杂的文书。但像素不仅仅是图片。实际上视频才是互联网数据中最流行的形式之一。仅Youtube每分钟就有数百小时的视频被上传。了解视频的丰富内容一直是多年来巨大的技术挑战。实际上我们许多的计算机视觉研究员,一直将视频视为数字宇宙的"暗物质”。今天非常高兴地宣布一个全新的由机器智能驱动的API,VisionAPI。下面请我的同事SaraRobinson来更详细地演示这个API,有请Sara。【SaraRobinson展示】下面我通过一个例子演示VisionAPI。我们先来看一个谷歌Home的超级碗广告。前几秒我们可以看到开始是山地景观,然后是房子,城市街道然后是狗、车库。这个视频里面发生了很多场景变化,如果我们要手动把视频内容进行分类,我们需要看完整个视频,并记下每个场景发生的事情。幸运的是VisionAPI可以帮我们完成。首先在一个相对高的层面,告诉我们这个视频的内容。其次在粒度的层面,还告诉我们视频每个场景中的标签。如果我们向下翻,我们可以看到它标识出一只狗。并准确指出狗出现在视频的哪个位置,也识别出视频的结尾处的生日蛋糕。再往下可以看到它不仅仅知道这是狗,还能分辨狗的品种。如果我们看到其余部分可以看到,也成功地识别出了视频开始时的山路。这就是该API针对一个视频能做什么。你也可以让它分析多个视频,让我们看看公司如何使用VisionAPI。媒体工作人员可能要处理大量的视频数据。他们要做的一件事就是创建特定类型内容的精彩集锦,或者在大型视频库中搜索特定实体。让我们用VisionAPI搜索大型视频库,给出我们从中获取的这些元数据。在这里有很多视频,我们假设这家媒体有几个小时的体育视频。但他们只想找到棒球的相关内容,因此让我们视频库中来搜索棒球视频。这不仅告诉我们哪些视频含棒球内容,还告诉我们视频中棒球出现的时间。我最喜欢的例子是这个,这个视频中棒球只出现了一会儿,但它能够分辨并剪辑出来。而如果我们手动操作的话,必须观看整个视频来寻找特定的场景。如果我们点击这个场景,我们可以看到这个视频是关于,芝加哥小熊队在去年赢得了世界职业棒球大赛。下面我们再来搜索一下。我住在东海岸,现在很冷。去年下了很多雨,如果现在能在海滩上会很舒服。虽然机器学习并不能把我们带到那里,但它能做的其他的事,即在视频库中的找出所有海滩剪辑。下面让我们搜索海滩视频,然后可以点击所有含沙滩的视频片段。所以正如这个演示,VisionAPI可以轻松地识别大型视频内容库。几个月前这还几乎是不可能的事情,过去要花费几个小时的任务,现在VisionAPI只需要几秒钟。我很开心今天能够让每个人都用到。所以作为计算机视觉研究员,我非常激动。我已经关注视频分析领域数十年,现在我们终于开始理解数字宇宙的"暗物质"。也让我们的用户能够,从嵌入在视频里的大量信息中提取价值。AI民主化的第三个要素是数据。正如我们通过毕生接触世界获得人类智慧,AI需要大量的数据来发展自己的洞察力。但这些数据集是最艰巨的一个问题,在这方面我深有体会。我带领团队构建了ImageNet数据库。ImageNet为机器视觉社区提供了1500万个带标签的图片。很多人都很熟悉ImageNet出现后的情况。在2012年,这是深度学习革命最重要的推动力。至今仍是深度学习算法中,使用最多的训练数据集和基准之一。虽然ImageNet的成果很惊人,但是构建ImageNet艰巨而漫长的过程,充分显示了当中的困难。我们需要一个更加有效和可扩展的方式,将数据民主地提供给数据科学家、机器学习开发人员以及领域专家,最终到提供到商业中。收购Kaggle这也是为什么我如此激动地宣布谷歌云收购了Kaggle。这两位联合创始人AnthonyGoldblum和BenHandler多年的努力下,Kaggle团队建立起了含有85万多名数据科学家的强大社区。并且举办各种竞赛并且不断开放新的数据集。通过与谷歌云平台的结合,社区能够直接访问最先进的机器学习环境并提供直接的途径营销他们的模型。与Kaggle一起我们正在创建世界上最大的机器学习人才中心。实际上Kaggle已经与谷歌云一起举办了最大的视频理解大赛,名为"YouTube8百万视频理解挑战"。说到人才和专家,谷歌致力于帮助我们的合作伙伴和用户,在他们所需的级别开发更多的机器学习和AI技术。我们一直在研究方面进行大量投资,谷歌每年都会为全球250多个学术研究项目提供大笔资助,支持几十位博士生并拥有数千名实习生。我们认为AI专业知识将成为未来数年内越来越重要的资源。并在采取步骤,寻找、教育和强化这个领域的未来领袖。在谷歌云与这些努力的同时,我们也致力于用专业知识向客户提供正确的结果。先进的解决方案实验室,能够让拥有远大目标的客户与谷歌直接合作,一同解决复杂的AI问题。以保险公司USAA为例,他们的许多工程师精通数据科学,甚至有机器学习背景。但他们需要帮助建立真正的专业知识基础。为此USAA开发团队来到谷歌先进的解决方案实验室。他们直接从我们的机器学习工程师和专家那里学习。这个团队现在在努力工作,使用他们的新技能。另外也有其他的团队在以相同的方式接受培训。因此我认为最有意义的技术,是把宝贵的资源转化为可以让所有人受益的东西。印刷技术帮助人们识字,让识字不再是特权,让书籍成为负担得起的并填满全球各地的家庭和图书馆。电网将电力传送到整个社区,使热和亮从奢侈品变为日常生活必备用品。工业革命的大规模生产意味着,过去昂贵的手工艺品如今能够丰富成百上千万人的生活。当然互联网也使得一切内容,从报纸到大学的课程都变得容易分享。从而可以在一夜间被全球观众获得,而且往往是免费的。这些例子的共同之处是,从独占转变为无处不在。我相信AI可以带来这种转变,以我们前所未见、无法想象的规模。在全球范围内帮助将少数人的特权奢侈品,传播给我们其他人。这是为什么我要邀请观众中每个人都参与其中。我们在谷歌云正在开发这些工具,但使用权在你们。

作者:CDA管理员

数据科学家:站在大数据金字塔尖的人现在的互联网行业,越来越多的企业对数据科学家求贤若渴。虽然数据科学家的需求一直在快速增长,但事实是在业内还没有对数据科学家的准确定义。有人开玩笑说,「数据科学家就是住在硅谷的数据分析师」,甚至有人画了这样的漫画:没错,找到一位优秀的数据科学家和找到一个理解数据科学家是做什么的人一样难。要理解数据科学家是做什么,首先要理解人尽皆知却总被误读的大数据:大数据不是大量的数据,而是复杂的数据。《大数据时代》联席作者KennethCukier在Ted上的热门演讲:《Bigdataisbetterdata》,告诉你大数据驱动技术和设计的未来,以及大数据的「好」与「坏」。这些解决复杂数据带来的问题的人,就是数据科学家。数据科学家在工作中是怎样解决问题的呢?分享两个共享经济的典范:Airbnb和Uber——在运用大数据方面的经验。1、Airbnb在Airbnb,工程师要解决这样一个问题:如何让用户了解一个自己从来没去过的地方?如何知道哪个地方最适合自己的旅行?Airbnb拥有海量的独有数据,包括旅游地、用户评论、房源描述、社区信息等,Airbnb还有一支队伍去各地和当地人交流,搜集所有的相关历史数据。Airbnb的数据科学家是这样运用数据的:Airbnbaccommodations(red)andtraditionalaccommodations(blue)inSanFrancisco当用户在搜寻一个住宿的地方时,Airbnb的「locationrelevancemodel」会通过Airbnb社区告诉未来的客人哪里是更好的住宿地。当用户在寻找想体验的新地方时,「AirbnbNeighborhoods」会将当地的内容编辑亲手整理的必备资料和专业的照片呈献给用户。Airbnb的「discoveryteam」通过自然语言处理和机器学习来为用户搜索关键词提供更准确的推荐。Airbnb甚至造了一个叫做「AT-AT」的复杂工具,帮助用户更深入地了解某个地点,包括地理信息无法描述的文化或宗教上的区分。2、Uber缩短开着空车去接下一位乘客的时间和乘客等待的时间是Uber的车主和乘客的共同需求,他们希望这些时间越短越好。为此,Uber的数据科学家建立了「Location-baseddemandmodels」。UberheatmapinSanFrancisco每天实时更新的热点地图(Heatmaps)可以有效帮助车主缩短空载时间,同时帮乘客减少等待时长。下一步,这张图甚至可以预测,这样车主会知道提前去哪里等待可以载到更多的乘客。数据科学家的由来和定义虽然数据科学三十年前就诞生了,但是数据科学家却是几年前刚出现的一个新词。在《数据之美》一书中,我们可以看到Facebook的数据科学家的起源:在Facebook,我们发现传统的头衔如商业分析师、统计学家、工程师和研究科学家都不能确切地定义我们团队的角色。该角色的工作是变化多样的:在任意给定的一天,团队的一个成员可以用Python实现一个多阶段的处理管道流、设计假设检验、用工具R在数据样本上执行回归测试、在Hadoop上为数据密集型产品或服务设计和实现算法,或者把我们分析的结果以清晰简洁的方式展示给企业的其他成员。为了掌握完成这多方面任务需要的技术,我们创造了「数据科学家」这种角色。所以,用一句话总结「数据科学家」的定义:运用统计分析、机器学习、分布式处理等技术,从大量数据中提取出对业务有意义的信息,以易懂的形式传达给决策者,并创造出新的数据运用服务的人才。数据科学家有哪几种类别为了更好地阐释数据科学家,我们将它分为三类:理论数据科学家致力于数据科学的理论研究,为其他的数据科学家创造框架和工具。本质上是将统计数据、数据存储和计算机科学在理论层面应用于大数据的学者应用数据科学家对于如何运用大数据有更好的理解。科学需要严谨,我认为数据应用植根于学术严谨,但是在应用层面工作。应用数据科学家的工作是先进行架设,再用大数据进行验证。每个人都会受惠于他们的研究发现和工具。行业数据科学家用应用数据科学地解决某个具体的市场问题、行业、生意,实现利益最大化的单一目的。行业数据科学家得擅长沟通,能够让他们的发现应用于商业。将工商、经济和会计方面的经验应用在商业领域是他的价值所在。与商业分析师和商业顾问的角色有点相似。要成为一名数据科学家,需要掌握哪些核心技能?作为一名数据科学家,一般需要编程和数据库、数学&统计、交流和可视化、领导力和软技能:四个方面的技能。1、编程和数据库一般来说,数据科学家大多要求具备编程、计算机科学相关的专业背景,掌握对处理大数据所必需的Hadoop、Mahout等大规模并行处理技术与机器学习相关的技能。一般能利用python熟练的获取数据,整理数据,并会使用matplotlib展现数据。2、数学、统计和数据挖掘除了数学、统计方面的素养之外,还需要具备使用SPSS、SAS等主流统计分析软件的技能。其中,面向统计分析的开源编程语言及其运行环境「R」最近备受瞩目。R的强项不仅在于其包含了丰富的统计分析库,而且具备将结果进行可视化的高品质图表生成功能,并可以通过简单的命令来运行。此外,它还具备称为CRAN(TheComprehensiveRArchiveNetwork)的包扩展机制,通过导入扩展包就可以使用标准状态下所不支持的函数和数据集。3、数据可视化信息的质量很大程度上依赖于其表达方式。对数字罗列所组成的数据中所包含的意义进行分析,开发Web原型,使用外部API将图表、地图、Dashboard等其他服务统一起来,从而使分析结果可视化,这是对于数据科学家来说十分重要的技能之一。4、领导力和软技能数据科学家不仅要具有黑客的头脑,对数据有好奇心,还要对商业有热情,是有影响力、有创造力,能解决问题的人。总之,数据科学家之所以被称为「科学家」,而区别于「数据工程师」和「数据分析师」,其根本在于对数据有极端敏锐的直觉和本质的认知,对问题和业务有深入的洞察和理解,因而能够解决复杂数据带来的问题。总结在过去,对于「信息技术」,我们通常只关注「T」-技术、硬件,因为这是切实可见的东西。现在,我们需要把目光放在「I」-信息上,它不是那么切实可见,但某种程度上却更加重要。在人类永无止境的探索过程中,我们可以从我们能收集的信息中,来了解这个世界,以及人类在这个世界中所处的地位。这就是为什么大数据如此重要。这也是数据科学家工作的意义。

作者:CDA管理员

学员动态

Hello World!开始你的学习吧

39秒前 23362_web

开始学习 Tensorflow简单案例

14分钟前 23362_web

完成了 fetch and feed

15分钟前 23362_web

开始学习 fetch and feed

53分钟前 ff66666666666

开始学习 跨境电商数据分析

53分钟前 ff66666666666

加入学习

1小时前 12662_pxapp

加入学习