国外公开课

CDA编译团队倾力打造,精选编译国外优质公开课视频

如今区块链技术非常流行。视频中解答了以下问题:区块链究竟是什么?工作原理是什么?解决什么问题?有什么用途?
欢迎收看机器学习算法导论。教程中白色噪点的部分完全是用MATLAB编写的。
谷歌云平台(GCP)提供了5个API,能够通过调用一个API访问预先训练的机器学习模型,分别是:谷歌云视觉API、云语音API、云自然语言API、云翻译API和云视频API。通过这些API,你可以专注于给应用程序添加新特征,而不是构建和训练定制模型。
机器学习的发展涉及到各个方面,从语音识别到智能回复。但是,这些系统中的“智能”实际上是如何工作的呢?还有什么主要的挑战?在本讲解中将一一解答。
谷歌云平台(GCP)提供了5个API,能够通过调用一个API访问预先训练的机器学习模型,分别是:谷歌云视觉API、云语音API、云自然语言API、云翻译API和云视频API。通过这些API,你可以专注于给应用程序添加新特征,而不是构建和训练定制模型。
Youtube数据科学领域的热门博主sentdex,经常会分享关于Python和机器学习相关的教程,这次他用画图的形式讲解了深度学习、神经网络和TensorFlow。
TensorFlow是谷歌研发的开源框架。本讲座介绍了如何使用TensorFlow创建深度学习应用程序,以及与其他Python机器学习库进行比较。
李飞飞在谷歌CloudNext17上发表主旨演讲。她在会上发布了谷歌云面向机器学习和人工智能的一系列新API以及收购机器学习竞赛平台Kaggle的消息。主旨演讲中,她提到了自己加入谷歌云的初衷,强调了“AI民主化”概念。

一对一、包学会

老师一对一手把手教学,让教学变得更有针对性、更个性化

最新资讯

主要面向数据分析、机器学习、深度学习、人工智能等前沿技术话题

GoogleColabFreeGPU教程现在,你可以开发深度学习与应用谷歌Colaboratory-on的免费特斯拉K80GPU-使用Keras,Tensorflow和PyTorch。你好!我将向您展示如何使用GoogleColab,Google为AI开发人员提供的免费云服务。借助Colab,您可以免费在GPU上开发深度学习应用程序。什么是GoogleColab?GoogleColab是免费的云服务,现在它支持免费的GPU!您可以;提高你的Python编程语言编码技能。开发利用流行的库如深学习应用Keras,TensorFlow,PyTorch,和OpenCV的。Colab与其他免费云服务最大的区别在于:Colab提供GPU并且完全免费。有关该服务的详细信息可以在常见问题页面上找到。准备使用GoogleColab在Google云端硬盘上创建文件夹由于Colab正在使用您自己的Google云端硬盘,因此我们首先需要指定我们将要使用的文件夹。我在Google云端硬盘上创建了一个名为“应用”的文件夹。当然,您可以使用不同的名称,或选择默认的Colab笔记本文件夹而不是应用程序文件夹。我创建了一个空的“应用程序”文件夹创建新的Colab笔记本通过右键单击>更多>Colaboratory创建一个新的笔记本右键单击>更多>Colaboratory通过点击文件名来重命名笔记本。设置免费的GPU改变默认硬件非常简单(CPU到GPU或反之亦然);只要按照编辑>笔记本电脑设置或运行>更改运行时类型和选择GPU的硬件加速器。使用GoogleColab运行基本的Python代码现在我们可以开始使用GoogleColab。我将运行PythonNumpy教程中的一些基本数据类型代码。它按预期工作:)如果你不知道Python是AI最流行的编程语言,我会推荐这个简单而干净的教程。使用GoogleColab运行或导入.py文件首先运行这些代码,以便安装必要的库并执行授权。apt-getinstall-y-qqsoftware-properties-commonpython-software-propertiesmodule-init-tools!add-apt-repository-yppa:alessandro-strada/ppa2>&1>/dev/null!apt-获取更新-qq2>&1>/dev/null!apt-get-yinstall-qqgoogle-drive-ocamlfuse从google.colab导入auth.authenticate_user()从oauth2client.client导入GoogleCredentialscreds=GoogleCredentials.get_application_default()importgetpass!google-drive-ocamlfuse-headless-id={creds.client_id}-secret={creds.client_secret}</dev/null2>&1|grepURLvcode=getpass.getpass()!echo{vcode}|google-drive-ocamlfuse-headless-id={creds.client_id}-secret={creds.client_secret}当你运行上面的代码时,你应该看到这样的结果:点击链接,复制验证码并粘贴到文本框中。完成授权过程后,安装您的Google云端硬盘:!mkdir-p驱动器!google-drive-ocamlfuse驱动器安装Keras:!pip安装-qkeras将mnist_cnn.py文件上传到位于Google云端硬盘上的应用程序文件夹。mnist_cnn.py文件运行下面的代码在MNIST数据集上训练一个简单的小圆点。!python3drive/app/mnist_cnn.py从结果中可以看出,每个纪元只能持续11秒。下载泰坦尼克号数据集(.csv文件)并显示前5行如果你想从url下载.csv文件到“app”文件夹,只需运行:!wgethttps://raw.githubusercontent.com/vincentarelbundock/Rdatasets/master/csv/datasets/Titanic.csv-Pdrive/app您可以直接将.csv文件上传到“app”文件夹,而不是使用wget方法。在“app”文件夹中读取.csv文件并显示前5行:将pandas导入为pdtitanic=pd.read_csv(“drive/app/Titanic.csv”)titanic.head(5)将GithubRepo克隆到GoogleColab用Git克隆一个Github库很容易。第1步:找到Github回购并获得“Git”链接找到任何Github回购使用。例如:https://github.com/wxs/keras-mnist-tutorial克隆或下载>复制链接!Git克隆只需运行:!gitclonehttps://github.com/wxs/keras-mnist-tutorial.git3.在Google云端硬盘中打开文件夹文件夹与Github回购当然是一样的:)4.打开笔记本右键单击>打开方式>Colaboratory5.运行现在,您可以在GoogleColab中运行Github回购。一些有用的提示1.如何安装库?Keras!pipinstall-qkeras导入kerasPyTorch!pipinstall-qhttp://download.pytorch.org/whl/cu75/torch-0.2.0.post3-cp27-cp27mu-manylinux1_x86_64.whltorchvision进口火炬MxNet!aptinstalllibnvrtc8.0!pipinstallmxnet-cu80将mxnet导入为mxOpenCV的!apt-get-qqinstall-ylibsm6libxext6&&pipinstall-q-Uopencv-pythonimportcv2XGBoost!pipinstall-qxgboost==0.4a30importxgboostGraphViz的!apt-get-qqinstall-ygraphviz&&pipinstall-qpydotimportpydot7zip阅读器!apt-get-qqinstall-ylibarchive-dev&&pipinstall-q-Ulibarchiveimportlibarchive其他图书馆!pipinstall或者!apt-getinstall安装其他库。GPU是否工作?要查看您目前是否在Colab中使用GPU,可以运行以下代码以进行交叉检查:importtensorflowastftf.test.gpu_device_name()3.我使用哪个GPU?fromtensorflow.python.clientimportdevice_libdevice_lib.list_local_devices()目前,Colab只提供特斯拉K80。4.什么是RAM?!猫/proc/meminfoCPU呢?!cat/proc/cpuinfo6.更改工作目录通常当你运行这个代码时:!LS你可能会看到datalab和驱动器文件夹。因此,您必须在定义每个文件名之前添加drive/app。为了摆脱这个问题,你可以简单的改变工作目录。(在本教程中,我更改为应用程序文件夹)与这个简单的代码:importosos.chdir(“drive/app”)运行上面的代码之后,如果再次运行!LS你会看到应用程序文件夹的内容,并不需要一直添加驱动器/应用程序了。7.“NobackendwithGPUavailable”错误解决方案如果您遇到此错误:FailedtoassignabackendNobackendwithGPUavailable.Wouldyouliketousearuntimewithnoaccelerator?稍后再试。现在很多人在GPU上踢轮胎,当所有GPU都在使用时,就会出现这个消息。参考8.如何清除所有细胞的输出遵循工具>>命令选项板>>清除所有输出9.“apt-key输出不应该被解析(标准输出不是终端)”警告如果您遇到此警告:警告:不应该分析apt-key输出(标准输出不是终端)这意味着认证已经完成。您只需要安装Google云端硬盘:!mkdir-p驱动器!google-drive-ocamlfuse驱动器结论我认为Colab将为世界各地的深度学习和人工智能研究带来新的气息。如果你觉得这篇文章有用,那么如果你给了它一些掌声并且分享来帮助别人找到它,那将意味着很多!并随时留下评论。你可以在LinkedIn上找到我。最后的笔记这篇博文将不断更新。更新日志26-01-2018“插入应用程序文件夹到路径”删除“下载,阅读和显示.csv文件”添加“一些有用的技巧”补充说27-01-2018“更改工作目录”添加28-01-2018“克隆Github回购谷歌合作”补充说“pip安装mxnet”添加29-01-2018NobackendwithGPUavailable.添加错误解决方案2018年2月2日“MxNet安装”更改(CPU到GPU)2018年5月2日“如何清除所有细胞的输出”补充说apt-keyoutputshouldnotbeparsed(stdoutisnotaterminal)警告添加

作者:CDA管理员

这篇“缺失的白皮书”是对委托权益证明(DPOS)的分析,目的是为DPOS的工作原理及其鲁棒性根源提供一个分析。DPOS的早期描述可以在bitshares.org上找到;不过,那个描述还包含了许多不属于实际共识过程的内容。所有区块链本质上都是一种由交易驱动的确定性状态机。共识是商定确定性交易顺序和过滤无效交易的过程。有许多不同的共识算法都可以产生等效的交易排序,但DPOS已经通过在多个区块链上经年累月的可靠运行证明自身是健壮、安全和有效的。像所有共识算法一样,块生产者可能导致的最大损害是审查。所有块的有效性必须基于确定性的开源状态机逻辑。DPOS算法概要DPOS算法分为两部分:选择一组块生产者和调度生产。选举过程确保利益相关方最终得到控制,因为当网络不能顺利运行时,利益相关方的损失最大。选举方法对实际运行中如何达成共识几乎没有影响,因此,本文将重点介绍如何在块生产者被选择之后达成共识。为了帮助解释这个算法,我想假设3个块生产者A,B和C。因为共识(的达成)需要2/3+1多数来解决所有情况,这个简化的模型将假设生产者C是打破僵局的那个人。在现实世界中,将有21个或更多的块生产者。像工作量证明一样,一般规则是最长链胜出。任何时候当一个诚实的对等节点看到一个有效的更长链,它都会从当前分叉切换到更长的这条链。我将举例说明在大多数想得到的网络条件下DPOS如何运行。这些例子应该可以帮助您理解为什么DPOS稳健且难以破坏。正常操作在正常操作模式下,块生产者每3秒钟轮流生成一个块。假设没有人错过自己的轮次,那么这将产生最长链。块生产者在被调度轮次之外的任何时间段出块都是无效的。少数分叉不超过节点总数三分之一的恶意或故障节点可能创建少数分叉。在这种情况下,少数分叉每9秒只能产生一个块,而多数分叉每9秒可以产生两个块。这样,诚实的2/3多数将永远比少数(的链)更长。离线少数的多重生产(离线的)少数人可以试图产生无限数量的分叉,但是他们的所有分叉都将比多数人的那条链短,因为少数人在出块速度上注定比多数人来的更慢。网络碎片化网络完全有可能碎片化,导致没有任何分叉拥有多数块生成者。在这种情况下,最长的链将倒向最大的那个少数群体。当网络连通性恢复时,较小的少数群体会自然切换到最长的那条链,明确的共识将恢复。有可能存在这样三个分叉,其中两个最长的分叉长度相同。在这种情况下,第3个(较小)分叉的块生产者重新加入网络时会打破平局。块生产者总数为奇数,因此不可能长时间保持平局。稍后我们还会讲到生产者“洗牌”,它使得出块顺序随机化,从而确保即使是生产者数目相同的两个分叉也会以不同的步长增长,最终导致一个分叉超过另一个。在线少数的多重生产在这种场景下,少数节点B在其时间段内产生了两个或更多可供选择的块。下一个计划生产者(C)可以选择基于B产生的任何一种方案继续构建链条。一旦如此,这个选择就成为最长的链,而所有选择B1的节点都将切换分叉。少数不良生产者企图广播再多的替代块也无关紧要,它们作为最长链的一部分永远不会超过一轮。最后不可逆块在网络碎片化的情况下,多个分叉都有可能持续不断增长相当长的时间。长远来看最长的链终将获胜,但观察者需要一种确切的手段来判定一个块是否绝对处于增长最快的那条链。这可以通过观察来自2/3+1多数块生产者的确认来决定。在下图中,块B已被C和A所确认,这代表了2/3+1多数确认,由此我们可以推断没有其它链会比这个更长–如果2/3的生产者是诚实的。请注意,这个“规则”类似于比特币的6块确认“规则”。一些聪明人也许可以谋划一系列事件使得两个节点(应该是“交易”?)出现在不同的最后不可逆块上。这种边缘案例要求攻击者能完全控制通信延迟,并且在几分钟内两次--而不是一次--使用该控制。即便这真的发生了,那么最长链(胜出)的长期规则仍然适用。我们估计这种攻击的可能性足够接近0,且经济后果无关紧要,因此不足为虑。生产者法定人数不足在缺乏明晰的生产者法定人数这种不太可能的情况下,少数人还是可以继续出块。利益相关方可以在这些块里包括更改投票的交易。这些投票可以选出一组新的生产者,并将出块参与率恢复到100%。一旦如此,少数链将最终超过所有其他以低于100%参与率运行的链。在此过程中,所有观察者都会知道,在一条参与率超过67%的链形成之前,网络状态是不定的。那些选择在此条件下进行交易的人所冒的风险与选择接受不到6个确认的人相似。他们知道存在这样一些小的可能性,即:共识也许最终在一个不同的分叉上建立起来。在实践中,这种情况比接受少于3个比特币交易确认的块要安全多了。多数生产者舞弊如果多数生产者变得腐败,那么他们可以产生无限数量的分叉,每个分叉都看起来以2/3多数确认向前走。这种情况下,最后不可逆块算法蜕变为最长链算法。最长链就是为最大多数所批准的那条链,而这将由少数剩下的诚实节点决定。这种行为不会持续很长时间,因为利益相关方最终会投票替换生产者。交易作为权益证明(TaPoS)当用户为一个交易签名时,他们是在对区块链状态的一定假设下这样做的。这个假设是基于他们对最近几个块的看法。如果最长链的共识发生改变,则潜在会使签名者之前的假设失效。就TaPoS而言,所有交易都包含最近一个块的散列,如果该块在链历史中不存在则这些交易被认为是无效的。任何在孤儿分叉上给交易签名的人,都会发现该交易无效且无法迁移到主分叉。该过程的一个附带作用是可以抵御试图产生替代链的长期攻击。每个利益相关方在每次交易时都直接对区块链做出确认。随着时间推移,所有的块都是由所有利益相关方确认过的,这在一条伪造链里是无法复制的。确定性生产者洗牌在上面所有例子中,我们展示的都是块生产者按循环调度出块。实际上,每出N个块(N是生产者数量),块生产者集合都会洗牌一次。这种随机性确保块生成者B不会总是忽略块生成者A,每当形成多个拥有相同数量生产者的分叉时,平局最终都会被打破。结论在每一个我们能想到的自然网络分裂的情况下,委托权益证明都是强健的,甚至在面对相当数量生产者舞弊的情形时也是安全的。不像其它共识算法,当大多数生产者不合格时,DPOS还是可以继续工作。在此过程中,社区可以投票替换掉不合格的生产者,直到恢复100%参与率。我还不知道有任何其它算法可以在如此高强度和变化多端的失败条件下依然保持强健。说到底,DPOS引人注目的安全性来自于其选择块生产者和验证节点质量的算法。运用赞成投票的过程可以确保一个人即使拥有50%的有效投票权也不能独自挑选哪怕一个生产者。DPOS旨在优化拥有强壮网络连接的诚实节点100%参与(共识过程)的名义条件。这使得DPOS有能力在平均只有1.5秒的时间内以99.9%的确定性确认交易,同时以优雅和可检测的方式降级–从降级中恢复正常也不过是小事一桩。其它共识算法以网络条件差的不诚实节点为名义条件展开设计,这样设计的最终结果就是性能更差、延迟更高、通信开销高的网络,而且这个网络在33%节点失效的情况下会完全停摆。在BitShares成功运行三年以及在Steem运行一年期间,我们经历了各种各样的网络条件和软件错误。DPOS成功穿行于其间,在处理了比任何其它区块链更多交易的同时持续达成共识,展现了非凡的能力。

作者:CDA管理员

本文首发于微信公众号:新金融见闻。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。拥有超过六位数的比特币,从一个“疯狂”购入的买方,到自己募资建立区块链投资基金,成为投资者,在2、3年时间里投出7个独角兽,自己做出1个独角兽。李笑来的背后是一部“比特币首富”成长史。在投资比特币之前,他的身份是:前新东方英语教师、畅销书作者、知识大咖。在他眼中,比特币不只是数字货币,这是一个真实的世界。疯狂生长的加密数字货币,正在从边缘进入主流。最近比特币价格一度突破3000美元,这是历史新高,包括比特币、莱特币、以太币在内的数字货币,市值已经超过1000亿美金,超过300万人正在积极挖掘、积累数字货币。从全球来看,美国商品期货委员会将比特币归类为商品,美国各州相继推出监管法规;德国政府支持比特币合法化,但要对交易正常征税;英国承认比特币作为一种货币存在;俄罗斯政府即将把比特币纳为合法金融工具。在国内,从早期的买币卖币、挖矿到现在的ICO(加密代币众筹)、风投涌入、技术创业,比特币背后的区块链技术,开始从各方面爆发,逐渐形成产业链,越来越多的从业者在其中寻找机会。1、一个快速生长的产业链早期李笑来也挖过矿,不过没赚什么钱,于是去做投资。其实挖矿也是一门生意,简单说就是购买矿机和电力,挖矿获得比特币,卖给市场获得利润利,参与的矿工们通过贡献算力,获得利益。随着比特币价格的高涨,出现了越来越多的矿工、矿机和矿场,每一笔比特币交易中都需要付出一笔矿工费,折合成人民币大概几十元。现在,越来越多的人从事挖矿工作,这些矿机集中起来,便成为矿场,为其他矿工提供托管服务。在中国的四川、贵州、内蒙,都有大规模的比特币矿场。因为电费便宜,规模化作业,这些矿场不断向市场输出新鲜出炉的各种币。如果把挖矿发币作为一个生意的话,这基本上是一个有稳定现金流的事情,每一代矿机买到手基本上都可以赚钱。随着比特币价格的上涨,挖矿的利润就还不错。但比特币价格的上涨幅度远远超过矿机的利润,币价一直在涨,算力也要涨。如果一个从业者卖了一些币去买回来一台矿机,那么这个矿机基本上是挖不回来比特币上涨的利润的。比特币挖矿所消耗的电能早已超过全国用电量的万分之一。越来越多传统行业的人也开始参与这个新兴事业,无论是资金投入还是人力投入。比特币从矿场挖出来后,人们在交易平台进行交易,买入卖出的比特币,是新一轮造富运动的原材料。2、首富的造富历程在场外市场赚钱,常年做买方,而不是短线炒币,因为从二级市场的经验来看,短线操作总是会买错卖错。这是李笑来的经验。2011年,作为科技新闻关注者,他在推特上看到了比特币的信息,一番研究之后,他发现:比特币,本质上是一个去中心化的银行,核心是账目公开,这意味着世界上的一个重要组织,正在被技术改变。他觉得这个机制是可行的。他开始买卖比特币,也曾尝试过挖矿,但效率不高。刚开始入手时,比特币经历了长时间的价格下降过程,在这期间,他大量吸入比特币。从买卖比特币到区块链创业,是一个自然的过程。这些年,李笑来做过一些关于创业的演讲,也曾把斯坦福YC创业公开课的学习笔记发布在个人主页上,受到广大网友欢迎;写过一些创销书,从早年的托福单词书到《和时间做朋友》这类畅销书,他在年轻人中积累了很多粉丝。比特币用技术颠覆了银行,创造了一种新的商业模式,李笑来想基于这一原理做一个新产品,2013年他锁定了版权领域,想针对内容出版物的去中心化发行做应用。当时他把这个想法跟一家VC讲了,不过对方没投,于是他自己募了一个两千万人民币左右的基金。在投资过程中,他看到了一个叫steem.io的平台,这家公司实现了他的想法,2015年底他参与投资这家平台,目前市值5亿美金。“我在2、3年时间里投出7个独角兽,自己做出1个独角兽,接下来我准备发起一个ICO项目Press.one,这是steem.io的升级版。”李笑来告诉全天候科技,现在他组建了一个团队,用自有资金进行投资,关注区块链的创业项目。他口中的ICO目前正在大热,全天候科技此前发表文章《别只盯着比特币!“野蛮生长”的ICO江湖:2年30倍只是寻常》,还原了一个通过ICO实现财务自由的故事。ICO是一种公开发行的行为,发行标的物由证券变成了数字加密货币。一些区块链创业公司通过股权众筹的形式,获得自己的启动资金,给投资者们相应的股权回报,这些股权在区块链上会显示为一种代币。经过私募、ICO等过程,代币会在交易平台流通,参与者们在几天到几个月的时间内,可以交易套现。传统的股权众筹很难让投资者随意退出,ICO解决了一级市场的融资和资金流通问题,基本上代币项目发行几天后,就可以在市场自由交易,实现流动性溢价。目前区块链创业项目通过ICO获得的资金,已经超越了传统VC机构。因为热钱多,行业目前鱼龙混杂,李笑来的建议是:每个投资者应该有自己的分辨价值和投资原则,这个市场充满了投机主义,非常浮躁,如果投资者只是听别人的判断,不会自己判断,那么赚了的钱,迟早有一天也会输回去的。3、圈内一周,圈外一年在大部分普通投资者看来,ICO最具诱惑的是高回报率。初夏的夜晚,上海徐家汇(002561,股吧)的一个花园别墅里,云币网创始人老猫(化名)正在举行一个小型聚会,给投资者们介绍ICO,云币网是一个交易平台,比特币、以太币,以及各种ICO平台发行的代币,都可以在此交易。老猫大学毕业之后在国土局工作了几年,因为不想过一眼看穿人生的生活,辞职出来,做过商业地产、生产型企业、电商,13年开始接触比特币,第一桶金来自于比特币场外交易,在交易所之外进行买卖,在3个月时间,获得了70个比特币,建立了云币网。他身边聚集了很多通过ICO造富的普通人,他说:“从十来万起家,获得百万回报,太常见了,在我看来,最重要的是独立自主的判断能力,可能早期参与的人有信息优势,得到消息就能赚一票,但是这个行业的时间密度很大,圈里的一周,相当于人世间的一年,知识更新迭代很快,我们最终要形成自己的判断。”Hcash(超级现金)基金会成员RyanXu告诉全天候科技:“从ICO中募集的资金,主要用于项目的开发和推广,后续会有专业的审计公司来协助基金会的财物管理。如果ICO没有达到预期融资额,就全额退币,数字货币的保管目前存在一些安全隐患,需要比较专业的IT知识。”Ryan正在操作一轮ICO项目,在他看来,目前市场财富效应非常明显,有过热的趋势,参与ICO的投资者一定要注意风险。当然,ICO也有亏损额投资者,可能一些项目开盘就破发。同时数字货币交易是7/24全年无休的,没有涨跌停限制。此外还有TheDAO,2016年5月开始众筹,这是一个完全由计算机代码控制运作的类似公司的实体,这在人类历史上还是首次。当时共筹集1200多万个ETH。但是最终因受到黑客攻击,再到争论中软硬分叉,最后以解散退回以太币而告终。通过ICO孵化优质的区块链项目,行业基础已经和几年前不一样了。“很多以前火爆的产品,现在都飞快老去,比如莱特币的涨幅,和比特币、以太币,以及新兴的ICO代币,根本不能比,市场不断有更新的、更有投资价值的事物出现。在老项目上,很难孵化出有价值的产品,所以我们需要快速追随新技术,比如最近ICO的量子链,解决了一些平台问题,是更有前景的产品。”老猫告诉全天候科技。在他看来,这本质是一个博弈论的事情,一个产品的最终价值、何时买入、何时卖出,其中也会有囚徒困境、纳什均衡。4、传统行业大举进入越来越多区块链相关的创业项目正在涌现。不只是李笑来这样的个人参与者,还有传统行业龙头参与者也瞄准了这个方向,VC基金不断给予资金扶持,以及建立自己的区块链产业。2015年万向成立了区块链实验室,设立5000万美元分布式资本基金投资区块链创业公司,2016年又相继成立了万向区块链商业创新咨询服务、万云BaaS平台、服务于区块链初创团队的万向新链加速器。2017年初,万向控股正式成立了区块链股份公司,注册资本1亿元。最近万向在杭州萧山的创新聚能城,开始面向全球开展区块链项目招募,希望建设开放式创新生态。万向控股有限公司首席创新官王允臻告诉全天候科技:万向希望结合云计算、大数据、人工智能等前沿科技,打造世界第一个建立在区块链上的新型智慧城市。王允臻曾担任IBM大中华区创新事业部总经理,在他看来,区块链技术,本质上解决了人工智能和大数据在被采用当中所面临的很多挑战,把人工智能和大数据释放到人类世界,把它们社会化。“区块链可以管理人工智能和人类世界的交互,它提供了一个方式,让数据和数据之间完成互联互通,实现智能检索,同时它并不需要原始数据,不需要数据备份和转移,这解决了企业之间、甚至国家与国家的问题。”他说。传统企业的加入,加速了区块链的发展,万向也在为下一个技术风口做准备。而层出不穷的区块链造富故事背后,是一套套独立的判断体系。“这就像一个镜像世界,生活和投资是反的,是不兼容的,生活要热情和努力,投资需要思考和等待,有人会在等待的时候,去读书、旅游、陪家人、写书写博客,很忙的投资者,可能不是最勤奋思考的。”李笑来说。风口之后,还会有更多新风口,机会一直都有,下一个首富,还在不断涌现。

作者:CDA管理员

随着大数据时代的到来,企业管理者对数据价值的重视度越来越高,他们渴望从企业内外部数据中获得更多的信息财富,并以此为依据,帮助自己做出正确的战略决策,数据分析技能被应用在诸如互联网、金融、电商、市场、运营等各行各业。因此,掌握数据分析相关技能已经成为大数据时代的重要加薪砝码。-摘自《CDA数据分析研究院-学员需求文本分析》具体来说,你需要掌握以下的知识技能来提升大数据时代的职业竞争力。1.统计学思想和方法如果拥有出色的工具使用技能,但是不会解读数据,那又有什么用呢?对数据分析来说,了解统计学知识很关键,包含描述性统计学和推断性统计学。统计学更多地是提供解决问题的思路,在你未来的工作中会显得越来越重要。2.SQL数据库查询语言不光是数据分析,当下大部分的岗位中,诸如产品经理、市场运营等岗位。SQL都被列为一项重要的技能。你需要知道如何从关系型数据库(诸如Mysql,Oracle,SqlServer)中提取出你自己需要的数据。3.工具使用能力俗话说,工欲善其事必先利其器。这个依据你的行业和兴趣而定。如银行、医药行业多用SAS,市场咨询、电信等行业偏爱SPSS。如果你对编程感兴趣,那么它是让数据分析师超越业务分析师之上的核心技能,你需要熟练掌握一到多门编程语言,从Python或R开始。4.数据挖掘建模分析能力(机器学习)如果你是数据分析师或者对数据分析感兴趣,你不需要发明新的机器学习算法,但是你应该了解这些领域的常见概念。一些示例包括主成分分析、神经网络、支持向量机和K均值聚类。你需要掌握监督式学习和非监督式学习的方法。5.大数据分析能力如果你的企业面临的数据量级足够大,而且你对大数据分析感兴趣,那么你需要了解大数据存储和分析的工具,诸如hadoop,Spark等技术。6.数据可视化能力如果你无法清晰有效地传达你的想法,那么你的数据分析繁琐工作不会受到任何认可。熟悉诸如PowerBI、Tableau、GGplot、Matplotlib、Seaborn等任何一款数据可视化工具将会有帮助。要取得成功,你还需要完全了解业务背景,以便知道如何调整你的数据可视化结果,使其具有最高的关联性。数据分析是一个快速发展的学科,以上的也可能会有所偏驳。如果你对任一技能感兴趣并潜心学习,都足够成为大数据时代的加薪砝码,成为企业的抢手人才。当然,除了技术能力以外,你还需要掌握数据之外的必备能力。1.抽象思维能力:数据分析师的任务不该止步于技术开发,他们更大的价值是培养抽象思维能力。具体来说是将一个虚无缥缈的概念剖开,成为数据可以解答的问题⸺建立框架和分析角度,分解分解大而全的问题,用数据分析给出小而美的答案,进一步将其变成产品建议,进而为高层提供决策依据;2.沟通技能:数据分析师在数据获取、分析、洞察及实施各个阶段都需要业务团队及高层的配合,因而,数据团队对成员的沟通技能有较高要求:在合作初期,数据团队需要具备发现业务团队需求的沟通力;合作中,尽快让业务团队建立起对数据团队的信任感并克服其抵触感;拿到分析结果后,数据团队应总结洞察并提出业务建议,精准且有效率地与决策者沟通,辅助其决策;最终,数据团队应配合业务和高层将相关分析结果实施落地;3.业务知识:数据分析师要充分认识到所在组织或机构的业务流程,理解数据如何影响所在组织或机构的各方面业务,用数据为所在机构或组织创造最大价值,比如推动产品升级、做出更好决策。

作者:CDA管理员

数据是非常强大的。当然,如果你能真正理解它想告诉你的内容,那它的强大之处就更能体现出来了。Datacanbeverypowerful.Ifyoucanactuallyunderstandwhatit'stellingyou,thatis.通过观察数字和统计数据的转换以获得清晰的结论并不是一件容易的事。必须用一个合乎逻辑的、易于理解的方式来呈现数据。It'snoteasytogetcleartakeawaysbylookingataslewofnumbersandstats.You'vegottohavethedatapresentedinalogical,easy-to-understandway.谈谈数据可视化。人类的大脑对视觉信息的处理优于对文本的处理——因此使用图表、图形和设计元素,数据可视化可以帮你更容易的解释趋势和统计数据。Enterdatavisualization.Thehumanbrainprocessesvisualinformationbetterthanitprocessestext--sousingcharts,graphs,anddesignelements,datavisualizationcanhelpyouexplaintrendsandstatsmuchmoreeasily.但是,并非所有的数据可视化是平等的。(点击“为什么大多数人的图表和图形看起来像废话”了解我想表达的意思)那么,如何将数据组织起来,使其既有吸引力又易于理解?通过下面的16个有趣的例子获得启发,它们是既注重风格和也注重内容的数据可视化案例。什么是数据可视化?数据可视化是指将数据以视觉形式来呈现,如图表或地图,以帮助人们了解这些数据的意义。文本形式的数据很混乱(更别提有多空洞了),而可视化的数据可以帮助人们快速、轻松地提取数据中的含义。用可视化方式,您可以充分展示数据的模式,趋势和相关性,而这些可能会在其他呈现方式难以被发现。数据可视化可以是静态的或交互的。几个世纪以来,人们一直在使用静态数据可视化,如图表和地图。交互式的数据可视化则相对更为先进:人们能够使用电脑和移动设备深入到这些图表和图形的具体细节,然后用交互的方式改变他们看到的数据及数据的处理方式。感到兴奋了吗?让我们来看一些不错的交互和静态数据可视化的例子。交互数据可视化的实例1)为什么会有“巴士群”现象这里有一个关于复杂数据集的很好的例子,它看起来感觉像一个游戏。在这个例子里,Setosa网站为我们呈现了“巴士群”现象是如何发生的,即,当一辆巴士被延迟,就会导致多辆巴士在同一时间到站。只用数字讲述这个故事是非常困难的,所以取而代之的是,他们把它变成一个互动游戏。当巴士沿着路线旋转时,我们可以点击并按住一个按钮来使巴士延迟。然后,我们所要做的就是观察一个短暂的延迟如何使巴士在一段时间以后聚集起来。2)世界上的语言这个由DensityDesign设计的互动是个令人印象深刻的成果,它将世界上众多(或者说,我们大多数人)的语言用非语言的方法表现出来。一共有2678种。这件作品可以让你浏览使用共同语言的家庭,看看哪些语言是最常用的,并查看语言在世界各地的使用范围。这是一种了不起的视觉叙事方法:将一个有深度的主题用一种易于理解的方式解读。3)按年龄段分布的美国人口百分比这是如何以令人信服的方式呈现一种单一的数据的好榜样。PewResearch创造了这个GIF动画,显示随着时间推移的人口统计数量的变化。这是一个好方法,它将一个内容较多的故事压缩成了一个小的package。此外,这种类型的微内容很容易在社交网络上分享或在博客中嵌入,扩大了内容的传播范围。如果你想自己用Photoshop做GIF,这里有一个详细的教程。4)NFL(国家橄榄球联盟)的完整历史体育世界有着丰富的数据,但这些数据并不总是能有效地呈现(或者准确的说,对于这个问题)。然而,FiveThirtyEight网站做的特别好。在下面这个交互式可视化评级中,他们计算所谓“等级分”–根据比赛结果对球队实力进行简单的衡量–在国家橄榄球联盟史上的每一场比赛。总共有超过30,000个评级。观众可以通过比较各个队伍的等级来了解每个队伍在数十年间的比赛表现。5)GoogleFlights上的美国感恩节下面是将一段时间内在空中移动的物体进行可视化的好方法。这是由GoogleTrends驱动的项目,它跟踪感恩节前出发、到达和穿越美国的航班。可视化始于当天很早的时间,随着时间的推移,像播放电影一样显示在全国各地飞行中的航班。不需要显示时间外的任何数字,观众即可以看到当天哪段时间是国际航班、国内航班以及往返于全国各地不同枢纽的航班的热门时间。6)是什么真正造成了全球变暖?听说过一种建议,“不要只简单地展示数据,讲个故事吧”?这正是彭博商业正在做的可视化——用互动讲述故事的来龙去脉。此图的关键点是要反驳用自然原因解释全球变暖的理论。首先你会看到从1880年至今观测到的温度上升。当你向下滚动,这个可视化图会让你清楚的了解相较于已被观测到的因素,造成全球变暖的不同因素到底有多少,使故事内容更加丰富。作者希望观众能够得到非常清晰的结论。7)在叙利亚,谁和谁在战斗许多不同的团体之间的关系可能很难理解–尤其是当有11个这样的团体存在的时候,这些团体之间有的结盟,有的敌对,反之亦然。这让人难以理解。但是,Slate网站通过表格的形式和熟悉的视觉效果和色彩,将这些数据简化为一种简单的、易于理解和互动的形式。观众可以点击任一张脸来查看双方关系的简要描述。8)最有价值的运动队这是通过叠加数据来讲述深层故事的一个例子。这个交互由ColumnFive设计,受福布斯“2014年最具价值的运动队50强”名单得到的启发。但是它不仅将列表可视化,用户还可以通过它看到每支队伍参赛的时间以及夺得总冠军的数量。这为各队的历史和成功提供了更全面的看法。

作者:CDA管理员

知识图谱(KnowledgeGraph)是当前的研究热点。自从2012年Google推出自己第一版知识图谱以来,它在学术界和工业界掀起了一股热潮。各大互联网企业在之后的短短一年内纷纷推出了自己的知识图谱产品以作为回应。比如在国内,互联网巨头百度和搜狗分别推出”知心“和”知立方”来改进其搜索质量。那么与这些传统的互联网公司相比,对处于当今风口浪尖上的行业-互联网金融,知识图谱可以有哪方面的应用呢?一.什么是知识图谱?知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(HeterogeneousInformation)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入BillGates的时候,搜索结果页面的右侧还会出现BillGates相关的信息比如出生年月,家庭情况等等。另外,对于稍微复杂的搜索语句比如“WhoisthewifeofBillGates”,Google能准确返回他的妻子MelindaGates。这就说明搜索引擎通过知识图谱真正理解了用户的意图。上面提到的知识图谱都是属于比较宽泛的范畴,在通用领域里解决搜索引擎优化和问答系统(Question-Answering)等方面的问题。接下来我们看一下特定领域里的(Domain-Specific)知识图谱表示方式和应用,这也是工业界比较关心的话题。二.知识图谱的表示假设我们用知识图谱来描述一个事实(Fact)-“张三是李四的父亲”。这里的实体是张三和李四,关系是“父亲”(is_father_of)。当然,张三和李四也可能会跟其他人存在着某种类型的关系(暂时不考虑)。当我们把电话号码也作为节点加入到知识图谱以后(电话号码也是实体),人和电话之间也可以定义一种关系叫has_phone,就是说某个电话号码是属于某个人。下面的图就展示了这两种不同的关系。另外,我们可以把时间作为属性(Property)添加到has_phone关系里来表示开通电话号码的时间。这种属性不仅可以加到关系里,还可以加到实体当中,当我们把所有这些信息作为关系或者实体的属性添加后,所得到的图谱称之为属性图(PropertyGraph)。属性图和传统的RDF格式都可以作为知识图谱的表示和存储方式,但二者还是有区别的,这将在后面章节做简单说明。三.知识图谱的存储知识图谱是基于图的数据结构,它的存储方式主要有两种形式:RDF存储格式和图数据库(GraphDatabase)。下面的曲线表示各种数据存储类型在最近几年的发展情况。从这里我们可以明显地看到基于图的存储方式在整个数据库存储领域的飞速发展。这幅曲线图来源于GraphDBMSincreasedtheirpopularityby500%withinthelast2years下面的列表表示的是目前比较流行的基于图存储的数据库排名。从这个排名中可以看出neo4j在整个图存储领域里占据着NO.1的地位,而且在RDF领域里Jena还是目前为止最为流行的存储框架。这部分数据来源于DB-EnginesRanking当然,如果需要设计的知识图谱非常简单,而且查询也不会涉及到1度以上的关联查询,我们也可以选择用关系型数据存储格式来保存知识图谱。但对那些稍微复杂的关系网络(现实生活中的实体和关系普遍都比较复杂),知识图谱的优点还是非常明显的。首先,在关联查询的效率上会比传统的存储方式有显著的提高。当我们涉及到2,3度的关联查询,基于知识图谱的查询效率会高出几千倍甚至几百万倍。其次,基于图的存储在设计上会非常灵活,一般只需要局部的改动即可。比如我们有一个新的数据源,我们只需要在已有的图谱上插入就可以。于此相反,关系型存储方式灵活性方面比较差,它所有的Schema都是提前定义好的,如果后续要改变,它的代价是非常高的。最后,把实体和关系存储在图数据结构是一种符合整个故事逻辑的最好的方式。四.应用在本文中,我们主要讨论知识图谱在互联网金融行业中的应用。当然,很多应用场景和想法都可以延伸到其他的各行各业。这里提到的应用场景只是冰山一角,在很多其他的应用上,知识图谱仍然可以发挥它潜在的价值,我们在后续的文章中会继续讨论。1.反欺诈反欺诈是风控中非常重要的一道环节。基于大数据的反欺诈的难点在于如何把不同来源的数据(结构化,非结构)整合在一起,并构建反欺诈引擎,从而有效地识别出欺诈案件(比如身份造假,团体欺诈,代办包装等)。而且不少欺诈案件会涉及到复杂的关系网络,这也给欺诈审核带来了新的挑战。知识图谱,作为关系的直接表示方式,可以很好地解决这两个问题。首先,知识图谱提供非常便捷的方式来添加新的数据源,这一点在前面提到过。其次,知识图谱本身就是用来表示关系的,这种直观的表示方法可以帮助我们更有效地分析复杂关系中存在的特定的潜在风险。反欺诈的核心是人,首先需要把与借款人相关的所有的数据源打通,并构建包含多数据源的知识图谱,从而整合成为一台机器可以理解的结构化的知识。在这里,我们不仅可以整合借款人的基本信息(比如申请时填写的信息),还可以把借款人的消费记录、行为记录、网上的浏览记录等整合到整个知识图谱里,从而进行分析和预测。这里的一个难点是很多的数据都是从网络上获取的非结构化数据,需要利用机器学习、自然语言处理技术把这些数据变成结构化的数据。2.不一致性验证不一致性验证可以用来判断一个借款人的欺诈风险,这个跟交叉验证类似。比如借款人张三和借款人李四填写的是同一个公司电话,但张三填写的公司和李四填写的公司完全不一样,这就成了一个风险点,需要审核人员格外的注意。再比如,借款人说跟张三是朋友关系,跟李四是父子关系。当我们试图把借款人的信息添加到知识图谱里的时候,“一致性验证”引擎会触发。引擎首先会去读取张三和李四的关系,从而去验证这个“三角关系”是否正确。很显然,朋友的朋友不是父子关系,所以存在着明显的不一致性。不一致性验证涉及到知识的推理。通俗地讲,知识的推理可以理解成“链接预测”,也就是从已有的关系图谱里推导出新的关系或链接。比如在上面的例子,假设张三和李四是朋友关系,而且张三和借款人也是朋友关系,那我们可以推理出借款人和李四也是朋友关系。3.组团欺诈相比虚假身份的识别,组团欺诈的挖掘难度更大。这种组织在非常复杂的关系网络里隐藏着,不容易被发现。当我们只有把其中隐含的关系网络梳理清楚,才有可能去分析并发现其中潜在的风险。知识图谱,作为天然的关系网络的分析工具,可以帮助我们更容易地去识别这种潜在的风险。举一个简单的例子,有些组团欺诈的成员会用虚假的身份去申请贷款,但部分信息是共享的。下面的图大概说明了这种情形。从图中可以看出张三、李四和王五之间没有直接的关系,但通过关系网络我们很容易看出这三者之间都共享着某一部分信息,这就让我们马上联想到欺诈风险。虽然组团欺诈的形式众多,但有一点值得肯定的是知识图谱一定会比其他任何的工具提供更佳便捷的分析手段。4.异常分析(AnomalyDetection)异常分析是数据挖掘研究领域里比较重要的课题。我们可以把它简单理解成从给定的数据中找出“异常”点。在我们的应用中,这些”异常“点可能会关联到欺诈。既然知识图谱可以看做是一个图(Graph),知识图谱的异常分析也大都是基于图的结构。由于知识图谱里的实体类型、关系类型不同,异常分析也需要把这些额外的信息考虑进去。大多数基于图的异常分析的计算量比较大,可以选择做离线计算。在我们的应用框架中,可以把异常分析分为两大类:静态分析和动态分析,后面会逐一讲到。a.静态分析所谓的静态分析指的是,给定一个图形结构和某个时间点,从中去发现一些异常点(比如有异常的子图)。下图中我们可以很清楚地看到其中五个点的相互紧密度非常强,可能是一个欺诈组织。所以针对这些异常的结构,我们可以做出进一步的分析。b.动态分析所谓的动态分析指的是分析其结构随时间变化的趋势。我们的假设是,在短时间内知识图谱结构的变化不会太大,如果它的变化很大,就说明可能存在异常,需要进一步的关注。分析结构随时间的变化会涉及到时序分析技术和图相似性计算技术。5.失联客户管理除了贷前的风险控制,知识图谱也可以在贷后发挥其强大的作用。比如在贷后失联客户管理的问题上,知识图谱可以帮助我们挖掘出更多潜在的新的联系人,从而提高催收的成功率。现实中,不少借款人在借款成功后出现不还款现象,而且玩“捉迷藏”,联系不上本人。即便试图去联系借款人曾经提供过的其他联系人,但还是没有办法联系到本人。这就进入了所谓的“失联”状态,使得催收人员也无从下手。那接下来的问题是,在失联的情况下,我们有没有办法去挖掘跟借款人有关系的新的联系人?而且这部分人群并没有以关联联系人的身份出现在我们的知识图谱里。如果我们能够挖掘出更多潜在的新的联系人,就会大大地提高催收成功率。举个例子,在下面的关系图中,借款人跟李四有直接的关系,但我们却联系不上李四。那有没有可能通过2度关系的分析,预测并判断哪些李四的联系人可能会认识借款人。这就涉及到图谱结构的分析。6.智能搜索及可视化展示基于知识图谱,我们也可以提供智能搜索和数据可视化的服务。智能搜索的功能类似于知识图谱在Google,Baidu上的应用。也就是说,对于每一个搜索的关键词,我们可以通过知识图谱来返回更丰富,更全面的信息。比如搜索一个人的身份证号,我们的智能搜索引擎可以返回与这个人相关的所有历史借款记录、联系人信息、行为特征和每一个实体的标签(比如黑名单,同业等)。另外,可视化的好处不言而喻,通过可视化把复杂的信息以非常直观的方式呈现出来,使得我们对隐藏信息的来龙去脉一目了然。7.精准营销“Aknowledgegraphallowsyoutotakecoreinformationaboutyourcustomer—theirname,wheretheyreside,howtocontactthem—andrelateittowhoelsetheyknow,howtheyinteractontheweb,andmore”--MicheleGoetz,aPrincipalAnalystatForresterResearch一个聪明的企业可以比它的竞争对手以更为有效的方式去挖掘其潜在的客户。在互联网时代,营销手段多种多样,但不管有多少种方式,都离不开一个核心-分析用户和理解用户。知识图谱可以结合多种数据源去分析实体之间的关系,从而对用户的行为有更好的理解。比如一个公司的市场经理用知识图谱来分析用户之间的关系,去发现一个组织的共同喜好,从而可以有针对性的对某一类人群制定营销策略。只有我们能更好的、更深入的(Deepunderstanding)理解用户的需求,我们才能更好地去做营销。五.挑战知识图谱在工业界还没有形成大规模的应用。即便有部分企业试图往这个方向发展,但很多仍处于调研阶段。主要的原因是很多企业对知识图谱并不了解,或者理解不深。但有一点可以肯定的是,知识图谱在未来几年内必将成为工业界的热门工具,这也是从目前的趋势中很容易预测到的。当然,知识图谱毕竟是一个比较新的工具,所以在实际应用中一定会涉及到或多或少的挑战。1.数据的噪声首先,数据中存在着很多的噪声。即便是已经存在库里的数据,我们也不能保证它有100%的准确性。在这里主要从两个方面说起。第一,目前积累的数据本身有错误,所以这部分错误数据需要纠正。最简单的纠正办法就是做离线的不一致性验证,这点在前面提过。第二,数据的冗余。比如借款人张三填写公司名字为”普惠“,借款人李四填写的名字为”普惠金融“,借款人王五则填写成”普惠金融信息服务有限公司“。虽然这三个人都隶属于一家公司,但由于他们填写的名字不同,计算机则会认为他们三个是来自不同的公司。那接下来的问题是,怎么从海量的数据中找出这些存在歧义的名字并将它们合并成一个名字?这就涉及到自然语言处理中的”消歧分析”技术。2.非结构化数据处理能力在大数据时代,很多数据都是未经处理过的非结构化数据,比如文本、图片、音频、视频等。特别在互联网金融行业里,我们往往会面对大量的文本数据。怎么从这些非结构化数据里提取出有价值的信息是一件非常有挑战性的任务,这对掌握的机器学习,数据挖掘,自然语言处理能力提出了更高的门槛。3.知识推理推理能力是人类智能的重要特征,使得我们可以从已有的知识中发现隐含的知识,一般的推理往往需要一些规则的支持。例如“朋友”的“朋友”,可以推理出“朋友”关系,“父亲”的“父亲”可以推理出“祖父”的关系。再比如张三的朋友很多也是李四的朋友,那我们可以推测张三和李四也很有可能是朋友关系。当然,这里会涉及到概率的问题。当信息量特别多的时候,怎么把这些信息(sideinformation)有效地与推理算法结合在一起才是最关键的。常用的推理算法包括基于逻辑(Logic)的推理和基于分布式表示方法(DistributedRepresentation)的推理。随着深度学习在人工智能领域的地位变得越来越重要,基于分布式表示方法的推理也成为目前研究的热点。4.大数据、小样本、构建有效的生态闭环是关键虽然现在能获取的数据量非常庞大,我们仍然面临着小样本问题,也就是样本数量少。假设我们需要搭建一个基于机器学习的反欺诈评分系统,我们首先需要一些欺诈样本。但实际上,我们能拿到的欺诈样本数量不多,即便有几百万个贷款申请,最后被我们标记为欺诈的样本很可能也就几万个而已。这对机器学习的建模提出了更高的挑战。每一个欺诈样本我们都是以很高昂的“代价”得到的。随着时间的推移,我们必然会收集到更多的样本,但样本的增长空间还是有局限的。这有区别于传统的机器学习系统,比如图像识别,不难拿到好几十万甚至几百万的样本。在这种小样本条件下,构建有效的生态闭环尤其的重要。所谓的生态闭环,指的是构建有效的自反馈系统使其能够实时地反馈给我们的模型,并使得模型不断地自优化从而提升准确率。为了搭建这种自学习系统,我们不仅要完善已有的数据流系统,而且要深入到各个业务线,并对相应的流程进行优化。这也是整个反欺诈环节必要的过程,我们要知道整个过程都充满着博弈。所以我们需要不断地通过反馈信号来调整我们的策略。六.结语知识图谱在学术界和工业界受到越来越多的关注。除了本文中所提到的应用,知识图谱还可以应用在权限管理,人力资源管理等不同的领域。在后续的文章中会详细地讲到这方面的应用。

作者:CDA管理员

学员动态

Hello World!开始你的学习吧

1小时前 杜囡囡杜鹃

开始学习 Tableau视图与故事

1小时前 sabrinali858

加入学习

1小时前 sabrinali858

加入学习

1小时前 sabrinali858

加入学习