编者按:本文来自微信公众号“机器之心”(ID:almosthuman2014)CDA人工智能学院经授权发布。

P100 都免费了,V100 还会远吗?

假如你是一枚学生党,既没有钱,学校实验室计算卡又不够用,却入了机器学习的门,那你肯定用过一个神器:Google Colab。

 Colaboratory 是一个 Google 研究项目,旨在帮助传播机器学习训练和研究成果。它是一个 Jupyter 笔记本环境,不需要进行任何设置就可以使用,并且完全在云端运行。Colaboratory 笔记本存储在 Google 云端硬盘中,并且可以共享,就如同你使用 Google 文档或表格一样。Colaboratory 可免费使用。同时也可以运行 Keras、TensorFlow、PyTorch、OpenCV 等框架进行深度学习的开发与应用。 搭建服务器很贵,一块 GPU 动辄上万,这种能够免费使用的开源平台,自然受到很多人的关注。 近日,有人发现,自己在运行 Colab 时获得的 GPU 是 Tesla V100:「是 V100,而不是 P100。因为我是 Colab 专业版用户 ,所以不确定是否所有用户都这样。」

 

 显然,他不是一个人。另外一位专业版的用户也晒出了截图:「我是 Google colab 专业版用户。每当连接到服务时,我都会习惯性检查获得了哪个 GPU。今天看到 V100 时,我第一次感到有点震惊,再次运行命令进行检查,没错,就是 V100。」 

也有推特用户表示自己已经率先用上了 V100,运行速度突然变快(幸福来得猝不及防)。

 近两年来,Colab 的硬件历经几次升级。先是去年 4 月,谷歌将 Colab 的 GPU 从古董级别的 K80 升级到了更加适合做低精度的推断的 Tesla T4,训练比 K80 快了很多。去年 11 月,Colab 又一次开放了 P100,一年之内两次硬件升级。 

目前,还没有任何官方消息确认 Colab 将免费提供 V100,或许这只是给专业版用户的一点福利

不过话说回来,P100 都免费了,V100 还会远吗? 

Tesla V100 是英伟达上一代处理器架构 Volta 的首款设备,发布于 2017 年 5 月,其核心 GV100 GPU 包含 211 亿个晶体管,是上代 Tesla P100 的 1.37 倍,芯片面积则达到了 815 平方毫米,采用台积电 12nm FFN 专属工艺打造。 

Tesla V100&Tesla P100 架构对比。 

从薅羊毛的角度来说,P100 的性能已经足够优秀,但 V100 显然更加强大: 

Tesla V100&Tesla P100 性能对比。 

如下图所示,V100 在 ResNet-50 深度神经网络训练任务中的速度比 P100 快 2.4 倍。如果每张图像的目标延迟是 7ms,那么 V100 使用 ResNet-50 深度神经网络进行推理的速度比 P100 快 3.7 倍(参与测试的 V100 为原型卡)。 

 最重要的是,和 P100 相比,Tesla V100 增加了专门为深度学习设计的 Tensor Core,能够明显加快深度学习算法和框架的运行速度。 

在各种 HPC 任务中,Tesla V100 平均比 Tesla P100 快 1.5 倍。(该性能基于 Tesla V100 原型卡)。 

参照 Colab 去年的硬件更迭速度,官宣 V100 仿佛也近在眼前。如果现在有时间,你可以打开 Colab 运行一下,也许能收获惊喜。