“AI同学”想从小学毕业，还需要走多久？

30秒快读

1、或许你习惯于刷脸支付、对着智能音箱下达命令，也听说过机器人了打败专业围棋选手的故事，AI正走进我们的生活。

2、尤其是疫情期间智能热成像仪、消毒机器人等AI产物，在防疫、抗疫、复工、复产方面发挥着重要的作用。

3、只是，尽管AI正在加速落地，出现在越来越多的应用场景，《IT时报》记者发现，目前的AI发展距离大众的期待仍有落差。

如果说大众对AI的期望是一名大学生，那么如今的AI还只是一名“小学生”，会学习，会有归纳，有结果输出，但还不会举一反三、随机应变。

这意味着，如果无人驾驶场景中遇到突发情况时，AI能足够快给出判断吗？我们能信任AI给出的判断吗？而应对这些缺陷，目前AI在框架上又有哪些性能提升空间？

带着这些问题，记者在2020年世界人工智能大会上一路追寻。

AI仍是“小学生”：

走不出黑箱

中科院院士何积丰表示，思考是对现有知识的加工和消化，并产生新知识的过程，相比于单纯学习，对人工智能而言需要更进一步。

事实上，目前人工智能已经发展到第二代，通过神经网络深度学习模拟人类的感知。数据、算力和算法是AI深度学习的三大要素。

那么，只会学习的AI如何打败了会思考的专业围棋大师？答案是数据！

据中国科学院院士、清华大学人工智能研究院院长张钹介绍，Alpha go在参加比赛前有6000万盘棋局的学习，但一名围棋大师学习的棋局只有百万级。

AI以量取胜。这也是目前AI的运用主要集中在声音识别、图像识别等方面的原因。由于声音、图像数据可以随时生成，能自我复制，几乎是无穷尽的。从本质上讲，AI是统计学，有了海量数据支撑，能够提升AI算法准确度。

但如今AI产出的结果并非完全令人满意。

由于深度学习通过数据层层分割，AI只能从局部识别，而非整体。AI识别一张阿尔卑斯山图片的准确率达94.39%。但如果给这张图片加上一层色彩躁点，尽管生成的新图片人类肉眼几乎看不出太大异样，但AI识别的结果却是一条大黄狗，识别率达99.99%。可见，AI只能识别物体，而不会真正理解含义。

遗憾的是，深度学习是黑箱算法，技术人员无法获知AI为何会产出上述结果。不可解释，带来的是对AI不安全、不可靠等方面的担忧。

在中科院院士、清华大学人工智能研究院院长张钹看来，目前的AI主要依靠数据、算力（蛮力）来解决完全信息和结构化环境下确定的问题，解决的问题很有限。面对复杂环境中的突发状况，比如无人驾驶突发路况，AI仍力不从心。

AI这位小学生距离毕业典礼仍有很长的路要走。

AI毕业路上加速度：

可变Batch Size策略下的提升

前路漫漫，毕业无期。但同时，《IT时报》记者也发现，AI小朋友的“学习状态”正在调整。AI框架的优化，让我们看到在算力和算法上的提升。

根据中科院计算所高性能计算机研究中心主任谭光明的分享，从2013年起，利用计算机GPU加速深度学习已成为业内趋势，而多节点并行计算逐渐成为主流。

深度学习发展早期，AI往往采用单节点的训练模式，只是随着更大的数据和更深层次的模型（从AlexNet、ResNet、NasNet直至AmoebaNet）被提出，意味着计算机需要更大的内存和计算能力。

当单GPU训练也无法承受应用的负载时，AI企业不得不采用边缘计算的形式为其解压。“分布式或并行计算将在AI框架中变得尤为重要。”谭光明表示。

据悉，目前无论是国外的TensorFlow、PyTorch还是国内的旷视天元MegEngine、百度飞桨都设计了分布式深度学习框架。

但是这一框架依然有着遗憾，比如算法的性能和精度。

Batch Size（批量取样规模）指的是深度学习神经网络中一次训练所选取的样本数，其大小会影响计算模型的优化程度和速度，也会直接影响GPU内存。

如果把计算模型看作是一头奶牛，那么批量取样规模是牧草。大量的牧草能提供奶牛丰富的营养，产出的牛奶质量越高。只是奶牛消化牧草需要时间，产奶也需要过程。因此，目前妥协于GPU内存情况和计算速度，AI企业不得不将批量取样规模调整到较小的数值，牺牲了准确度。

Facebook曾在1小时内完成了ImageNet的训练。当时Facebook采用的手段是将GPU的线性扩展到256个规模，并将8K作为批量取样规模的选择，能达到76%的准确率。与此类比，Google将批量取样规模从128上调至1024，但达到的准确率只有57%左右。

根据中科院研究院在2019年IEEE举办的一场峰会上发表的成果，计算模型在训练前后期，AI的学习效果显著不同，并提出了训练前期用8K批量取样规模，后期用64K批量取样规模的可变Batch Size计算策略。如同先给奶牛少部分牧草，促进消化，再提升牧草量，保证产出的牛奶质量。

效果显而易见，相比Facebook，这套新计算策略能在ImageNet上将训练时长从1小时缩短至25分钟。

值得一提的是，在分布式计算框架下，中科院还采用了“决策树”模型，将决策树作为选择器，为不同网络层确定合适的数据布局。

事实上，如果AI根据经验判断提取的数据，往往不一定是最优解。因此，有了“决策树”，目前能达到95%以上的预测精度，要知道运用传统方法，达到90%的预测精度并不容易。

或许从理论和技术上，AI正加快速度走向小学毕业的终点。

AI小学毕业：

模仿人脑，举一反三

AI的小学毕业典礼，是多位演讲嘉宾愿意畅想的未来，届时AI将真正拥有“智慧”，即随机应变、举一反三。

借鉴人脑模型，可能是AI的未来。如果AI能够理解识别的语义，可以像人类一样一眼就明，当遇到特殊情况时，能更快识别，做出合理判断。

知识、数据、算法和算力是张钹认为的第三代人工智能四个要素。

有了知识的AI有何不同？

事实上，目前AI能做的只有在确定环境和完全信息条件下的推理和决策。从AI玩围棋、国际象棋上看，本质上是一场决策的概率学。

当现实生活中，人们面对的更多是“博弈”。以玩德州扑克为例，AI还需要了解的是对手的心理，在对抗环境下做出决策。

不确定的环境、不完全的信息、动态变化的场景，对AI而言计算并不容易。

或许从理论上，我们可以看到第三代AI运用于更大范围的场景的可能。人工智能正在飞速发展，这一天似乎并不遥远。

“序幕已经拉开，大戏即将上演！” 张钹说。

作者／IT时报记者孙鹏飞

编辑／挨踢妹

排版／黄建

图片／采访对象、DeepMind

来源／《IT时报》公众号vittimes