人工智能领域在技术和产业应用方面取得惊人进步

Author: Chris Song

人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但不同的时代、不同的人对这种“复杂工作”的理解是不同的。2017年12月,人工智能入选“2017年度中国媒体十大流行语”。说到人工智能,人工智能的定义到底是什么?现在没有非常严格准确或者所有人都接受的定义,但是有一些约定俗成的说法。通常人工智能是指机器智能,让机器达到人智能所实现的一些功能。人工智能既然是机器智能,就不是机械智能,那么这个机器是指什么呢?是指计算机,用计算机仿真出来的人的智能行为叫作人工智能。中国工程院院士高文如是说。




人工智能发展实际经历了三个阶段。


第一个阶段从1956年到1976年。1956年,在由达特茅斯学院举办的一次会议上,计算机专家约翰·麦卡锡提出了“人工智能”一词,这被人们看做是人工智能正式诞生的标志。但到了70年代,由于科研人员在人工智能的研究中对项目难度预估不足,让大家对人工智能的前景蒙上了一层阴影。


第二个阶段从1976年到2006年。1976年很多学者研究神经元网络,直到1986年,BP算法(即误差反传网络)的出现让人眼前一亮。以往的神经元网络只能做非常小的事,做不了大事。但这个东西出来以后可以做大事了,所以就推动了这个领域发展的速度非常快。但它也只能解决一些问题,人工智能跌入第二次低谷。


第三个阶段从2006年开始。随着2006年Hinton提出的深度学习的技术,以及在图像、语音识别以及其他领域内取得的一些成功,大家认为经过了两次起伏,人工智能


开始进入了真正爆发的前夜。


这次标志性的技术进步,在最近三年引爆了一场商业革命。2016年可谓是AI商业化崛起的“黄金年”,谷歌、微软、百度等互联网巨头,还有众多的初创科技公司,


纷纷加入人工智能产品的战场,掀起又一轮的智能化狂潮,而且随着技术的日趋成熟和大众的广泛接受,这一次狂潮也许会架起一座现代文明与未来文明的桥梁。



2016年AI迎来爆发元年

谷歌阿尔法狗打败世界围棋冠军李世石


谷歌是人工智能领域的领军者,由该公司研发的深度学习人工智能项目AlphaGo在2016年1月份掌握了围棋技术,3月份即以4:1的比分击败了世界围棋冠军李世石。


NVIDIA首款深度学习与人工智能专用超级计算机问世


NVIDIA创立于1993年1月,是一家以设计智核芯片组为主的半导体公司。在今年之前,NVIDIA就已经推出了一些专为深度学习应用而设的GPU,所以它接下来开发超级计算机也是顺理成章的事情。2016年4月,英伟达宣布其开发出了一台专门用于满足人工智能研究人员需求的超级计算机——DGX-1。


XPRIZE携手IBM Watson设立AI 2020竞赛



2016年8月,XPRIZE宣布他们将和IBM Watson组织一项新的挑战赛,让人们更加务实地思考人工智能对于人类未来的影响。挑战赛开始不久,1000多人注册组成团队并提出面向各种社会问题的计划,其中包括健康,气候,交通,太空旅行,机器人,城市规划,外科手术,教育甚至还有公民权等。该竞赛是开放式比赛,参赛团队需要思考2020年他们将面临的评价标准。


谷歌WaveNet可以合成更逼真的人声


2016年9月9日,Google的DeepMind人工智慧团队(就是开发了AlphaGo的那个)利用了神经元网络,开发了第三种方式--也就是直接拆解出声源样本,产生出一个更深层的语言「习惯」资料,之后再从这些习惯直接建构出音讯档来。取决于喂给WaveNet AI的资料,它甚至可以模拟出嘴型动作和换气的细微声音,在音调和语速上也更有个人风格。而且WaveNet的应用并不止于人声而已,研究人员喂给它古典乐做为参考,它也能组合出相当有模有样的古典乐出来。



Elon Musk宣布Tesla所有新车将安装Autopilot2.0系统


2016年10月,Elon Musk宣布Tesla所有新车将安装具有完全自动驾驶功能的硬件系统Autopilot2.0,并计划在2017年年底之前以完全自动驾驶模式让无人驾驶汽车从洛杉矶开往纽约谷歌开源TensorFlow图说生成模型,可真正理解图像


2017年9月22号,谷歌宣布开源图说生成系统Show and Tell最新版在TensorFlow上的模型。该系统采用编码器-解码器神经网络架构,分类准确率达93.9%,在遇到全新的场景时能够生成准确的新图说。谷歌表示,这说明该系统能够真正理解图像。这次发布的版本对系统计算机视觉组件的一些重大技术提升,训练速度更快、生成的图说也更加准确、丰富。


Facebook、Amazon、谷歌、IBM和微软结成史上最大AI联盟


2017年9月28号,Facebook、Amazon、谷歌Alphabet、IBM和微软自发聚集在一起,宣布缔结新的人工智能(AI)伙伴关系,旨在进行研究和推广最佳做法。这意味着高科技公司将经常聚在一起讨论人工智能的进展情况。他们还将正式建立一种体制,实现公司间的沟通。值得注意的是,在日常工作中,这些团队将不断竞争,利用机器智能开发出最好的产品和服务。


机器学习也要反歧视?谷歌提出机会均等框架


随着机器学习技术的快速发展,人们对理解其社会影响的兴趣也越来越大。机器学习中一个尤其成功的分支是监督学习(supervised learning)。只要有足够的历史数据和计算资源,学习算法通常都能得出有效得让人惊讶的未来事件预测器。即使最好的预测器也会犯错。尽管机器学习的目标是最小化错误的可能性,但我们可以如何防止特定的群体经受不成比例的这类错误?10月7号,为了解决机器学习中的反歧视问题,谷歌提出机会均等框架。




Facebook推出AI和机器学习战略


在11月份的Web峰会上,Facebook首席技术官Mike Schroepfer阐述了人工智能和机器学习将在公司今后改善全球连通性、技术可及性和人机交互能力方面将发挥的重要作用。并再次表示,未来十年Facebook的发展愿景是“连接全世界”,而具体创新点则落实到“连接”、人工智能(AI)和虚拟现实(VR)三个领域上。


谷歌人工智能翻译工具获新突破


2016年11月22日,谷歌发布了人工智能翻译工具。此前其可以把英文日文,英文韩文进行互译,但现在机器可以在前两对翻译训练的基础上,“无师自通”地把日文直接翻译成韩文,整个过程不再借助英文的“桥接”。这或许意味着计算机自己内部形成了一套更深层次的概念体系,其更像是一个哲学的进步。


OpenAI发布人工智能训练平台Universe


2016年12月5日,特斯拉首席执行官伊隆马斯克(Elon Musk)创办的人工智能非营利性组织OpenAI发布了一款名为“Universe”的虚拟训练平台,以加快人工智能技术的发展。具体来说,开发人员可以将视频游戏、应用程序等内容放在这个平台上,对人工智能进行训练。


自动唇读系统LipNet唇语识别准确率为95.2%


2016年12月,英国牛津大学、谷歌DeepMind等研发的自动唇读系统LipNet对Gird语料库实现了准确率为95.2%的唇语识别,其对BBC电视节目嘉宾进行唇语解读,准确率为46.8%,远远超过专业的人类唇语专家(仅为12.4%)



2017年AI实现产业落地


“小度”人脸识别战胜最强大脑代表


2017年1月6日,百度人工智能机器人“小度”利用其超强的人脸识别能力,以3:2的成绩战胜人类最强大脑代表王峰。


Alpha Go成功战胜人类棋手


2017年5月份,围棋天才柯洁与AlphaGo进行了对决。柯洁赛前的冷静与斗志,在与AlphaGo对弈中逐渐消磨,最终柯洁以0:3战败。赛后柯洁曾一度哽咽:“它太完美我很痛苦,看不到任何胜利的希望。”


AlphaGO的开发者之一黄士杰称,AlphaGo的成功融合深度学习(Deep Learning)、強化学习(Reinforcement learning)与树搜索(Tree Search)三大技术,让程序自我对弈,自己便是自己的老师。谈及AlphaGO对围棋界的冲击时,黄士杰表示,“未来AI是人类的工具,跟人类合作,而非跟人类对抗,现在最强的学习技能仍在人类的脑袋里。”


谷歌正式发布第二代TPU,对标英伟达GPU Tesla V100


2017年5月19日凌晨,在谷歌I/O 2017大会上,谷歌正式发布了第二代TPU。


从2016年谷歌公布了这一项目计划之后,一直等到了2017年4月才看到详细的文档介绍以及论文。TPU的目标很简单,为多种深度神经网络设计,能够高速、高能耗比地执行深度学习模型的推理任务。在当时的几种方案中,ASIC的功能完全固定,FPGA的速度优势不大,GPU做模型训练没问题但推理任务成本太高,TPU的灵活性稍高于ASIC,并提供了大幅高于GPU的推理任务能耗比。虽然论文中的对比对象有争议、TPU在某些任务中的表现也并不理想,但以TPU为代表的定制芯片方案注定将会是深度学习大规模商业化应用的必备基础设施。谷歌正式发布的第二代TPU,运算能力、存储能力都有大幅提高。相比较上周英伟达刚刚推出的GPU Tesla V100,每秒达到120万亿次浮点运算,谷歌二代TPU最高可达到每秒180万亿次的浮点运算性能。最重要的是它还可以支持模型训练。


百度开源自动驾驶系统Apollo


2017年7月份的AI开发者大会上,百度宣布开源自动驾驶系统Apollo,并宣布其自驾车软件可供任何想下载的人免费使用。


作为国内智能驾驶研究和实践的先锋,百度此举,旨在将用户吸引到百度的开源人工智能平台上,为后续数据的收集与分析铺路。百度不仅向任何公司(包括其竞争对手)免费提供自主驾驶软件,这些软件也可以被定制化,开发他们自己的自主驾驶车辆。


人工智能上升为国家战略


2017年7月,国务院印发《新一代人工智能发展规划》(简称《规划》),指导构筑我国人工智能发展的先发优势,加快建设创新型国家和世界科技强国,将人工智能的未来发展上升为国家战略。


《规划》提出了人工智能六个方面的重点任务和一系列保障措施,要求到2020年人工智能总体技术和应用与世界先进水平同步,人工智能核心产业规模超过1500亿元,带动相关产业规模超过1万亿元;到2030年,我国人工智能理论、技术与应用总体达到世界领先水平。


iPhone X“齐刘海”引发人脸识别热议


2017年9月,苹果重磅发布最新产品iPhone X,嵌入了Face ID、无线充电、自创芯片A11 Bionic等最新AI技术。被人吐槽的“齐刘海”,其实是Face ID红外镜头、红外镜头、泛光感应元件、点阵投影器和普通摄像头的集成地。为了更加精准与安全地进行人脸识别,苹果开发了一个神经引擎,用神经网络处理图像和点阵模式,并邀请好莱坞特效面具公司,通过之作面具来训练神经网络的“聪明”程度。


华为发布世界首款人工智能手机芯片


2017年9月份,华为在柏林公布最新的麒麟970芯片,这是世界首款带了专用人工智能元素的手机芯片。这颗芯片采用台积电10纳米工艺,ARM的big.LITTLE大小多核架构,八核心芯片,有4个A73大核心(2.4Ghz)+4个A53小核心(1.8Ghz)。


麒麟970在不到100平方毫米的狭小体积内集成了55亿个晶管体,集成度非常高。另外,麒麟970还集成了12核心的GPU图形显示芯片,即ARM Mali-G72 MP12十二核GPU,改善了过去麒麟芯片图形性能较弱问题。


阿里投千亿成立达摩院


在2017年10月份阿里云栖大会的第一天,阿里巴巴CTO张建锋宣布,投资千亿成立阿里达摩院,强势加入人工智能领域的争夺战。


达摩院作为一家「致力于探索科技未知,以人类愿景为驱动力的研究院」,专注于基础科学、颠覆性技术等中长期技术研发。其首批公布的研究领域包括:量子计算、机器学习、基础算法、网络安全、视觉计算、自然语言处理、人机自然交互、芯片技术、传感器技术、嵌入式系统等,涵盖机器智能、智联网、金融科技等多个产业领域。


“女性”机器人Sophia获得公民身份


2017年10月,在沙特阿拉伯举行的“未来投资倡议”大会上,类人机器人Sophia被授予沙特公民身份,她成为了历史上首个获得公民身份的机器人。


除了透明后脑勺,Sophia拥有与人类高度相似的外观和行为方式,她还具有强大的语音识别、视觉数据处理和面部识别功能,不仅可以与人自然地聊天,Sophia还能控制多达62种面部表情,虽然她的眼睛里镶嵌着摄像头,但是她似乎可以与人进行眼神交流。


腾讯首次公布AI战略


2017年10月30日,马化腾就发表了致合作伙伴的公开信,用“深度融合”、“云化分享”、“智慧连接”、“全用户”、“大内容”、“新科技”、“宽平台”等七大关键词,分享了过去一年对数字经济发展的观察和思考。马化腾提到,今天软件、硬件和服务三者正在变得越来越紧密,甚至在融为一体。未来新技术的变革,一定会带来很多重新洗牌的机会。数字经济的发展让跨地域的协作创新产生了更多可能。


2017年11月8日,2017腾讯全球合作伙伴大会在成都正式拉开序幕,大会发布了腾讯AI战略“基础研究-场景共建-AI开放”的全景图:在基础研究领域着重于语音识别、自然语言处理、计算机视觉、机器学习四大领域;在场景应用上落地社交、内容、游戏、医疗、零售、金融、安防、翻译等八大场景;腾讯也将通过开放自身AI能力方面赋能医疗等传统行业实现AI,另一方面则是以AI生态计划全力扶植新兴AI创业者。


“1秒8000张海报”鲁班设计师


在双11的非凡热闹中,号称“1秒钟就能制作8000张海报”的阿里AI设计师【鲁班】出尽了风头。


鲁班,是在今年UCAN大会上惊艳亮相的人工智能设计平台。它早在去年的双11就已经在阿里内部进行了大规模的投入使用。在今年的双11,它完成了数量高达4亿的海报设计工作,做到了“千人千面”效果的淘宝海报。


据研究人员透露,鲁班目前的设计水平已经非常接近普通设计师。不少设计师表示要被鲁班“抢饭碗”,但更多的人认为,鲁班目前只是承担了设计工作中比较低级的重复性部分,对于创意和想象工作,鲁班还并不能胜任。


无人驾驶在北京正式上路


2017年7月,百度李彦宏驾驶无人汽车在北京五环上行驶,但由于变道时压了实线,百度无人驾驶汽车吃到了第一张罚单。而对于此次国内首个自动驾驶法规落地,百度立即发微博称“未来到来的速度比我们预期的快多了”。


2017年12月18日,北京交通委正式印发了《北京市关于加快推进自动驾驶车辆道路测试有关工作的指导意见(试行)》,作为中国第一个自动驾驶车管理规范,它正式给北京地区的自动驾驶路试做了规定。


DeepMind团队重磅发布AlphaGo Zero


2017年10月19日,DeepMind团队重磅发布AlphaGo Zero,再次震惊世人。相比之前的AlphaGo,该版本的AlphaGo Zero实现了在AI发展中非常有意义的一步——"无师自通"。技术解密在这里。12月7日,AlphaGo Zero再进化,通用算法AlphaZero诞生,除了围棋以外,攻克了更多棋类。技术解密在这里。


Google AI中国中心在北京成立,由李飞飞、李佳领导


2017年12月13日,在谷歌开发者大会上,谷歌Cloud人工智能和机器学习首席科学家李飞飞宣布,Google AI中国中心(Google AI China Center)于北京正式成立。该中心由李飞飞和Google Cloud研发负责人李佳博士共同领导。李飞飞将会负责中心的研究工作,并统筹Google Cloud AI,Google Brain以及中国本土团队的工作。


Google AI中国中心的研究重点是人工智能基础研究,并与中国人工智能学术界建立长期合作的紧密联系。李飞飞表示,Google AI中国中心致力于中国人工智能长期研发合作的第一步,同时也非常期待能在中国本土合作上有所建树,为更广大的学生及研究人员提供高质量AI及机器学习的教育支持。


小结


随着人工智能技术的迅速发展,互联网已进入新常态,人工智能将加快传统产业改造和颠覆。希望今天跟大家分享的关于人工智能领域在技术和产业应用方面的新进展对大家做学术研究有所帮助。AI还有很长的路要走,无论在技术研究,还是产业应用,只有不断地将新技术与产业结合,才能促进AI的成长,但是一切能够改变生活的科学技术都值得期待!


相关阅读