山东大学 - 《山东大学报》
机器战胜人类?
——谢耘谈大数据与人工智能
作者:柳光辰
谢耘,教授级高级工程师,首都科技领军人才,神州数码控股有限公司首席科学家,毕业于清华大学电子工程系,获学士、硕士、博士学位,澳大利亚悉尼大学访问学者,主要从事国防电子、消费电子、IT产品与IT软件集成服务等领域的研发,以及产品研发管理、技术管理、企业经营管理等工作,先后在联想集团、中国科学院、神州数码等企业和科研机构担任重要职务,成果获国家科技进步二等奖,并入选“科技北京”百名领军人才培养工程,近年来出版《转折——眺望IT巅峰》等著作。
最近,山东大学犹太教与跨宗教研究中心、哲学与社会发展学院邀请谢耘博士做客“天人讲堂”,讲解大数据与人工智能的本质、历史发展以及未来走向。结合信息技术的发展,谢耘认为,在社会商业化越来越重的影响下,大数据和人工智能已经被包装成了晦涩难懂的科技,但其实其内核很简单。
谁把大数据和人工智能“炒”热的?
现在,对于大数据和人工智能的讨论不绝于耳,到底是谁“炒”热的呢?大数据和人工智能技术能够受到人们的热捧,关键在于IT(information technology)技术的质的飞跃。
虽然,业界将大数据和人工智能技术的发展称之为技术革命,但在谢耘看来,在科技层面,大数据和人工智能尚未有重大突破。他认为,大数据和人工智能能够被人们追捧的原因,并不是在领域内有技术或是原理性的突破,而是基于IT产业在2009年到2011年间历史性的飞跃发展。对于IT产业来讲,最基础的核心技术是计算机的处理技术,而在2010年之后,由于集成电路技术的进步,计算机的处理能力在绝大数情况下已经不再是瓶颈,因此带动整个IT产业开始走向成熟。从美国制造出第一台运算速度为每秒1亿次的超级计算机克雷1号开始,到现在,智能手机运算速度已经达到每秒几十亿次甚至上百亿次,与当年第一台超级计算机相比,现在的智能手机已经快了几十倍,由此可见计算机的计算处理能力已经发生了天翻地覆的变化。随着计算机的处理能力不断提升,人们关注的焦点不在于发现新的技术、新的人工智能的原理,而转向探求如何将已经掌握的技术应用到解决各种实际问题上。谢耘认为,在2010年计算机快速的处理能力迎来了IT产业的黄金时期,也带动了大数据和人工智能的“热潮”。大数据是什么?
什么是“大数据”呢?谢耘认为,大数据并不是一个技术词。随着计算机的普及应用,人类能够获得越来越多的数据,同时,计算机能够处理越来越多的数据。因此有人预言,在未来社会里,计算机最重要的用途就是处理大量数据,并用这些人类曾经没办法获取的数据去解决更多的问题,由此诞生了“大数据”的概念。但对于“大数据”到底该怎样定义,有部分专家认为,只有满足5V,即数据容量大、数据种类多(包含文本、图像、音频等)、数据实时产生、数据真实性高、数据有足够的价值,才能有资格称为“大数据”,比如,洛杉矶警察跟加州大学合作利用数据预测犯罪、谷歌利用搜索关键词来预测感冒等。但是谢耘认为,“大数据”是个很宽泛很模糊的概念,其应用千差万别,它的本质就是利用能够获得的数据信息解决需要解决的问题,信息从生成、传输,到管理、应用,不同的环节需要不同的技术支撑,这些都可以称为“大数据”。
大数据技术的广泛应用,悄悄地改变了IT产业研究的发展进程。在2010年以前,计算机处理能力不足,并且也没有足够的数据,人们希望能够用一些简单巧妙的方法来解决问题。但到了今天,获取数据和计算能力已经不再是制约因素,人们可以直接选择用统计的方法解决问题。在大数据应用中,统计的方法主要用于两类问题的解决:一类是事物相关性分析,即不清楚两类事物是否有因果关系,但可以通过数据,推断两者是否相关;另一类是提取特征,即用特定的数学结构,在获取大量样本信息的情况下,把样本特征分析出来。“现在,大数据的应用越来越多在用统计的方法解决一些问题,换句话说,是用很多在传统的角度来看比较简单的方法来解决比较困难的问题。”谢耘说。人工智能又是什么?
人工智能(ArtificialIntelligence)是一批科学家在讨论计算机何时才能达到人类的智慧程度时提出来的概念。谢耘认为,现在我们在日常工作和生活中谈到的许多关于人工智能的概念和含义,其实与它刚刚产生时有着很大的不同。在当时,科学家们认为如图像识别、语音识别之类的技术并不属于人工智能的研究领域,他们的真正目标是解决如何制造一台和人拥有一样智能的机器。那时,科学家们对此目标很是乐观,但随着时间推移,各国大量科研实践发现人的智能并不能被复制。
从人工智能发展的历史角度来看,对于人工智能概念的界定,并非是一蹴而就,而是不断变化之中慢慢形成的。从1956年到20世纪70年代初,科学家们认为人的智能是由基本的推理能力构成的,只要把人的基本推理过程了解清楚,并且运用到特定机器之内,就能组合产生人类的所有智能,并由此研究制造出“推理机”。但是后来发现,通过基本的推理规则并不能把人类的智能复制。在70年代,有一批人发现一劳永逸的解决方法不可能实现,他们退而求其次,研究制造“专家系统”。“专家系统”的原理是将一些专业领域的知识进行总结,利用计算机逻辑分析推理能力极强的特征,将一些“专家知识”运用到机器当中,以此解决专业领域的问题。虽然“专家系统”类机器在一些特殊性的领域的确解决了很多问题,但依旧没有产生一般性的智能。2010年之后,大数据时代到来。在大数据时代里,计算机超快的计算能力,加上专家积累的各种专业领域的知识经验和大量的数据,三者融合就是今天的人工智能。
可以说,今天人工智能发展并不是发明了什么原理,也不是完全掌握了大脑的运行原理,而是我们有了更强大的处理能力和更多的有效数据。未来,机器能否战胜人类?“把人脑切掉一半会是什么样子呢?”谢耘说,“1.5毫米长的‘小虫子’,由320个神经元构成,所有的信号,所有的联结都能通过科学的方式检测出来,但是直到今天,科学家解释不清楚,这320个神经元是怎样掌控这个生命的。”人脑的底层有140亿个神经,上层部分活动可以通过机器模仿完成,但是人脑的中间部分还属于未知领域,因此机器的智能和人的智能之间依旧存在很大的差别。
谢耘强调,在可预见的未来,机器永远是辅助人的工具。他认为,造一台和人一样拥有智能的机器,可以有三个途径:第一,了解清楚人类大脑是怎样运行的,但是由于现在对大脑功能的描述还处于初级阶段,神经学家也没有了解清楚大脑是怎样运行的,因此,在现阶段不可能制造出一台与人一样会思考的机器;第二,实现同样的功能可以用和自然界不一样的机制来做,要做一台和人脑功能一样的机器可以不用复制人脑,只要发明出一套理论,并在理论上和实践上可以证明这个系统是和人是一样的即可,但是,直到现在,仍然没有人能提出这样一套理论,因此这条路也是走不通的;第三,将人外界的功能全实现了之后,整合在一起,但是,按照这个思路来进行,制造出来的将不再是人。由此可见,无论人工智能在某些领域多厉害,但是从根本上而言,这些都是由特定的编程决定的,真正厉害的还是人类。“计算机借助强大的计算能力把人赢了,在单向的具体问题上机器处理的比人强,这是人类历史发展的一个过程,但这不意味着机器比人聪明。”谢耘说。因此,在可预见的未来,机器人会超过人类仍是无稽之谈。系统创新,才是王道!
到目前为止,大数据和人工智能本质上并没有在原来的科学层面有所突破,只是在解决某类具体性问题上取得了巨大进步。在人工智能领域有所突破最重要的还是解决系统性问题,而不是靠某个单独的技术。谢耘说:“所有的技术只有融入到系统中去,才能发挥作用,才能真正成为一个对人有用的工具。”他强调,IT产业进入黄金时期并向未来发展,对整个人类社会的影响更多是在系统的层面上的创新,而这些创新的系统会把具体的技术融在一起,使他们最大限度地发挥价值。“未来最重要的是创新的系统设计,以及由此形成的各种各样新的系统,这是对人类社会影响最重大的。”谢耘说。
最后,通过反思文明在历史发展的各个阶段的演变,谢耘指出,当下所处于的信息文明阶段并不是某种工业文明的某个阶段,而是工业文明之后的一种更高的文明,并且从根本上改变了身处其中的人类的生活。 (柳光辰)