《纽约客》8月26日发表文章《人工智能的炒作和希望》,将AI分为三个阶段。第一个阶段是识别智能,在更加强大的计算机里运行的算法能从大量 文本中识别模式和获取主题,甚至能从几个句子获取整个文章的意义。第二个阶段是认知智能,机器已经超越模式识别,而且开始从数据中做出推论。第三个阶段的 实现要等到我们能创建像人类一样思考、行动的虚拟人类才行。作者认为,我们现在只处于第一阶段,“识别智能”。
Om Malik是一名科技作家,还是科技新闻网站GigaOm的创始人和创业基金TrueVentures的合伙人。
本月早些时候,约翰·奥利弗在HBO的脱口秀节目“Last Week Tonight”上,讽刺媒体公司疯狂追求点击率。这条视频在网上疯狂传播,在YouTube上已经有近六百万次观看。在节目进行到十分钟左右,奥利弗炮 轰Tronc(更名后的Tribune Publishing Company)和其宣传视频。视频中,一个女性机器人发言人在介绍人工智能给新闻界带来的好处。
Tronc不是唯一热情拥抱人工智能的公司。AI十分火热,每一家公司都在谈论它将如何改变一切。即便是梅西百货公司最近也宣布,它已经在旗下十家百货商店测试一个IBM的AI工具,目的是换回那些放弃传统零售店转而支持网上购物的客户。
就像之前的“云计算”、“大数据”和“机器学习”,“人工智能”这个词已经被市场营销人员和广告文案人员大肆使用。人们说的“人工智能”里面有很大一部分其 实是数据分析,还是原来的套路。如果这些过度炒作让你忍不住问“人工智能到底是什么?”别担心,你并不是一个人。我曾向许多专家询问这个词的定义,得到了 不同的答案。他们一致同意的只有一件事,那就是人工智能是一组试图模拟或增强人类智能的技术。对我来说,“增强”才是重点,智能软件可以帮助我们与这个日 益数字化的世界进行交互。
三十年前,我读报纸,用电动打字机打字,可以看的电视频道屈指可数。而在今天,我有来自Netflix、亚马 逊、HBO等的流媒体视频,有时候我都不知道怎么选择。我们越来越难以承受电子邮件、消息、约会和提醒的轰炸。增强智能使人类面对着越来越多的信息输入和 选择,数量多到一个人无法应付。
与其他技术相比,计算机和软件对于大多数人来说更难理解,充斥着神秘感。曾经有一段时间,你要用录音机把 一封信或者一篇文档记录下来,然后再由别人转写成文字给你。一个人在机器的帮助下将语音转换成文本。而在今天,你可以对着你的iPhone说话,它会自己 转录你的消息。如果五十年前的人们看到我们目前的语音转换成文本的功能,他们会觉得技术已经具有知觉。现在也是同样的情况,我们夸大了与世界交互的方式。 著名的作家和未来学家凯文·凯利说,“我们现在能做到的,在50年前是AI,在50年后就不会被称作AI。”
在以前没有互联网的时候,我 们要么打电话要么写信给朋友,一次联系一个人,来了解他们最近的生活。这是一个缓慢的过程,要花很多的精力和时间来了解每一个人。其结果是,我们的互动很 少,因为打长途电话费钱,写信也要时间成本。随着因特网的出现,电子邮件成为一种促进和加快这些互动的方式。而Facebook在这方面做的更好,它把你 的电话簿变成了一个中枢,让你能同时与数百、甚至数千名朋友同时联系。该算法使我们能轻松维持更多的关系而几乎无需成本。
Michelle Zhou花了15年的时间在IBM研究院和IBM Watson团队工作,之后离开IBM成为情绪分析初创企业Juji的联合创始人。情绪分析是人工智能和人机交互的一个交叉领域,Zhou作为该领域的专 家,将AI分为三个阶段。第一个阶段是识别智能,在更加强大的计算机里运行的算法能从大量文本中识别模式和获取主题,甚至能从几个句子获取整个文章的意 义。第二个阶段是认知智能,机器已经超越模式识别,而且开始从数据中做出推论。第三个阶段的实现要等到我们能创建像人类一样思考、行动的虚拟人类才行。
我们离创建虚拟人类还有很长的路要走。尽管媒体吹得天花乱坠,但是没有任何一个技术是完美的,AI最有价值的功能在于增强人类智能。要达到这一点,我们需要 训练计算机来模仿人类。 2016年4月,彭博商业周刊的一篇报道就提供了一个很好的例子。它描述了提供自动化AI个人助理的公司聘请人类“教员”来检查和评估AI助理的表现。 “我们用复制人类智能的能力来定义人工智能,这很讽刺,”Sean Gourley说,他是数据分析公司Primer的创始人,善于在算法的帮助下从大型数据集挖掘智能。
无论是Spotify、 Netflix或者是新一代AI聊天机器人,所有这些工具都依赖于人类自身提供数据。当我们在听歌时,把歌曲加入播放列表并分享给别人,我们就在向 Spotify释放重要的信号。这些信息能训练其算法,使它不仅能发现我们喜欢什么,还能预测我们的喜好。
甚至是我们经常谈论的“计算机 视觉”,它之所以有效,是因为人类上传了数十亿的照片,并且用元数据标记这些照片,给予这些照片情境。日益强大的计算机可以通过扫描这些照片从中找出模式 和意义。同样地,谷歌利用它多年收集的数十亿语音样本建立了一个智能系统,能理解各种口音和细微差别,这使得谷歌的语音搜索功能成为可能。
将Zhou的三个阶段作为衡量标准,我们目前还在“识别智能”阶段——今天的计算机使用深度学习来更快更好地发现模式。然而,一些公司正在研究能用于推断意 义的技术,这将是我们要走的下一步。“我们是否会到达第三阶段,这不重要,”Zhou在给我的电子邮件中这样说。“我仍然热衷于人机共生,那时,计算机可 以做它们能做到的最好的事(即要求一致性、客观性和精确度的事),人类做人类能做到最好的事(有创意,不精确但适应性强)。”
未来几十年里,人类将继续训练计算机来模仿我们。而在此期间,我们将不得不面对AI的各种泡沫。
本文转自:新浪科技网
VR Candy
大家好,这是VR CANDY的公众号,请多多关注和支持。我们会定期发布VR、AR、CG和后期制作相关的有趣信息和作品与大家分享。