AI独立难行,或许可以这样试试

AI独立难行,或许可以这样试试

今天我从人工智能的角度跟大家分享一下关于人工智能和大数据的一些信息。

这是Gartner的数据,图上有两条线,蓝线是一般的技术发展曲线,红色是人工智能技术发展曲线,实际上人工智能就是这样一个跌宕起伏的学科,现在其实到了第三次高峰这个地方。人工智能跟太多的东西相关,不能独立先行。

在这次高峰中大数据的功劳我想大家都是知道的,它其实为机器学习提供了粮食,为分析决策提供了依据。到2012年人工智能开始被很多人接受和学习了,也得到了很广的应用,在语音、视觉等等领域得到了充分的肯定。再到了去年,一系列平台都发布了,这个时候深度学习的模型和算法就更加普及,在更多的地方开花结果。

1、大数据+人工智能落地案例

第一个是图象处理,即数据+决策算法。这是今年2017年的国际竞赛我们的参赛作品,是一个胸片,可以认为是CT的或者核磁共振的,实现了80%的精度。凭借它,我们的团队拿到了第一名。

接下来是机器翻译概念图,它是双语语料+深度学习的应用,是文字应用中唯一的通用算法。它用大量的双语语料训练一个模型,然后得到了一个大模型,效果就是这张图,最靠右边是人的结果,剩下是模型的结果,可以看到准确率是相当高的。

第三个是媒体大数据+自然语言处理。我们社交媒体的数据其实是非常多的,社交媒体数据改变了我们所有人。这是一个典型的案例,它把社交媒体上关于演员“马丽”的评价进行抓取,然后经过各种各样的计算给出评价,这就是人工智能和自然语言处理合作的表现。

2、人工智能如何落地?关键是场景、产品和技术

人工智能落地应用最重要的是场景、产品和技术。其实场景是关键,比如说海云刚才发布的公安这个场景,在这个场景下我们怎么发挥技术的特长。产品是导向,即便是同一个公安的,可能还需要不同的能力,比如说摄像头的人脸分析。最后是技术的支撑,你要了解哪些技术有哪些支撑,在哪些场景下发挥最大的能力,这样才能把人工智能更好地落地融入产品,使我们的产品带有智能的元素。

3、大数据需要被凝练成知识

现在信息量如此之大,但其实我们有很多找不到有用知识的情况。有一本书里说“只有20%的数据是干净的,80%的数据都是不干净的”。而在这个信息里面最有价值、最有意义的其实只有1%,我们称它叫做知识。

我们说大数据科学、大数据技术、挖掘分析等等,其实数据是什么?它应该凝练到知识。如果不能很好地把它凝练、总结、归纳就不能再利用,也不能保证系统的可靠性、可迁移性、可扩展性。如果你做的东西不精炼,再迁移的时候就要重来,不能把有效的同等的东西都迁移过去就要重来,这就有效率的问题,还有不能保证人机协同。

4、人工智能目前仍处在人机协同阶段

我们现在讲的人工智能它是一个理想状态的人工智能,像电影一样的。但是现今我们至少在学术界有一个很好的共识,我们现在其实是人机协同的阶段,我们不是让机器代替人,而是让机器协助我们。

当前人机交互的实质,实际上是人把脑子搬过去了,从嘴巴到耳朵,从耳朵又出来,其实这就是典型的数据喂出来的结果。

这样条件下产生的模型可不可以用呢?可以用,在某些场合、某些场景下是可以用的,而且可能比较好用。但是,如果让它在所有的地方,或者大部分地方都用,那么我们需要这样的系统:经过知识加工再反馈给你,这就是为什么要经过知识加工以后才能够做到真正的人工智能,这个的提升空间还很大。

但是我们希望有一个这样的交互平台,我们叫做知识平台,或者是刚才说的AI学习平台,甚至可以说是企业大脑。知识生产平台化,知识表示模块化,知识管理可视化,知识更新自动化。只有在这样的一种情况下,我们才能更好地运用知识管理信息。

5、关键点:数据可视分析

如果处理数据,首先我们可以用数据挖掘找出有用的东西。然后数据分析,把挖掘出的数据分析出价值。这里面可视分析起到一个输出价值的作用,因为做不好可视分析的话,大部分人不知道你干了什么,也不知道你干的这件事我能用来干什么。可视分析是人机交互非常重要的方式。比如说刚才的语义查询可以很快地带着用户进入场景、进入角色,可以很快地和系统进行交互,得到我们想要的东西。

AI独立难行,或许可以这样试试

今天我从人工智能的角度跟大家分享一下关于人工智能和大数据的一些信息。

这是Gartner的数据,图上有两条线,蓝线是一般的技术发展曲线,红色是人工智能技术发展曲线,实际上人工智能就是这样一个跌宕起伏的学科,现在其实到了第三次高峰这个地方。人工智能跟太多的东西相关,不能独立先行。

在这次高峰中大数据的功劳我想大家都是知道的,它其实为机器学习提供了粮食,为分析决策提供了依据。到2012年人工智能开始被很多人接受和学习了,也得到了很广的应用,在语音、视觉等等领域得到了充分的肯定。再到了去年,一系列平台都发布了,这个时候深度学习的模型和算法就更加普及,在更多的地方开花结果。

1、大数据+人工智能落地案例

第一个是图象处理,即数据+决策算法。这是今年2017年的国际竞赛我们的参赛作品,是一个胸片,可以认为是CT的或者核磁共振的,实现了80%的精度。凭借它,我们的团队拿到了第一名。

接下来是机器翻译概念图,它是双语语料+深度学习的应用,是文字应用中唯一的通用算法。它用大量的双语语料训练一个模型,然后得到了一个大模型,效果就是这张图,最靠右边是人的结果,剩下是模型的结果,可以看到准确率是相当高的。

第三个是媒体大数据+自然语言处理。我们社交媒体的数据其实是非常多的,社交媒体数据改变了我们所有人。这是一个典型的案例,它把社交媒体上关于演员“马丽”的评价进行抓取,然后经过各种各样的计算给出评价,这就是人工智能和自然语言处理合作的表现。

2、人工智能如何落地?关键是场景、产品和技术

人工智能落地应用最重要的是场景、产品和技术。其实场景是关键,比如说海云刚才发布的公安这个场景,在这个场景下我们怎么发挥技术的特长。产品是导向,即便是同一个公安的,可能还需要不同的能力,比如说摄像头的人脸分析。最后是技术的支撑,你要了解哪些技术有哪些支撑,在哪些场景下发挥最大的能力,这样才能把人工智能更好地落地融入产品,使我们的产品带有智能的元素。

3、大数据需要被凝练成知识

现在信息量如此之大,但其实我们有很多找不到有用知识的情况。有一本书里说“只有20%的数据是干净的,80%的数据都是不干净的”。而在这个信息里面最有价值、最有意义的其实只有1%,我们称它叫做知识。

我们说大数据科学、大数据技术、挖掘分析等等,其实数据是什么?它应该凝练到知识。如果不能很好地把它凝练、总结、归纳就不能再利用,也不能保证系统的可靠性、可迁移性、可扩展性。如果你做的东西不精炼,再迁移的时候就要重来,不能把有效的同等的东西都迁移过去就要重来,这就有效率的问题,还有不能保证人机协同。

4、人工智能目前仍处在人机协同阶段

我们现在讲的人工智能它是一个理想状态的人工智能,像电影一样的。但是现今我们至少在学术界有一个很好的共识,我们现在其实是人机协同的阶段,我们不是让机器代替人,而是让机器协助我们。

当前人机交互的实质,实际上是人把脑子搬过去了,从嘴巴到耳朵,从耳朵又出来,其实这就是典型的数据喂出来的结果。

这样条件下产生的模型可不可以用呢?可以用,在某些场合、某些场景下是可以用的,而且可能比较好用。但是,如果让它在所有的地方,或者大部分地方都用,那么我们需要这样的系统:经过知识加工再反馈给你,这就是为什么要经过知识加工以后才能够做到真正的人工智能,这个的提升空间还很大。

但是我们希望有一个这样的交互平台,我们叫做知识平台,或者是刚才说的AI学习平台,甚至可以说是企业大脑。知识生产平台化,知识表示模块化,知识管理可视化,知识更新自动化。只有在这样的一种情况下,我们才能更好地运用知识管理信息。

5、关键点:数据可视分析

如果处理数据,首先我们可以用数据挖掘找出有用的东西。然后数据分析,把挖掘出的数据分析出价值。这里面可视分析起到一个输出价值的作用,因为做不好可视分析的话,大部分人不知道你干了什么,也不知道你干的这件事我能用来干什么。可视分析是人机交互非常重要的方式。比如说刚才的语义查询可以很快地带着用户进入场景、进入角色,可以很快地和系统进行交互,得到我们想要的东西。



    标签: