2016CCAI：“人工智能驱动的人机交互论坛”嘉宾发言

• 26日下午13:40云知声创始人&CEO黄伟表示，今年，Alpha go掀起了对人工智能的关注，而人机交互是人工智能的基础。人机交互目前发展的趋势是从感知智能向认知智能发展。感知智能就是利用技术手段把物理信号转化成数字信号，从而进行分析和处理。目前，感知还处在发展阶段，依然有很多路要走。而多人机交互方式目前有很多种，比如，手势识别，图像识别，体感交互等，都是未来人机交互发展的方向，但因为语音才是最自然的交互方式。所以在物联网时代，语音识别仍然是最重要的人机交互手段，而语音识别的核心技术，是基于语用技术的人机交互框架，以语境为基础的框架，直至自然语言生成。但任何产业都需要商业模式，而云知声通过云端芯的方式，打造软硬件一体化的方案，发力在智能家居领域，并在向其他如车载、医疗、教育领域倾斜。云知声希望通过人工智能各业界大家的共同努力，打造更好的、更智能化的生活，智享未来。

• 13:50微软亚洲研究院首席研究员周明就对话机器人（Bots）的关键技术展开。周明是微软小冰的核心技术研发者。他针对闲聊、信息问答、任务完成三个层面的需求进行介绍。需要解决多轮对话一致性、个性化闲聊等问题。可以通过搜索引擎分析、社交图片/Imagenet图片的理解来做。而从应用层面来说，利用对话机器人技术，可以研发机器人导购、机器人大脑、客户服务等应用。可定制的机器人大脑，可以通过相同的技术模型结合不同的数据训练来做。需要建立不同的知识库。目前而言，多轮动作的知识库还是很大的挑战。

• 14:00地平线机器人技术创始人兼CEO余凯表示，现在流行的互联网的本质是连接人和世界，而现在，信息，商品，服务都会和人联接，而任何世界的连接目前都是通过机器即计算机实现的，而人和机器是通过交互来实现，机器是通过索引来认识和分析这个世界，因此，交互和索引是互联网的核心。而目前人机交互趋势是从无序到有序，从数据到语义，从线下到线上，而机器将变成Robot，并无处不在，而Robot的大脑将会得到更迅速的发展。

• 14:20百度深度学习实验室主任林元庆表示，IDL希望将人工智能核心技术能做到统治级别，通过深度学习技术，不仅要做好图像识别基本技术（图像搜索、OCR、人脸识别），还要实现细粒度图像识别（如菜品识别）、视频分析、AR、医学图像分析等方面的突破。他认为，很多关键技术的决战期将是接下来的1-3年。

• 14:40旷视科技首席科学家孙剑表示，视觉智能是人工智能的一个重要分支，旷视科技就是一个通过深度学习来做视觉智能的公司，目前，人工智能的发展正在从感知智能向认知智能发展，而视觉是感知智能的一个重要方面，而作为一家专门从事视觉智能的公司，旷视科技的核心技术是深度学习平台MegBrain，而视觉理解核心问题是深度神经网络，神经网络模型目前已经从AlexNet发展到152层的ResNet，图像分类进展、人脸识别的进展、人脸识别的实际应用已经超越人眼，而无监督对抗学习和语义分割将是视觉智能未来发展的关键。

• 14:50商汤科技CEO徐立深度学习学的是对于认知的表达，是一种生产工具的提升，比如可以代替人工做图像处理。他分享了商汤科技的一个案例：对抗活体检测的攻击，比如用一些3D的模式把照片抠两个眼睛，用一张卡片挡住眼睛，家装自己做一些动作的模式，研究员会写出一些模型，把这些攻击挡在外面，不断用更深奥的算法生成不同的模型去挡住下一波攻击，类似对抗学习模型，两者互相较量迭代过程中，攻击变的越来越真实。

• 15:00“人工智能驱动的人机交互论坛”进入讨论环节。

获取

Related Posts

大数据 | 什么最影响孩子的学习成绩？

Discuz!源码分析与插件开发实例进阶(高清版)PDF扫描版 PDF 免费下载

《建筑材料（第二版）（普通高等教育“十二五”规划教材）》pdf电子书

发表回复