• 26日下午13:40云知声创始人&CEO黄伟表示,今年,Alpha go掀起了对人工智能的关注,而人机交互是人工智能的基础。人机交互目前发展的趋势是从感知智能向认知智能发展。感知智能就是利用技术手段把物理信号转化成数字信号,从而进行分析和处理。目前,感知还处在发展阶段,依然有很多路要走。而多人机交互方式目前有很多种,比如,手势识别,图像识别,体感交互等,都是未来人机交互发展的方向,但因为语音才是最自然的交互方式。所以在物联网时代,语音识别仍然是最重要的人机交互手段,而语音识别的核心技术,是基于语用技术的人机交互框架,以语境为基础的框架,直至自然语言生成。但任何产业都需要商业模式,而云知声通过云端芯的方式,打造软硬件一体化的方案,发力在智能家居领域,并在向其他如车载、医疗、教育领域倾斜。云知声希望通过人工智能各业界大家的共同努力,打造更好的、更智能化的生活,智享未来。
• 13:50微软亚洲研究院首席研究员周明就对话机器人(Bots)的关键技术展开。周明是微软小冰的核心技术研发者。他针对闲聊、信息问答、任务完成三个层面的需求进行介绍。需要解决多轮对话一致性、个性化闲聊等问题。可以通过搜索引擎分析、社交图片/Imagenet图片的理解来做。而从应用层面来说,利用对话机器人技术,可以研发机器人导购、机器人大脑、客户服务等应用。可定制的机器人大脑,可以通过相同的技术模型结合不同的数据训练来做。需要建立不同的知识库。目前而言,多轮动作的知识库还是很大的挑战。
• 14:00地平线机器人技术创始人兼CEO余凯表示,现在流行的互联网的本质是连接人和世界,而现在,信息,商品,服务都会和人联接,而任何世界的连接目前都是通过机器即计算机实现的,而人和机器是通过交互来实现,机器是通过索引来认识和分析这个世界,因此,交互和索引是互联网的核心。而目前人机交互趋势是从无序到有序,从数据到语义,从线下到线上,而机器将变成Robot,并无处不在,而Robot的大脑将会得到更迅速的发展。
• 14:20百度深度学习实验室主任林元庆表示,IDL希望将人工智能核心技术能做到统治级别,通过深度学习技术,不仅要做好图像识别基本技术(图像搜索、OCR、人脸识别),还要实现细粒度图像识别(如菜品识别)、视频分析、AR、医学图像分析等方面的突破。他认为,很多关键技术的决战期将是接下来的1-3年。
• 14:40旷视科技首席科学家孙剑表示,视觉智能是人工智能的一个重要分支,旷视科技就是一个通过深度学习来做视觉智能的公司,目前,人工智能的发展正在从感知智能向认知智能发展,而视觉是感知智能的一个重要方面,而作为一家专门从事视觉智能的公司,旷视科技的核心技术是深度学习平台MegBrain,而视觉理解核心问题是深度神经网络,神经网络模型目前已经从AlexNet发展到152层的ResNet,图像分类进展、人脸识别的进展、人脸识别的实际应用已经超越人眼,而无监督对抗学习和语义分割将是视觉智能未来发展的关键。
• 14:50商汤科技CEO徐立深度学习学的是对于认知的表达,是一种生产工具的提升,比如可以代替人工做图像处理。他分享了商汤科技的一个案例:对抗活体检测的攻击,比如用一些3D的模式把照片抠两个眼睛,用一张卡片挡住眼睛,家装自己做一些动作的模式,研究员会写出一些模型,把这些攻击挡在外面,不断用更深奥的算法生成不同的模型去挡住下一波攻击,类似对抗学习模型,两者互相较量迭代过程中,攻击变的越来越真实。
• 15:00“人工智能驱动的人机交互论坛”进入讨论环节。