【洞见】大数据时代的个性化学习

【分享预告】教育产业投资人俱乐部(I-edu club)邀请乂学教育王枫博士今晚8点为大家带来《大数据时代的个性化学习》主题分享。主题分享一个小时,互动交流半小时。

[摘要]
随着人工智能,大数据,云计算等最新技术在教育中的应用,个性化学习已经开始逐步地走入教育的主流。通过有效地采集、分析、维护、和应用海量的学习数据,代表着国内最高端水平的X+智能自适应学习系统就已经可以做到实时精确测评每一位学生的能力,推荐最佳的学习路径,动态匹配最合适的学习内容,并提供多维度的学习数据分析报告。在技术的推动下,个性化学习成为每一位孩子的基本权利, 让教育本身发生不可逆转的质变,给教育产业带来加速发展的契机。

[主讲人介绍]
王枫博士(Jeff Wang, Ph.D.)
乂学教育(classba.com)创始人。美国佐治亚大学教育技术学博士,宾夕法尼亚大学、弗吉尼亚大学博士后。在线教育、自适应学习,教育大数据领域资深专家。在美12余年间,创建了在线教育模式的学位与认证专业 ;领导开发了属于美国教育部国家项目的科学教材,并获得美国教育传播与技术协会最佳实践奖;担任了国际权威期刊《教育技术研究与发展》咨询编辑,国际期刊《教育技术研究杂志》编委 ,以及美国教育部官方指定的大学认证委员会远程教育评委。


谢谢张总邀请我来教育产业投资人俱乐部和大家一起分享,今天我跟大家一起讲的是大数据时代的个性化学习。我稍微自己简单介绍一下,前面张总发的那个分享介绍有我一点个人资料,我是一直做在线教育的,从零二年开始,我去美国读的是教育技术学的博士,然后从零六年开始,做了美国教育部的两个教育研究项目,在宾夕法尼亚大学、弗吉尼亚大学,从11年开始我给美国的两所大学创办了他们的网络学院。今年年初我回国后,和我们的合伙人李总、周总一起创办了上海医学教育。

我现在这有一张图,我想先给大家介绍一下,这张图是法国人1900画的,2000年的世界是什么样子,这张图大家看一下,当时00年的法国人想象人们2000年的时候会坐着飞机出行,警察在空中执法带着翅膀还可以罚款,高科技。

这张图画的是当时每个家庭主妇的梦想,有一个机器只要抖一抖链条,这个机器就会帮你把地扫了,把地板拖了。

这张图我就发现比较雷人,我取了一个名字叫在线教育Beta1.0,从这张图上看右边有一个像粉碎机一样的机子,把书本放进机子粉碎,通过某种电流的形式就到了学生的大脑里,这应该是现代芯片植入设想的先驱。

当然我们知道教育本身是一门科学,刚才的设想在教育技术历史上已经多次出现,著名的发明家托马斯爱迪生在1914年就已经预见,教育电影在未来十年之内将取代所有教师,未来的孩子只需要去电影院看教师的教学。但事实上,像目前在线教育这样的热潮,从当年爱迪生的教育电影的设想就从来没有断过,我们现在要讲的就是教育本身的科学和他本身的规律。

这本书是去年在美国发行的一本书,书里面讲的就是其实是学习的基本科学,不是全新的原创性研究,但是这本书做了一个很好的收集,就是吧很多经过大量实验研究证明有效的学习原理进行了总结,而且已可读性很强的形式讲了出来。

我在书里摘取了几条,第一条就是“努力”的学习更深入和持久。大家想象,如果你学习的时候不费吹灰之力,你感觉学的时候很轻松自己很厉害,但事实上,你没有学到新的东西。学习一定是需要努力的,而且是真正去努力,让你的大脑发生变化,你学习的知识才能进入你的大脑进行残留。

接下来这句话是:考试是一个工具,让你找到自己的不足,从而更好地掌握知识。这句话里考试我们都能理解的,但下一句我们来看看。

而事实上我们说考试的作用的话,从教育本身来说,考试已经在很多年已经被用于一个遴选的方式,那就是让我们让选拔各种各样的人才。

考试的重要性同时也催生了一个重要的产业,那就是教育培训行业。

我在想用一张图来概括中小学培训的主要模式,中小学培训模式的话,我们看中间的这几个黄色的方块,无外乎就是课程、系统、辅导、社区。

另外的话还有大量的第三方应用和单点工具也可以整合到学习平台里。


从辅导的主要模式来说无外乎是一对一或者是大班小班,辅导老师可以是名师也可以是普通老师,或者是草根老师,也可以是刚刚毕业的大学生。


老师作用的话,测评、规划学习、辅导答疑,学习有问题介入学生的学习,这一切都可以通过导师的平台来实现。

解决这个问题的核心方法就是要解决学生在线学习过程中所存在的孤独感。


社会的模式的话,在美国,去年在美国上市tuyou公司,他们就能够把在线教育的辍学率做得比线下还低,里面最关键的就是通过社区,让学生感觉到在线学习的时候,他有一群志同道合的老师和同学一起关注他的学习。


我们看中间的话就是,我们在线教育一切事宜就是学生为中心,当然中小学培训有一个特点就是:服务的是学生但是买单的是家长。


家长可以参与到学生所有的学习辅导中,无论是跟学生直接交互还是跟老师直接交流,或者是通过社区,都可以直接介入到学生的学习中。


左边的绿颜色的框的是运营模式,比如运作一个培训学校,无外乎是直营、加盟、微型点的形式,中心的标准可以是豪华标准或者精简,这一切可以通过标准化的体系来做到质量的控制,确保教学质量。


传播的模式这一个框我要重点讲一下,我前面所有的中间的那个课程、系统、辅导和社区的时候,并没有特意强调线上和线下,因为线上和线下只是传播模式的不同。


我们经常听到直播与录播的谁好谁差的争论,其实这个争论本身就是伪命题,其中的差别只是实时和非实时的差别,各有优劣。直播就是实时,录播就是非实时,像我们今天现在所做的微信的路演,我们做的就是非实时。


无论是任何一种教育,其实最核心的就是是不是可交互。我们说传统教育尤其是现在最新出来的慕课,其实交互性都是比较有限的。


一个老师对20个学生,给每个学生的关注度确实非常有限,慕课一个老师有1千个学生1万个学生,是不可能为了一个学生单独提供指导与学生交互。


所以回到这个核心的话,技术如果说是真正的要对教育产生根本性的改变,就一定要从交互着手,而技术上面从对学生学习的交互能够做到重要的改变,是一个非常前沿却行之有效的方法,下面我要重点讲。

这张图的话我想表达的就是我想用一张图来概括整个中学培训的所有的主要的模式,那接下来的话我想讲一讲传统模式所面临的挑战。

在坐的都是投资教育产业的投资人,相信大家都很清楚,传统培训行业的话首先就是成本不断上涨,包括:人力成本、房租成本、营销费用等等。

优秀的老师永远是稀缺的,有老师的话还要招聘、培训、管理,另外真正的名师是不可以复制的。

我们一直说个性化学习,但是个性化学习在传统培训中,其实和成本控制有内在的矛盾,一对一的话大家都想做,但是成本却非常高昂,学大、昂立、一个小时300500,而且对于培训机构来说这还不挣钱。


对传统的培训机构来说,在线教育带来了前所未有的挑战,同时很多传统培训机构也想知道,怎么能从这个在线教育投资的热潮中,能够找到自己的机会。

那我们来说一下在线教育

在线教育本身的话也不是没有挑战,首先就是:完成率极低,对很多自控能力比较弱或者自我学习能力比较差的学生都是不合适的,我们可以想象一下,绝大部分中小学生,其实都不太适合完全的在线教育。



另外的话,在线教育本身的市场成本也不低,很多有非常大的流量,几千万的用户,但是也很能实现收入的变现。

因为网络变现的主要模式比如:游戏和广告,都不适合教育。


另外我们看到的是,目前不管在线教育这个热潮有多火,没有一家公司真正敢说,在线教育的学习效果和口碑上超越了线下的培训机构。


那传统的教育公司来怎么应对,一般通过最大化现有的资源和本身的人力优势,充分整合在线教育到现有的教学模式中去,这里面有几块比较核心的,第一是在线课程,不管是视频课、文字课,还是把两者整合,还有就是在线教育的脊梁骨就是学习系统,还有可以开发各种移动端的APP,或者改进自己的教学模式,把在线教育的模式加入进去。



其实传统的学习系统有很多,任何教育机构想采购,市场上有很多,这个市场并不小,13年的时候19~26亿美元,18年将增长到78亿美元。


另外包括国外现有出现了很多学习系统,应该说是新鲜的传统学习系统,因为在本质上并没有改变,比如谷歌这两年推出的GoogleClassroomEdmodo是专门针对中小学的传统学习系统。


传统的学习系统,其实可以满足最基础的在线学习的需要,比如说老师把学习内容上传到系统里面去,学生也可以在里面看视频、做测试,或者说在讨论区跟同学交流。


但是这一类的系统,最大的局限性就是限制性的学习,就像我们以前看录像带,你可以前进或者后退,但基本上还是按照这个带子的顺序来学习。这样的话就有一些比较致命的问题,系统并不知道你的学生哪些会哪些不会,也不能精准的定位哪些知识掌握的好,哪些知识掌握的不好。这样的话,学生即使掌握了这个知识点,还是要一步步的学,浪费了大量的时间和精力,而且学生的这个测评,上一步学习和下一步学习并没有直接的关连。学生虽然可以自己选择去学习什么内容,但是系统无法自动匹配下一步该学习的,但对于绝大部分成绩中等或中等偏下学生,这种学习方式是完全不适合的。另外,还有很多系统虽然提供教学的内容和数量,但是质量却是参差不齐的。


现在我想介绍的就是我们公司正在内测,准备月底即将上线的:X+智能自适应学习系统。


我们的系统很大程度上已经解决了,刚才我所说的传统学习系统的主要问题。首先就是能够进行实时的精确的测评学生的能力,实时的话就是系统在学生学习过程中,不断的测试学生,在每一个知识点的能力水平。而且知识点的颗粒度不能太粗,我们把知识点拆分成纳米级,已经细的不能在划分。然后我们根据学生在每一个知识点的能力水平去推荐最适合的学习路径。


同时来匹配最适合学生学习的内容,下面我要举一个例子:


我们以老师为例,比如初中的数学,一个学生学一元一次方程,做了十道题对了六个,然后系统让他去做一元二次方程。做一元二次方程的时候,他做十道题错了八个。一个很差的老师会说,你继续再做,再给你十道一元二次的方程。一位一般的老师会说,你再做十道一元二次方程的题目,但这次你做的难度稍微小一点,比如里面的运算量没有那么大数字没那么大。一位好的老师会说,你先等一下,你先别做一元二次方程,我看你一元一次方程做十道题错了四道题,,另外你做求根,你做十个只对了两根,你现在需要倒回去做一元一次方程和求根都学会。


一个好的系统,就像一个好的老师一样,会给学生匹配最适合学习的学习内容,比如说刚才的一元二方程没做好,系统会根据知识图谱,让学生继续做一元一次方程或者去做求根的题目。


最后的话,就是一个好的学习系统的话,会提供全维度的学习数据的分析报告。

比如说右边的图,把学生的听力和阅读的成绩进行了归类分析,里面颜色相同的点代表学生在这两个维度的成绩相似,可以进行分组学习。


我们可以想象一下对很多老师来说,平时给学生进行分组都是拍脑门做决定凭感觉,但是我们有大量的学习数据进行分析,对教学本身也是极大的帮助。

这张图的话,是我们三名中学生的学习路径对比,背景就是初中英语的知识图谱。


红颜色的路径代表学生使用传统的学习系统,学习路径呈现零散的状态,学习效率最低。

蓝颜色的话是使用初级基本的自适应学习系统,通过预先设定的基本规则来规划学习路径,效率会相对高一些。

黄颜色的话是使用我们的“X+智能自适应学习系统,通过系统实时精准测评,定位知识薄弱点,规划学习路径,让学习效率最大化。


开发这样的系统的话其实需要非常资深的研发团队,尤其是需要大量的数据科学家。

我们现在的研发团队、数据科学团队,主要是在国内、美国以及欧洲。

上一页列出来的是我们研发团队的几位核心人员,其中我们在哥伦比亚大学和哥伦比亚大学的Ryan Baker教授,他是美国知名的资深自适应学习专家,我们在筹建我们的乂学教育自适应学习研究室。

Zachary APardos教授是加州伯克利大学的做自适应学习和教育数据化的专业,现在是我们的权威专家也是我们顾问委员会的委员。

我们数据科学团队的负责人是马镇筠博士,是弗吉尼亚大学统计系的博士,长期从事自适应学习的研究。

我们系统从九月份开始在郑州的培训学校开始小范围内测。这张图的话是我们系统在郑州测试的一些图,学生用普通平板电脑然后使用系统,另外因为这个培训学校的话,网络环境其实并不稳定,所以我们还提供了网络环境的解决方案。右边的图的话铁柜子是50ipad,上面就是服务器还有局域网无线发射器。

我们说了这么长时间了,自适应学习到底是什么呢?


相信大家可能都已经比较清楚了自适应学习,其实就是通过技术手段,检测学生当前的学习水平和状态,从而不断的可以调整学生的学习过程和学习路径。这里面涉及到的就是数据科学、教育测量学、标签技术、机器学习等最新技术。

一个自适应学习系统不管有多复杂,至少要包含以下基本的三大构件。


第一就是内容模型,系统并不知道学生要学习什么,所以得告诉系统作出知识图谱,放到系统里面去。学生模型的话就是实时的不断的测评,学生在每一个知识点的水平。然后根据学生在每一个知识点的能力水平匹配,并找出最适合学生下一步学习的内容,这就是教学模型。这里面最复杂的,其实就是学生模型,因为每一个学生都不一样,知识点又非常多,要实时检测每一个学生在每一个知识点的能力水平,是一个非常复杂的过程。这是自适应学习和自适应测评一个最大的不同。


测评系统,比如说G21托福这种机考系统,其实都是有自适应的功能在里面。

但这样的测评系统的话,他们其实在定位学生在当时水平,比如说G21是在定位你在语法、词汇处于550650还是720的水平。

而自适应学习的话是不断的在测评,做完每一个题目或者每一组题目的水平,然后不断的在跟学生匹配最适合学习的内容,其实相当于无数自适应测评的组合。


我们把自适应学习系统,稍微做一下基本分类,比如说:粗放型和精细型。

粗放式学习系统的话,其实就是设置一些节点,比如说传统培训的话,学生去的时候给你测评到底是上七年级A班还是B班,还是回到六年级去上培训


如果做的更精细的话,可以在每一个单元,每一个知识点给学生测评,然后学生如果掌握了就可以跳,没有掌握就继续学习。


如果我们把这个节点做得更细,规则做得更复杂的化,比如说学生不但可以往前跳,而且还可以往回跳,这样的系统可以做的越来越精细,越来越复杂。



其实我们知道规则可以预先设定,但是规则必定是有限的,但是每个学生的学习状态和水平却是无穷的。


比如说我们前面所讲的一元一次方程和一元二次方程,学生学完了一元二次方程之后没有掌握,A学生你可以让他跳回一元一次方程,那b学生呢,你是让他跳回一元一次方程还是求根,那c学生呢,他可能连以前最基本的方程的移位都没有掌握。所以更高级的系统的话,就是要充分利用计算机的运算能力,通过算法来实现动态为学生匹配下一步该学什么。这就像以前我们所听说的IBM的深蓝能够下赢国际象棋大师,并不是说深蓝比国际象棋大师更聪明,而是说深蓝充分的利用了计算机的能力,把存在它系统里面的大量棋谱来不断的分析。


根据每一步下的棋,来分析下一步下的棋该怎么走。


算法里面最常见的算法叫IRT算法。


IRT算法的话,就在前面我们所说的G21和托福,自适应测评运用的比较广泛。

简单来说,就是给你一个难度为5的题目,如果你做错了,就给你一个难度为4的题目,如果还做错了,再给你一个难度为3的,如果你做对了,可能要给你匹配一下难度为4的题目。


其他还有一些常见的算法,比如说贝叶斯算法等,我就不在这里详细说了。

那现在的问题是,自适应学习,到底有没有效果?


国内其实没有这样的数据,国内的自适应学习还处于启蒙状态。在美国的话,这项数据已经非常成熟了,大量的研究已经证明了自适应学习是非常有效的。卡内基梅隆大学其实在九十年代就已经开发出来了这项技术的前驱,叫智能辅导系统。这个系统已经被几百万学生用事实证明是非常有效的。OxmanWong的这个2014年的研究报告推断,在美国很快就会迎接拐点,会被广泛的应用于日常学习。

拐点就是以后学生去培训学校,他不会去问有没有自适应学习系统,而是如果你连自适应学习系统都没有,他会觉得你水平很低。

各位都是投资人,可能对这个表比较关注,这些都是自适应学习相关的,投资界的一些大事。


正如前面所讲的,九十年代卡内基梅隆就已经把这个叫Cognitive Tutor就已经做出来了,而加州大学和纽约大学合作的and ALEKS也已经做出来了。


08年的时候美国的knewton公司成立,其实knewton不是第一家做自适应学习的,却是第一家把自适应学习做到大规模商业化应用的。


其实大家可以思考一下为什么knewton08年成立的,而不是98年或者96年。


其实后面有一个很核心的问题,就是技术上面的成熟,特别是大数据和云计算的成熟。


云计算的出现,让系统能够在很短的时间,内比如说一秒钟,算出学生下一步的学习路径是什么,这在90年代是不可想象的。


08年开始美国的培训机构出版社有一系列的融资和并购。


比如说美国最大的教育培训公司Kaplan就收购了自适应考试辅导公司,许多出版社和出版商也开始大规模的融资和并购。


15年的话,Knewton完成了新一轮的4725万美元的融资,而我们公司乂学教育,刚刚完成了应该是中国在线类教育历史上,最大的一笔种子轮融资,一共是3000万。


发表回复