本文由《中国电化教育》杂志授权发布
作者:顾小清、薛耀锋、孙妍妍
摘要
在大数据渗透到当今每一个行业和业务领域的时代,挖掘数据的潜能越发被各个领域所重视,也使得基于数据的教育决策这一教育技术领域的研究传统获得了新的发展机会,并逐渐在热点频出的教育信息化热潮中展现出其发展潜能和优势。随着教育决策所涉及问题复杂性的凸显,以及教育决策科学化的需求的提升,对基于计算机的决策的依赖越发体现出来。如何利用计算能力发挥教育领域的数据的力量,借助计算机模拟的方式为科学的教育决策提供依据,是大数据时代一个迫切需要解决的问题,也是教育技术领域的一个传统研究方向的新的发展机会。该文对计算机支持决策的研究背景进行了回顾,对大数据时代的教育决策需求进行了分析,并以本研究团队开展的教育模拟决策支持系统为案例,介绍了大数据时代发挥数据的力量与模拟优势的探索。
关键词:大数据;数据支持教育决策;模拟;模型;学术分析
一、研究背景
借用《双城记》开篇这句被引用无数的话,“这是最好的时代,也是最坏的时代”,或许才足以阐释今天的教育所面临的问题。教育的话题触及全民的神经,因而虽然对教育的投入以及教育改革的努力不可谓不大,却依然面临民怨不断的困境。教育决策所面临的问题日益复杂,也提高了教育决策科学化的呼声。另一方面,与其他每一个行业和业务领域一样,信息技术的广泛应用在为教育提供变革和创新机会的同时,也创造了丰富的有待挖掘的数据资源;利用计算机的计算能力进行数据的分析并提供决策支持的思想在计算机技术发展的早期就已形成。大数据时代的崛起和数据密集科学的发展,则为教育决策科学化的需求提供了发挥计算机模拟决策优势、展现教育技术应用中的数据力量的新的机会。
在教育技术领域的研究与实践中,技术对于数据管理的潜能是一开始就受到研究者关注的领域,体现为利用技术挖掘教育数据的可能性从而达到改进教学系统的目的,包括早年的计算机辅助个别化教学(Computer Assisted Instruction,CAI),计算机管理教学(Computer-Managed Instruction,CMI),以及近年来随着数据的丰富而出现的基于数据的决策(Data-Driven Decision Making)应用。数据在教育决策中的作用,其潜在的力量,是能够将淹没在众多信息系统中的海量数据加以挖掘,为相应的决策提供方向、依据甚至证据,从而帮助相关者做出知情的决策。
随着教育决策问题复杂性的增加,审慎的教育决策往往需要综合考察多方数据,比如经济的、效益的、历史的、民意的。大数据时代这些众多的数据来源在保证决策信息丰富性的同时,也为如何对这些多来源的海量数据进行有效处理提出了要求。这就为如何对海量数据加以有效处理,从而透明地提供有效的教育决策支持提出了新的需求。
基于本研究团队在教育模拟决策支持系统领域所开展的研究,本文回顾了计算机支持决策的研究背景,对大数据时代的教育决策需求进行了分析,并初步呈现了本团队开展的教育模拟决策支持系统,以期对大数据时代如何发挥数据与模拟技术的作用展开探讨。
二、相关研究
(一)大数据与大数据时代
在信息时代,信息化技术逐渐成为人们生活当中重要的组成部分,而信息化技术和互联网的普遍应用则产生了前所未有的海量以及多样化的数据。2011年,美国著名咨询公司麦肯锡首次提出了“大数据”的概念,将大数据界定为无法在一定时间内用常规软件进行抓取、管理和处理的数据集。英国学者维克托.迈尔舍恩伯格在《大数据时代》一书中指出:“大数据是人们在大规模数据的基础上可以做到的事情,而这些事情在小规模数据的基础上是无法完成的”[1]。
2012年,联合国国际脉搏(UN Global Pulse)组织发布了《用于发展的大数据:机遇与挑战》一文,明确指出了大数据时代已经来临。这股通过对海量数据进行分析和处理来提高效率、颠覆传统方式的大数据浪潮,在各行各业当中都产生了极大的影响。在决策领域,大数据时代电子数据以海量、多样、高频的方式爆炸增长,为决策者追踪发展过程并调整现行政策提供了可能性[2]。
(二)基于数据的教育决策
决策过程过于依赖经验、缺乏数据的支撑,一直是教育界中颇受诟病的不足之处[3]。在教育领域当中,从业者常常依据直觉、冲动或流行的趋势来做出决策,这已是很多教育学者们的共识[4][5]。基于数据的教育决策正是应对这个不足的解决方式之一。Schildkamp和Kuiper[6]将基于数据的教育决策定义为通过对学校已有数据资源的系统分析来创新教学、提高学生表现,并将这些创新应用于实践、进行评测的行为。然而,基于数据的教育决策并不仅仅存在于提高学校教学质量层面上,而是能够在教育过程当中的多个环节当中得到应用。
在微观上,基于数据的教育决策可以协助提高教学质量。在课堂教学当中,如果教师们能够学会运用数据,他们就可以更加有效地了解学生的能力、发现不足之处、并提出改进的计划[7]。通过教学管理系统反馈的数据,教师可以了解并确定不同学生的学习需求[8],并应用数据对学生进行学习诊断,这对减小学生间的差距、提高整体教学质量有很大的帮助[9]。
在中观上,基于数据的教育决策可以从学校及学区的管理层面来影响相关的资源调配以及政策实施[10]。在此基础之上,基于数据的教育决策可以帮助学校/学区审慎地制定发展计划、提供改进的途径、并通过数据的应用构建一种良性循环的校园文化[11]。
在宏观上,基于数据的教育决策可以帮助地区、甚至国家级的决策者进行科学判断。虽然在此方面的研究还在起步阶段,但在大数据理念下的、基于数据的教育决策在重大教育政策的制定当中具有以下两个优势:首先,基于数据的决策可以充分考虑各方面的变量,为决策者提供全局的视野。重大教育政策的制定往往需要决策者全面衡量多方面的因素,这些因素往往复杂且多变,而数据能够做到将这些因素量化、可视化、立体化,给决策者提供更好的参考。其次,基于数据的教育决策可以借助计算机模拟的力量,对海量数据进行分析,通过复杂的计算得出科学的结果,从而避免决策者因为直觉和冲动而做出错误的判断。
(三)计算机模拟
如上文所示,计算机模拟是在宏观上进行基于数据的教育决策时不可或缺的一部分。计算机模拟是以相似原理为基础,以计算机和相关专用设备为工具,利用系统模型对真实的或设想的系统进行动态分析的一类综合性技术[12]。计算机模拟综合集成了信息处理技术、系统科学、软件工程、图形图像技术、多媒体技术、计算机网络技术等。计算机模拟技术不仅仅是一类有力的科学研究手段,它也是人们认识客观世界的新利器[13]。例如,美国Sandia国家实验室开发的美国经济模拟系统ASPEN可以模拟美国多个行业的经济运行[14],而美国Maxis公司研制的模拟城市系统SimCity则可以帮助用户扮演市长的角色来规划和管理整个城市[15]。此外,美国MathWorks公司开发的Simulink软件包可以支持用户对复杂系统的建模、模拟和分析[16],提供了强大的模拟工具。在海湾战争期间,美国军方使用兵棋推演系统JTLS成功模拟了相关军事活动[17],辅助其军事决策。美国SantaFe研究所设计和开发的股票市场模拟系统ASM可以模拟美国股票市场的运作[18]。美国MSC公司研制的汽车动力学模拟软件Carsim可以模拟车辆的操纵、制动、动力等功能和响应等[19]。进入21世纪,计算机模拟技术在科学研究、工业、军事、交通、教育等领域得到越来越多地应用。
综上所述,在当今信息时代,大数据以及大数据的分析手段在教育领域已经得到了广泛应用。然而,对基于数据的教育决策的研究,大多数还停留在微观和中观层面。如何利用大数据和计算机模拟技术来辅助地区乃至国家层面的宏观教育决策,还是一个有待研究的领域。因此,本文希望通过对教育模拟决策支持系统的研究,来探索数据与模拟技术对宏观教育决策的辅助作用。
三、以模拟支持决策
关于“决策”的涵义和解释仁者见仁,智者见智。“决策”既可描述动态活动——决定策略或办法的过程,又可描述静态事物——决定的策略或办法[20]。随着当前社会的快速发展和信息大爆炸时代的到来,组织机构和个人面对不断涌现的海量数据和变革的社会环境,只有做到有效的决策,才能在当前的社会环境中得到不断发展[21]。显而易见,仅凭个体记忆的少量先验知识进行决策己经不能适应大数据时代发展的形势,如何进行科学决策成为组织机构面临的重大课题。而计算机模拟支持决策技术作为一类新兴的决策支持手段可以帮助组织机构和个人获取和筛选海量的决策信息、设计和开发高度相似的模拟系统,模拟各种备选方案的演化过程和最终结果,结合相关决策支持理论,就可以为组织机构和个人提供有价值的决策方案,降低组织机构和个人的决策风险,保障组织机构和个人决策目标的实现。
计算机模拟支持决策技术是近年来发展起来的一类综合性科学技术。通常地,决策对象和决策过程都不能通过真实的客观再现来进行分析,因此计算机模拟支持决策技术就成为一类研究决策过程的重要手段和途径。计算机模拟支持决策技术是对决策对象和决策过程进行系统模拟的一类技术,它通过构建系统模型,开发模拟系统,模拟系统的演变过程和行为,进而模拟决策对象或决策过程发展变化的规律,在计算机等专用设备上实现对决策对象或决策过程的全过程模拟。在计算机模拟支持决策的整个过程中,人们可以通过对模拟系统运行状态的跟踪和分析,研究被模拟的决策对象或决策过程的运行状态各项参数,以此来预测和推断实际决策对象或决策过程的真实演化规律,为人们的科学决策提供真实考虑的数据和依据。计算机模拟支持决策技术的理论框架如图1所示。
计算机模拟支持决策技术的主要实施方法包含八个步骤,如图2所示,具体如下:
(1)确定需要决策的问题
这一步骤的主要任务是明确决策目的和主要决策问题及其假设条件,确定研究对象或系统的边界,并对问题涉及的主要变量进行表征。
(2)研究对象的系统分析
对决策问题的研究对象进行辨识,确定研究对象的主要变量,分析研究对象的参考模型,梳理决策系统主要变量之间以及主要变量与其他变量之间的相互关系。
(3)建构系统模型
运用系统动力学原理对决策研究对象构造系统模型,以预先假设条件为参考,分析系统内部各部分之间的相互依存、相互作用的关系,完善模型的结构,实现模型的形式化表征和定量化描述。
系统模型是一个系统某一方面本质属性的描述,它以某种确定的形式(如文字、符号、图表、实物、数学公式等)来提供关于该系统的知识。系统模型一般不是系统对象本身,而是现实系统的描述、模仿或抽象。
(4)设计和开发计算机模拟系统
根据系统模型的形式,计算机的类型以及模拟目的将决策研究对象的系统模型转变成计算机模拟模型,确定计算机模拟模型的框架、结构和参数。设计和开发计算机模拟系统,设定计算机模拟系统的运行条件和参数数值。
(5)运行计算机模拟系统
根据计算机模拟支持决策的目的和模拟系统的运行参数和数据,在计算机等专用设备上进行计算机模拟系统,模拟整个决策研究对象的演进过程,跟踪和记录计算机模拟系统随时间变化的运行状态和特征数据。
(6)检验计算机模拟系统
通过分析计算机模拟系统的模型结构和主要变量的运行参数和数据以及模拟系统在极端条件下的适应性,检验计算机模拟系统的有效性。根据检验的结果,不断修正系统模型和完善计算机模拟系统,使其成为一个与实际系统高度一致的计算机模拟系统。
(7)模拟系统结果分析
根据计算机模拟支持决策的研究目标和决策问题,对已经通过有效性检验的计算机模拟系统的运行状态的条件、参数和特征数据等进行整理和文档化,研究随时间变化的模拟系统的演进规律,为科学决策提供客观有效的评判依据。
(8)决策方案分析
决策者根据计算机模拟系统的运行数据和计算结果,深入分析备选决策方案的计算机模拟的实际实施效果,比较不同备选决策方案的优缺点,选择最优的决策方案。
四、模拟决策系统实例
本团队在教育模拟决策支持系统领域开展了一些研究,并初步开发了一些可用于支持教育决策的模拟系统。本节以我团队开发针对“是否延长义务教育年限以及如何延长”这一教育决策问题所开发的模拟系统为例,对这一领域的研究做一介绍。
(一)问题界定及系统分析
义务教育年限的延长与否,取决于财政、社会效益、相关法律以及民众意志等多维复杂因素,其中教育经费的支持是实施义务教育年限延长政策的经济基础。单教育经费一项,又是涉及教育投入年度预算的调整、不同阶段在读学生人数的波动、办学条件要求的变化、学生生均公用经费的设定、教师工资福利的改革、基本建设支出的变动等多个动态因素的复杂问题。本文以上海市义务教育年限延长的教育经费决策问题为案例,运用计算机模拟支持决策技术对上海市义务教育年限若干延长方案在未来五年(2016-2020年)的教育经费进行模拟,为教育管理部门分析义务教育年限延长方案的经济可行性提供有价值的参考。
本文通过分析《中国教育统计年鉴》[22]《中国教育经费统计年鉴》[23]、2013年教育部、国家统计局、财政部、全国教育经费执行情况统计公告[24]、《上海统计年鉴》[25]和《全国第六次人口普查主要数据》[26]等文献材料,归纳得到上海市义务教育阶段教育经费主要由学生的生均公用经费、教师工资福利和基本建设支出等三大类支出组成。因此,我们构建的模拟系统的输入变量应该包含2016-2020年不同阶段在读学生人数、不同阶段学生的生均公费数额、教师人数、教师工资福利数额、生均基本建设支出等参数。其中,不同阶段在读学生人数可由最近年份全国人口普查的数据进行推断,而教师人数可由学生人数和生师比系数进行计算。模拟系统的输出变量为2016-2020年不同年份的常规义务教育阶段的教育经费支出、对应的义务教育年限延长方案的教育经费支出、义务教育年限延长方案较常规义务教育的需增教育经费数额。
(二)模型构建
1.模型假设
本文建构上海市义务教育经费系统模型的假设条件如下:
(1)上海市教育经费投入所占国民经济生产总值的比例保持不变;(2)上海市适龄学生人口规模无突然大幅缩减或大幅增加;(3)上海市国民经济生产总值呈规律性、稳定性变化。
2.模型建构
本文建立的义务教育阶段教育经费模型具体如下:
式(1)中,F表示一个自然年内上海市义务教育阶段教育经费总额,Fs表示一个自然年内上海市义务教育阶段学生的生均公用经费总额,Fr表示一个自然年内上海市义务教育阶段教师的工资福利总额,Fc表示一个自然年内上海市义务教育阶段基本建设支出费用总额。式(1)表示一个自然年内上海市义务教育阶段教育经费总额由学生的生均公用经费、教师的工资福利和基本建设支出三大部分组成。
式(2)-(6)中,P(·)表示计算上海某年份义务教育不同层级学生人数的函数,本文采用LESLIE人口预测模型,依据最新的人口普查数据,对不同年份的人口数据和学生人数进行预测;Year表示年份,如2015;Sn,k表示上海市义务教育阶段不同层级的学生数量,其中k表示义务教育阶段中的不同层级,k的所有取值范围包括Kindergarten,Elementary,Junior,Senior,High和Vocational,并且Kindergarten表示幼儿园阶段,Elementary表示小学阶段,Junior表示初中阶段,Senior表示高中阶段,High表示普通高中,Vocational表示职业高中;Sn,senior表示上海市高中阶段学生的人数;Sn,high表示上海市普通高中阶段的学生人数;Sn,vocational表示上海市职业高中的学生人数;α表示上海市普通高中的学生人数占上海市高中阶段所有学生人数的百分比,补充说明一下:上海市高中阶段的学生有约55%的学生进入普通高中,还有约45%的学生进入职业高中,此百分比由上海市教
委根据相关政策和规定确定,每年可能有所调整;Sp,k表示上海市义务教育阶段不同层级学生的生均公费数额;GDPshanghai表示上海市的人均GDP数值;Ik表示生均教育经费指数,即生均教育经费与人均GDP的商。式(2)表示求解上海某年份义务教育不同层级学生人数。式(3)表示上海市普通高中的学生人数等于所有高中阶段学生人数与普通高中学生人数所占百分比α的乘积。式(4)表示上海市职业高中的学生人数等于所有高中阶段学生人数与职业高中学生人数所占百分比(1-α)的乘积。式(5)表示上海市义务教育阶段学生生均公费总额由不同层级的学生数与生均公费平均数额的乘积计算得到。式(6)表示根据国际惯例参照生均教育经费指数,上海市义务教育阶段学生的生均公费总额由不同层级的学生数、上海人均GDP与生均教育经费指数的乘积计算得到。
式(7)和(8)中,Rn,k表示上海市义务教育阶段不同层级的教师数量,Ri,k表示上海市义务教育阶段不同层级的教师平均工资数额,Rst,k表示上海市义务教育阶段不同层级的生师比。式(7)表示上海市义务教育阶段的教师数量由不同层级的学生人数除以生师比系数所得到的商。式(8)表示上海市义务教育阶段教师的工资福利总额由不同层级的教师数与其平均工资的乘积计算得到。
式(9)中,Ci,k表示上海市义务教育阶段不同层级的生均基本建设支出数额。式(9)表示上海市义务教育阶段的基本建设费由不同层级的学生数与生均基本建设费的乘积计算得到。
综上所述,式(1)-(9)构建了上海义务教育阶段教育经费模型。
(三)设计开发模拟系统
本文根据所建立的上海市义务教育年限延长决策问题的教育经费模型,设计和开发了计算机模拟支持决策系统,并采用Java编程语言对系统进行了实现。整个系统的体系框架如图3所示。
上海市义务教育年限延长决策问题的教育经费计算机模拟系统的体系框架主要包括资源层、服务层和用户层三个层次。资源层为教育经费计算机模拟系统提供数据和相关资源信息,是整个系统的基础层级,包括人口数据库、学生数据库、教师工资库、生师比指标库、生均公费库、基本建设费数据库、GDP指标库、办学条件指标库、模型库、方法库、规则库、方案库和知识库等模块。服务层为计算机模拟系统提供各种功能丰富的服务模块,是整个系统的业务层级,包含系统模型建构、模拟情景建构、情景参数设定、过程观测器、模拟任务执行、模拟任务管理、可视化服务、信息协同服务、研讨支持服务等模块。用户层为用户与计算机模拟系统之间的信息交互搭建桥梁,是整个系统的人机交互层级,主要由人机交互模块组成。
(四)系统运行与分析
我们采用此计算机模拟系统对上海市义务教育年限延长决策问题的15种备选方案的教育经费支出进行模拟,为义务教育年限延长的科学决策提供数据支持。模拟系统中所涉及的各类参数参照了《中国教育统计年鉴》[27]《中国教育经费统计年鉴》[28]2013年全国教育经费执行情况统计公告[29]《上海统计年鉴》[30]《第六次全国人口普查主要数据》[31]《上海市义务教育阶段学校办学基本条件》[32]等官方文件和统计资料。下面给出了未来5年即2016年至2020年义务教育年限向幼儿园延长三年的教育经费模拟数据,如图4和图5所示。
从图4可以看出,2016至2020年未来5年中,模拟的上海义务教育阶段的教育经费支出约在219.68亿元至253.48亿元之间。如果向幼儿园延长三年,即义务教育延长到12年,那么2016至2020年上海义务教育阶段的教育经费支出的模拟数值在279.13亿元至308.23亿元之间。如果参照经合组织(OECD)成员国的惯例,义务教育阶段生均公费数额以生均教育经费指数为依据。目前,OECD成员国的小学阶段生均教育经费指数平均值是0.24,而初中阶段生均教育经费指数平均值是0.26。本文所开发模拟系统中的生均教育经费指数参照了OECD的生均教育经费指数平均值,幼儿园的生均教育经费指数参照OECD的小学生均教育经费指数平均值,即0.24。按照生均教育经费指数的延长方案,2016至2020年上海义务教育阶段的教育经费支出的预测数值在379.73亿元至438.94亿元之间。
根据图5所示,2016至2020年上海义务教育年限向幼儿园延长三年的常规方案较常规九年义务教育下的教育经费需增加59.45亿元至54.75亿元左右。同比,2016至2020年上海义务教育年限向幼儿园延长三年的生均教育经费指数方案较常规九年义务教育下的教育经费需增加160.05亿元至185.46亿元左右。
教育管理部门决策者可根据本文所模拟的教育经费数据,结合每年度上海市财政预算中教育经费支出情况,合理推断上海市义务教育年限延长决策问题中教育经费支持的可能性。
由于本文所建模型受数据来源和客观条件限制,在模型构建时部分计算公式和参数有所折衷,无法精确推算,所提供的模拟数据可能与真实数据有一定差距。例如,由于不同层级和教龄的教师工资福利详细数据的缺失,本文无法对不同层级和教龄的教师工资和福利待遇进行详细计算等等。在下一步的工作中,我们将收集更详细的教育数据,改进所建模型的计算公式,更新模型参数,进一步完善我们开发的计算机模拟系统。
五、结束语
本文介绍了大数据、基于数据的教育决策、计算机模拟等热点概念和理论,详细阐述了计算机模拟支持决策技术的原理、特点、理论框架和实施步骤。最后以上海市义务教育年限延长决策问题教育经费模拟为案例,构建了教育经费模型,设计和开发了计算机模型系统,分析了模拟系统所推算的2016至2020年上海义务教育年限向幼儿园延长三年的两种方案教育经费数值,演示了计算机模拟支持决策技术的实际应用。
大数据时代的到来,一方面给人们带来了汹涌如潮的海量数据,大大超出了人们的认知负荷,突破了常规计算机系统的处理能力;另一方面大数据时代也为人们的科学决策提供了丰富的数据来源,为计算机模拟支持决策技术的发展提供了肥沃的土壤。随着我国教育信息化水平的不断提高,教育数据的不断丰富,国内教育大数据时代也如期到来。教育信息化领域的研究与实践者将充分借助大数据时代带来的计算潜能,运用严密的科学理论,设计和开发强大的科学工具,为教育决策提供坚强、有力的支持。
作者简介:顾小清:博士,教授,研究方向为教育信息化理论与实践、教育培训系统设计开发、远程教育技术、CSCL、学习技术系统用户行为研究、学习技术系统标准研制。薛耀锋:博士,副研究员,研究方向为教育信息化、决策支持系统、计算机模拟技术。薛耀锋为本文通讯作者。孙妍妍:博士,讲师/晨晖学者,研究方向为智慧教学环境、移动学习、远程教育技术、科技支持下的语言教学等。
转载自:《中国电化教育》 2016.1 总第348期:56-62(参考本刊文章必须注明出处)
排版、插图来自公众号:MOOC(微信号:openonline)
本文编辑:慕编组成员(Susan)
产权及免责声明本文系“西大教育”公号转载、编辑的文章,编辑后增加的插图均来自于互联网,对文中观点保持中立,对所包含内容的准确性、可靠性或者完整性不提供任何明示或暗示的保证,不对文章观点负责,仅作分享之用,文章版权及插图属于原作者。如果分享内容侵犯您的版权或者非授权发布,请及时与我们联系,我们会及时审核处理。
微信公号:swuedu
公号昵称:西大教育