前言:我们精心挑选了数篇优质数据挖掘学习计划文章,供您阅读参考。期待这些文章能为您带来启发,助您在写作的道路上更上一层楼。
关键词: E-learning应用平台; Web数据挖掘; 个性化学习; 个性化搜索引擎
中图分类号:TP392;G434 文献标志码:A 文章编号:1006-8228(2013)09-05-03
0 引言
计算机通信技术的日益强大支撑了建设学习型社会的需求,远程教育借助它的灵活性与选择性渐渐走进人们身边,成为学习的一种普遍方式。自1996年我国开通了“中国教育与科研计算机网”,开放、灵活的E-learning便迅速被人们所接受并应用于各种网络学校和远程教育之中。
随着时间的推移,人们要求不仅仅只是远距离的教学,更多的是个性化的学习。个性化教育理论认为,学习过程应是针对学生个性特点和发展潜能而采取恰当的方法、手段、内容、起点、进程、评价方式等,促使学生各方面获得充分、自由、和谐发展的过程[1]。但是目前的远程教育学习系统并不令人满意,首先是系统缺乏智能性,学习系统面对的用户并非是一类人,而是不同背景、不同目的、不同时期的一系列请求,面对这些请求,缺乏智能化的系统就难以实现因材施教;其次是缺乏有效的监督机制和有效的学习帮助支持,导致学生偏离学习目标、遇到困难时不能及时得到帮助;再者是有用的教学资源没有被有效利用,造成了资源的极大浪费。“以人为本”的教育理念的逐渐普及,个性化学习方案总体上应该做到学习资源的多维性、学习价值追求的多重性、学习风格的独特性、学习过程的终身性和学习方式的自主性。
基于Web智能的网络教育是现代远程教育的一种重要手段,其可以通过网络来营造虚拟的学习环境,在一个平台上向学生提供丰富的学习资源,从而帮助学生开展基于资源的探究式学习;在虚拟的学习环境中,教师和学生、学生与学生间可以方便地进行同步或异步的交互。数据挖掘便是实现Web智能网络教育的重要方法,主要是通过获取学习者在Web上的学习过程行为数据,如访问信息、时间、次数及喜好等,经过挖掘流程处理,得到学习者的模式规律,从而给学习者提供良好的个性化服务[2]。
1 Web数据挖掘相关分析
1.1 Web数据挖掘基本过程
Web是一个强大的交互环境,所以Web事务度量就需要数据的获取与处理,Web数据挖掘指的是从大量的、不完全的、蕴含的、模糊的WWW资源上提取隐含在其中有用的信息和知识的过程。其处理对象是大量的业务数据,目的是为了提取有价值的知识,提高信息利用率。Web数据挖掘又被称为资料探勘或者数据采矿,是数据库知识发现中的一个步骤。根据大量业务数据的不同类型,Web数据挖掘可以分为:Web内容挖掘、Web结构挖掘、Web使用挖掘[3]。其中,Web内容挖掘是挖掘Internet的页面和后台交易数据库,包括结构化的数据挖掘与非结构化的数据挖掘。无论是哪种数据挖掘,都是为了寻找隐藏着的、大量的、有价值的信息,并且为Web提供更好的服务。
以下给出Web数据挖掘的基本流程。
⑴ 目标数据采集:数据采集就是要记录用户访问行为。数据来源包括服务器端、客户端和端。为了有效地实施挖掘算法,仅仅采集数据是不够的,还需要进行下一步操作:预处理。
⑵ 预处理:目标数据经过预处理才能有效的实施挖掘算法,也就是从目标数据集中除去明显错误数据和冗余的数据,进一步精简所选数据的有效部分,并将数据转化为有效形式。数据的预处理的质量与Web挖掘的效率是紧密相关的。内容包括数据净化、用户识别、会话识别、事务识别及路径补充等。
⑶ 模式发现与分析:模式发现就是对预处理后的数据实施具体的、合理的挖掘算法或综合应用不同的算法。其最终目的是发现用户的访问模式,预先为用户设定学习内容类别。模式分析的目的是根据实际应用,通过观察和选择,将模式发现的统计结果、规则和模型转换为知识,经过筛选后用来指导实际应用,也就是在预先的类别中再次为用户提供个性化资源和学习支持服务。
⑷ 用户反馈:利用数据挖掘与学习内容绑定等各种技术,学习者的学习过程会是以可视化方式进行指导。
1.2 相关算法分析
协同过滤这一概念最早出现在1992年,由Goldberg、Nicols、Oki及Terry提出,随着大大小小系统的应用,协同过滤推荐迅速成为Web数据挖掘中一种很受欢迎的技术。该技术分析用户兴趣,在用户群中找到指定用户的相似用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测[4-6]。
相似性计算是协同过滤推荐算法中最关键的一步,传统的相似度计算方法有三种。
⑴ 余弦相似性
把用户评分看做n维项目空间的向量,用户间的相似性通过向量间的余弦夹角度量,设用户i和用户j在n维项目空间上的评分分别表示为向量k,e,则用户i和用户j之间的相似性为:
Sin(i,j)=cos(k,e)= ⑴
⑵ 修正的余弦相似性
余弦相似性度量方法中没有考虑不同用户的评分尺度问题,修正的余弦相似性度量方法通过减去用户对项目的平均评分来改善上述缺陷,设经用户i和用户j共同评分的项目集合,则用户i和用户j用户之间的相似性为:
Sin= ⑵
其中,Rij代表用户i对项目c的评分,和分别表示用户i和j对项目的平均评分。
⑶ 相关相似性
设经用户i和用户j共同评分的项目集合用Iij表示,则用户i和用户j之间的相似性sin(i,j),通过Pearson相关系数度量:
归根结底,三种相似方法均为基于向量的相似度计算方式,进行对象属性之间的严格匹配。
余弦相似性度量方法把用户评分看作一个向量,用向量的余弦夹角度量用户间的相似性,然而没有包含用户评分的统计特征;修正的余弦相似性方法在余弦相似性基础上,减去了用户对项目的平均评分,然而该方法更多体现的是用户之间的相关性而非相似性。相关性和相似性是两个不同的概念,相似性反应的是聚合特点,而相关性反映的是组合特点;相似相关性方法,依据双方共同评分的项目进行用户相似性评价,如果用户间的所有评分项目均为共同评分项目,那么相似相关性和修正的余弦相似性是等同的,用户对共同评分的项目集稀少,使得相似相关性评价方法实际不可行。
2 基于Web数据挖掘的个性化学习系统模型
基于Web数据挖掘的个性化学习系统采用的是三层B/S模型,如图1所示。
个性化与智能化功能模块的实现都是以Web为基础的。服务器是一个核心,用户通过客户端发送一系列请求,Web服务器作出相应的响应,也就是在后台数据库中查询信息,查询到的信息再返回给Web服务器,最后服务器通过网页的形式呈现及反馈给用户。
2.1 主要功能模块分析与设计
基于Web数据挖掘的个性化学习系统主要是由学习者、学习者个人秘书、管理员、个性化推荐引擎及教学资源等模块构成。其中系统的核心部分是“学习者个人秘书”。当学习者通过身份验证后,便会进入个人的学习页面。“学习者个人秘书”根据学习者的访问习惯和学习者提交的要求等信息进行自动整合(这里主要是由用户信息收集和用户信息建模两个模块来实现),并进行内部建模,形成一套完整的学习方案,并对此方案进行资源调度,进而反馈给学习者所需的资源信息。“学习者个人秘书”也就是所谓的个性化处理引擎,它主要由四个模块组成:用户信息收集、用户信息建模、个性化学习方案、学习资源调度。该个性化学习系统方案构建如图2所示。
⑴ 用户信息收集模块
信息收集模块是实现在线学习个性化服务的基础,它收集用户请求,跟踪用户的行为,结合用户数据库中事先存放的用户个性化特征数据,经过预处理,对用户信息建模提供个性化的策略。
⑵ 用户信息建模模块
信息建模模块则是运用数据挖掘技术对这些信息进行分析,不断更新或者初始化用户数据库中动态部分,以生成个性化推荐策略并发送给个性化学习方案模块。
⑶ 个性化学习方案模块
学习方案模块是“学习者个人秘书”的核心模块,它结合前面提供的一系列用户特征信息,并进行整合后自动生成一套教学方案,把教学方案中所需要调度的资源传递给资源调度模块。
⑷ 资源调度模块
资源调度模块是根据教学方案中需要调度的资源从视频库、作业库、试题库等资源库中调度并反馈给用户。其中,资源库中保存学习者的基本信息、学习历史、访问历史、对知识的掌握情况、学习喜好等个性特征。学生的个性特征也分为静态信息与动态信息。如学生的姓名、性别、年龄、ID、密码等都属于静态信息,如学习历史、学生做过的练习和测试题的答案、学习者的知识结构等都属于动态信息。学生的个性化特征信息是实施个性化教学策略的基础。
总之,整个个性化在线学习系统就是通过数据挖掘技术,把用户在学习过程的所有行为记录下来,并结合用户数据库,从中挖掘出用户个性化学习特征,为个性化教学策略的产生提供可靠的依据。在本文,学习者个人秘书个性化引擎的加入,主要是实现个性化学习系统中视频主导、测验穿插、在线交流、引导学习等功能。其中视频能提取该集视频所具有的知识点,作为关键字在知识树中进行串联。知识树是惟一呈现给用户的学习接口,让用户不再注重于选择何种视频、哪位老师所教,达到最快的学习效率。再就是测验穿插,是在用户不主动去做测验的时候,类似强制于用户做测验,否则无法进入下阶段测试。概括来说,学习者个人秘书模型设计实现以下功能:记录学习者进行的所有学习活动;定时给予用户学习建议与误区纠正;能主动与其他学习者的学习秘书进行交流;记录每次学习周期,学习者的学习路线。
2.2 Web数据挖掘在系统中的应用
数据挖掘是开发Web智能的学习系统的关键所在,它对个性化学习模型的构建、个性化的学习资源的提供、个性化学习的指导、系统性能的改进等方面应用非常多。
⑴ 个性化学习模型的构建
学习者模型的构建本就是根据学习者不同的个性特征参数,对学生学习活动进行跟踪,并且记录学生学习的相关信息,如:学生经常访问的URL的次数、停留时间、访问的课程数等等。Web数据挖掘用去噪和模式进行“模式发现”,得到学生学习的个性特征,建立、完善学生学习模型,建立学生个性数据库,为不同的学生提供智能、个性的学习策略。
⑵ 个性化学习资源的提供
在系统进行模式发现后,需要为学生从后台数据库中调度学习资源,这时候就需要系统将学生无关及学生不感兴趣的资源进行筛选。Web数据挖掘中的统计分析技术可以根据学生经常访问的页面推测学生下一步的行为,推测出其感兴趣的相关资源,从而减少学生的搜索时间,合理提供备用资源。
⑶ 个性化学习的指导
一个好的学习系统能适应的并不只是一类人,而是不同背景,不同能力,不同目的的人,因为每个人的学习能力、兴趣、习惯以及基础都有很大的差异。若采取进入系统平台前让用户提交测试用户属性信息的一些表单,初始化学生学习特征,但是其中的属性却是时刻变动的,普通的学习系统无法做到随机应变。利用Web数据挖掘技术,挖掘用户的使用数据日志,分析用户的浏览趋势,从而形成一组按时间排序的会话,预测用户未来的访问模式并做及时的指导。这样针对不同类型的用户,系统可以安排特定的内容,做到真正意义上的“因材施教”。
⑷ 系统性能的改进
Web数据挖掘技术提供网站构架及用户的使用信息,管理员可以根据这些信息,控制Web缓存、负载平衡和网络构架等问题,从而做到了系统的安全性与稳定性。
3 结束语
基于Web数据挖掘的个性化学习系统研究,以“个性化E-learning系统研究与实现”课题为背景,实现了Web数据挖掘技术的应用、学习知识点概念相关性的算法分析与设计、且构建一个基于Web的学习者模型,阐述系统研究思路,并完成了系统设计与实现应用。在一定基础上为在线学习系统的个性化应用提供理论与推广参考价值。同时,本文虽取得了具体的应用效果,但在个性化学习资源的组织与动态呈现上未能与学习者模型联系,以呈现针对不同用户的个性化学习内容页面。这将是今后需要进一步研究的问题。
参考文献:
[1] 陶剑文.基于多Agent的协作式网络学习系统模型研究[J].计算机时代,2006.7:64-66
[2] 单蓉.一种基于用户浏览行为更新的兴趣模型[J].电子设计工程,20l0.4:61-62
[3 唐远洋,黄尔嘉.知识挖掘技术与网络教育资源的组织[J]. 情报资料工作,2005.4:107-109
[4] 游文,叶水生.电子商务推荐系统中的协同过滤推荐[J].计算机技术与发展,2006.9:97-99
[5] 邱明虹,何跃.从Web日志中挖掘用户兴趣路径算法改进[J].计算机工程与应用,2008.26:129-131
关键词:高职教育;个性化学习;数据挖掘;商业智能
中图分类号:TP311.13
作为我国高等教育一支重要生力军――高等职业教育近几年来的发展可谓迅猛,无论是学校数还是学生人数,高职专科的规模已是我国高等教育的半壁江山。高职教育对人才的培养目标是为国家和地方经济的发展输送适应生产、建设服务等一线急需的应用型高素质人才,《国务院关于大力发展职业教育的决定》中就提出了“坚持以就业为导向,深化职业教育教学改革”,要求加强职业院校对学生实践能力和职业技能的培养。
1 现状
目前,高职学生在学校完成系统的课程学习依然是高职教育教学的主要方式,在此过程中,由于学生个体特性、就业意向、专业方向等各种因素的影响,获取的知识无论从方式方法、内容结构,还是真正掌握的程度来说都因人而异,而这其中有相当大的部分是学生主动性选择的结果;此外,在高职教育教学改革的尝试中,大类招生、拓展专业等多项措施在很多职业院校中已然试行,这就给予学生更多的自和选择的机会。
然而,在自主选择的过程中,由于没有一个可参照的、适合自己的挑选标准,高职学生进行各项选择时在很大程度上有着“扎堆随大流”、“哪个课能混好过”的心理,这就导致主动选择的课程,其学习过程并不顺畅、学习效果也不理想,没有提升自身知识结构的质量。这种高职教育中教与学环节的脱节会对高职学生的能力培养产生有着不可忽视的影响。
2 研究思路
随着教育信息化的深入发展,先进的信息技术手段在教育教学的方方面面都得以有效利用,这也为学生综合能力培养的探索与尝试提供了新的途径,数据挖掘技术就是其中很重要的一种。数据挖掘指的是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。在此过程中,数据源必须是真实的、大量的、含噪声的,而从中发现的是用户所感兴趣的知识内容,这些知识应该是可以接受和理解、并且能加以进一步运用的。
数据挖掘技术之所以在教育行业有更为广泛、实际的应用,这是由于各个学校都会有自己的一整套数据库系统,用于记录学生的学籍信息、课程教学过程等历史数据,这样,就可以尝试运用先进的数据挖掘技术和智能分析工具,通过对高职教育研究和教学过程中积累的海量数据进行采集分类、挖掘和分析,从多角度、多层次出发,构建识别个体特点、知识构成和获取方式等要素之间关联模式的数据模型。数据挖掘是一门交叉学科,其理论和方法有很多,包括K-最近邻分类器、判别分析、人工神经网络和分类树等,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。在这里就是要将数据挖掘方法与高职教育教学研究相结合,设计实际的分析应用系统,具体来说:
(1)数据挖掘技术面向高职教育这一特定领域中的主体――高职学生,针对专门的指标,包括个体特性、专业要求、就业意向等,着眼于课程这个知识载体,对它们之间的关系进行深层次、智能化的挖掘、分析;
(2)数据挖掘的应用会具体到建模、变量筛选和导入等方面,而不只是一些抽象的挖掘算法的研究;
(3)数据分析采用先进的商业智能工具,同样,数据的展现手段基于平台,具有开放化、模块化、网络化特点。
3 系统框架
系统定位于个性化学习分析,其框架结构参见图1,主要由数据集成、数据建模、数据分析及展现等部分构成。具体来说,数据集成模块完成定义数据结构、装载、清洗、合并数据的功能;数据建模是指建立数据分析OLAP及数据挖掘模型;数据分析旨在分析和比较各种不同算法得出的结果,寻找最为匹配的算法,而数据展现的作用是根据分析结构灵活创建数据报告。
图1 系统框架结构
在此架构下,各个子系统的功能如下所述:
(1)数据集成。分析和归纳课程教学过程中产生的系列数据,根据其特征和行为设计及定义便于分析和挖掘的数据结构,然后并进行数据集成。数据集成的工作包括从异构数据源获取数据,将其进行清洗、转换、合并,然后加载到数据仓储中。数据集成执行的时间、相互的顺序、成败对将来的分析结果的有效性则至关重要。
(2)数据建模。典型的数据挖掘工具将在构建了数据仓库后进行分析并生成结果,一些工具也可以使用关系型数据进行分析,数据分析的结果独立于数据仓库中使用的数据。数据挖掘核心的部分就是选择挖掘算法并建立数据模型,这样就可以根据学生个体信息、学生成绩等数据之间的关系将这些学生划分成分析有意义的组群并预测他们的行为;当把这些组发送回分析过程时,数据挖掘引擎允许分析人员和用户根据这些簇进行划分和细化。
(3)数据分析与展示。以学生个体信息和课程数据为输入,利用所筛选出的最佳建模方法,逐步提出一个可实现个性化学习分析的数据模型,以衡量及提高模型预测的准确度。将分析结果以特定的客户端或Web方式进行展现,以建立的分析结果展示平台,具有高度的开放性、通用性和可扩展性。通过建模创建了正确的模型,数据挖掘的重点就从分析转到结果上,数据报告的展现方式有多种,可通过专业的报告工具,也可自行编写Web网站进行。
4 结束语
在高职教育教学研究中运用先进的数据挖掘技术手段,针对各项课程教学、学生管理数据进行深度挖掘、分析,研究个性化学习模式,为学生的自我学习规划提供具体化、智能化分析结果以供参照,在此情况下,先进技术手段的支持,对教与学都有着不可忽视的影响。同时,也为人才培养的探索与尝试提供新途径。
参考文献:
[1]赵云鹏,石丽,刘莹.基于数据挖掘的高校规模分析及应用研究.第九届全国信息获取与处理学术会议论文集[C].2011.
[2].数据挖掘在高职院校教学管理中的应用[J].清远职业技术学院学报,2010(12).
[3]干娟.基于决策树算法的学生综合测评系统的设计[J].安徽电子信息职业技术学院学报,2011(04).
>> 从家庭视角探究中西方文化价值观的差异 动画片《功夫熊猫》中的中西方文化价值观的异同研究 从中西方文化价值观的差异性看公益广告的翻译 中西方文化价值观交融的绝对性与相对性分析 中西方网络广告的文化价值观比较 高中英语中西方文化对学生价值观的影响分析 浅谈中西方文化背景及价值观差异 大学生文化价值观及其班级旅游研究 中西方文化背景下的大学生心理健康教育研究 浅谈大学生外语教学中中西方价值观有效融合途径 《红字》中的西方文化价值观解析 从《当幸福来敲门》看西方文化价值观 《特洛伊》中的西方文化价值观解析 中西方核心价值观比较研究 中西方体育价值观比较研究 浅论大学生文化价值观的培育 大学生文化价值观调查与分析 高等教育模式中的大学生多元文化价值观 浅谈新疆大学生文化价值观教育 大学生文化价值观的培育与优化 常见问题解答 当前所在位置:l.
[3]任友群,郑旭东,吴F瑜.深度推进信息技术与教育的融合创新――《教育信息化“十三五”规划》(2016)解读[J].现代远程教育研究,2016(5):3-9.
[4]杨现民,唐斯斯,李冀红.发展教育大数据:内涵、价值和挑战[J].现代远程教育研究,2016(1):50-61.
[5]余鹏,李艳,吕鹏.高等院校大数据挖掘与决策分析体系的应用研究[J].现代教育技术,2016,26(8):102-108.
[6]朱汉民.中国传统文化导论[M].长沙:湖南大学出版社,2010.
[7]欧阳剑波.中国传统文化、、西方文化碰撞的当代审视[J].青海社会科学,2011(6):17-21.
[8]杨玲.从网络流行语看大众文化特征[D].武汉:华中师范大学,2006.
[9]郭志刚.社会统计分析方法:SPSS软件应用[M].北京:中国人民大学出版社,1999.
[10]安兴茹.我国词频分析法的方法论研究(I)――统计分析要素的界定、分类及问题[J].情报杂志,2016,35(2):75-80.
[11]程树铭,吕亚萍.试论语义特征分析法[J].江苏理工学院学报, 2015(3):25-30.
[12]张敏.数据挖掘技术及应用[J].信息技术,2010,34(8):167-169.
[13]齐英艳,李建国.当代西方思想文化对中国青年知识分子的影响[J].中国青年研究,2008(9):25-30.
[14]闵会轩.中国社交网络中的文化价值观分析[J].东南传播,2015(1):34-36.
(首都师范大学信息工程学院,北京100048)
摘要:智能教学系统是以信息集成技术为核心的开放复杂智能系统,知识构建及Agents行为管理是其核心支撑技术。针对智能教学系统的复杂应用问题,文章阐述非良构领域下智能教学系统面临的挑战,分析非良构领域知识构建及Agents行为管理的研究思路,进而探究数据挖掘技术在非良构领域智能教学系统中的应用。
关键词 :智能教学系统;知识构建;数据挖掘;非良构领域;教学改革
基金项目:市级人才培养模式创新试验项目“通识教育改革‘智能科学’”( 026145302000/034);校级精品课程群建设项目“智能信息处理精品课程群建设”( 026135609700/012);校级青年教学改革项目“结合模式识别课程建设,探索智能人才培养改革模式”( 032145330300/219)。
第一作者简介:刘丽珍,女,教授,研究方向为数据挖掘、知识工程、智能教学系统、文本情感分析、自然语言处理等,znkxjs@126.com。
0 引言
智能教学系统(intelligent tutoring system,ITS)是基于计算机科学、教育学、管理科学等多学科交叉技术的适应性教学系统,是教育技术领域的重要研究方向之一。伴随着人工智能、教育信息技术、管理科学以及网络技术的不断发展,综合多学科交叉技术在教育中的应用已经成为全球范围内的重要研究领域,为ITS的研究与应用提供了新的发展空间。
目前,智能教学系统的研究大都是面向良构领域( well-defined domains)的应用。事实上,客观世界是复杂的,学习任务产生于这个复杂的环境,因此需要解决的往往是非良构领域( ill-defined domains)的问题,如军事、法律、航天、金融、医学诊断、科学研究等领域。面向非良构领域的ITS有广泛的应用空间,探索其关键技术是国家战略发展、国民经济发展及科学技术发展的迫切技术需求,有着重要的现实意义。
1 面向复杂学习环境的创新思维和自主学习能力
“百年大计,教育为本”。我国现代化建设发展必须紧紧依靠科技进步和人民综合素质的提升。教育是社会发展的基石,把教育摆在突出位置有深远的意义。当今世界,科技水平是提高综合国力和国际竞争力的决定性因素。发展文化、科技、教育、军事等事业需要培养大批具有创造性思维的高素质人才。面向非良构领域的ITS旨在改善和提高人类在复杂学习环境中解决问题的创新思维和自主学习能力,提高学习者全面掌握和灵活应用各种知识解决实际问题的能力。由于非良构领域缺乏形式化的、清晰的领域任务模型,领域知识的构建及问题求解等关键技术的研究还处于初级阶段。
自20世纪70年代以来,美国、英国、加拿大、日本等国家都十分重视ITS的研究,并投入了大量的人力和财力进行数学、物理、工程、化学、军事训练等领域的ITS开发与应用研究。20世纪90年代以来,ITS被公认为学术、工业、军事、金融、体育等领域中有效的教学工具。目前,对复杂非良构领域问题的ITS研究与开发一般都可简化为良构问题处理,因此学习者学到的是对良构问题的解决方法。这种局限性会导致所学理论难以应用在实践中,难以满足国民经济发展需求。因此,研究非良构领域ITS中的关键技术已经成为当务之急。
2 非良构领域挑战智能教学系统的研究及应用
当今信息时代,人类学习方式和环境发生了很大变化。如何利用高新技术提高学习效率,在很大程度上取决于对客观世界和学习机制的正确认识。在良构领域中,待解决的问题有明确的领域模型,因此学生对于学习任务所提出的问题可以明确地分辨出答案的对与错。学生通常可采用模式跟踪授导系统(model-tracing tutoring system):①将领域知识转换为一系列学习问题,并提供清晰的问题解决策略;②Agents根据学习者的情况给出在线评价和反馈,并依据明确的答案评估学习效果;③通过问题解决步骤与系统现有领域模型的比较为学习者提供帮助,指导学习者集中在正确的学习路径上。对于非良构领域,由于缺乏形式化的任务模型,知识构建的问题不能有效解决,在正确与错误的答案之间缺乏明晰的界限,只能通过传统的比较法确定哪些是比较合理的答案。无法辨析用户的学习计划是否会进入无法挽回的“陷阱”路径,当然也就无法给出合理的学习评价和正确的反馈建议。当前,国际上在这方面的研究还没有突破性进展,这就给ITS的研究提出了一系列的挑战,主要包括在缺乏清晰的问题、策略和答案的情况下如何形成问题空间( problem space);非良构领域的知识构建与维护;当问题解决模型不确定时,Agents如何为学习者提供指导与反馈;非良构领域ITS中的学习评价;搜索与推理策略;协作学习等。
大量的研究和实验表明:非良构状况的普遍存在严重制约了各类智能教学系统ITS的推广和使用,这一领域也成为ITS研究需要开拓的新领地。当前,在相关学科交叉技术取得丰硕成果的良好形势下,国内外的专家学者已经开始关注并致力于面向非良构领域的ITS研究。适时启动非良构领域ITS中关键技术的研究,将有力地推动ITS进入新的快速发展期,有利于我国在该领域的学术研究中保持国际领先地位。
国外对ITS的研究十分踊跃,相关研究主要集中在大学、军方和研究院,最为活跃的是美国一些知名的大学如Stanford.MIT,Memphis,Carnegie-Mellon等。国内ITS领域的研究起步比较晚,但已经取得了令人瞩目的成绩。
ITS的研究始于20世纪70年代,不同时期的研究及应用侧重点不同,具体情况如图l所示。初期的关注点在具体问题的研究上,如如何进行知识表示和学生模型构建等。到了80年代,关注点是对学习者、教学过程的深入研究,重点集中在学习者的心智特征、自然语言处理、著作工具系统等方面。进入90年代以来,ITS研究更加关注学习者的自主学习,强调系统指导用户提升在虚拟学习情景中灵活解决问题的能力,更加关注学习环境构建及学习计划设计。
近年来,ITS在系统结构设计、模块功能、著作工具等方面的相关理论日趋成熟,相关研究成果主要集中在良构领域,而非良构领域关键技术研究亟待进一步地深入研究和探索。2004年,Loftin等人向美国军方提交的一份研究报告中提出专门针对ITS研究的推荐意见,内容包括ITS研究近年来需要开拓的新领域:增加ITAs( intelligent tutoring agents)及虚拟人的研究;ITS本体( ITS ontology)创建;协作训练的研究与原型开发;面向非良构领域的ITS研究;元认知技能;适应性学习支持系统。
相关研究资料表明,目前国际上ITS已经由基础理论框架及简单功能模块的研究逐步转向复杂领域应用的关键技术研究。例如,自ITS/2006国际会议开始,每届会议都设专题探讨非良构领域ITS研究,并充分肯定和强调其关键技术研究的重要性及发展前景。
3 非良构领域知识构建
认知灵活性理论是由斯皮罗( Spiro,1992)等人提出并倡导的,主要针对复杂或非良构领域中学习的本质问题提出。在建构主义的各种流派中,其横跨了建构和认知两者的边缘特点,为ITS研究提供了最合适的理论模型并得到了国际学术界的认可。
在认知灵活性理论中,领域知识被划分为良构领域知识和非良构领域知识。良构领域知识是指有关某一主题的事实、概念、规则和原理,是以一定的层次结构组织在一起的,只要描述清楚它们之间的相互联系,学习者就很容易掌握,目前国内外大部分ITS成果都是针对良构领域的。非良构领域的知识则是将良构领域的知识应用于具体问题情景时产生的知识,即有关概念应用的知识。非良构领域的知识具有两大特性:①概念的复杂性,知识应用的每一个实例都同时涉及许多概念,这些概念都有其自身复杂性,概念之间存在相互作用与影响;②实例的不规则性,每个实例所涉及概念的数量和种类不同,在实例中的地位、作用以及相互作用的方式也不同。
认知灵活性理论将教学分为初级教学和高级教学两类。初级教学涉及的内容主要是良构领域的知识,只要求学习者掌握一些重要的概念和事实,并在测验中将这些知识按原样再生出来。高级教学要求学习者把握概念的复杂性,并将其广泛而灵活地运用到各个存在差异的不同实例的具体情景中,因而大量涉及非良构领域问题。
传统的ITS大都将非良构问题简化为良构问题处理,因此学习者的学习任务都是在良构环境下进行的,这就导致在应用中理论与实践脱节的问题。事实上,客观世界是一个非常复杂的系统,学习任务也产生于复杂环境中,需要解决的问题大都是非良构领域问题。因为非良构领域的教学任务没有明确的表述,所以在非良构领域中获取这些过程性任务知识是比较困难的,这些非良构问题的复杂性和模糊性导致了Agents多重而有争议的行为和相应的反馈策略。
一直以来,知识构建都被认为是ITS研究的瓶颈,尤其是在非良构领域中,要想清晰地定义领域知识是比较困难的,但非良构领域知识获取的有效性直接影响Agents行为及教学效果。在ITS中,一个指定学习任务的行动选择模型需要由领域专家严格设计和选择约束条件并提供领域知识,才能确定哪些是正确行为,成本相当高。中国科学院计算技术研究所智能信息处理重点实验室的大规模知识处理组提出面向概念的数学知识获取方法,并初步探讨其在数学ITS中的应用,其领域性相对比较强;同时,在医学本体设计方法及知识获取方面也进行了研究和探讨。
目前在ITS中,通常为Agents提供领域知识的方法有专家系统( expert systems)、认知任务分析( cognitive task analysis)和基于约束的建模( constraint-based modeling approaches)等,但这些方法应用于非良构领域时,存在许多问题,具体分析如下:在已有系统中,Agents是通过专家系统的方法获取领域知识,具体为通过一个专门设计的路径计划自动发现学习者的错误操作,用于生成在训练中正确与否的知识,以提供反馈和暗示。这个路径计划可以看做是一个领域专家,而且能够通过计算为学习者提供解决问题的指导方案。应用于非良构领域ITS中的Agents行为管理,必须在程序任务中至少提供两个主要的功能:①为用户提供专家级的指导;②根据不同的认知水平为学习者提供相应的指导。这两个要求是单一的专家系统无法胜任的。
要想获得更加有效的指导,构建一个基于认知任务分析方法的问题空间是必要的,该空间可以获取各种认知水平的用户知识并建模和集成在ITS中。这个方法曾经广泛用于认知型教学( cognitive tutors)设计中。事实上,认知型教学的构建通常依赖于固定的假设,这个假设可以预先确定一个任务模型或问题空间,用于在ITS中描述正确或错误的解决问题路径。另外,认知型教学的著作工具CTAT( cognitive tutor authoring tool)提供了一系列设计Agents任务行为的工具并给出正确与错误的路径系统,这种行为路径系统如同问题空间一样可以跟踪学习者。然而,该方法缺乏学习能力,只能简单地将每个用户解决问题的方法存储并集成为一种结构应用到Agents中。由于系统不能从解决方案中抽取有用的知识来丰富和管理问题空间,因此有明显的局限性。这个在良构领域ITS中运用良好的方法在非良构领域中只能提供受限的局部问题空间,这种静态问题空间难以适应学习者在非良构领域中解决问题的需求。针对给定的学习目标,在非良构领域构建完善的问题空间是一项有挑战性的工作,处理不当可能引起解决方案的组合爆炸。
基于约束的建模方法对于领域专家描述适当和满意的条件是非常困难的,尤其在比较复杂的非良构领域中,该方法针对一个问题有可能会给出过多的条件及可能的解决方案。
4 智能教学系统中Agents行为机制
在ITS中,用户主要通过恰当选择和特别设计问题的解决形式完成学习任务,系统需要有丰富的学习经验并能为学生提供良好的教学服务。基于非良构领域知识本身的特点,ITS通常以“任务驱动”和“问题解决”作为教学和研究活动主线。在这种教学方式下,用户通过个性化的知识经验与学习系统进行交互来完成学习活动,一方面参与自我组织、制订和执行学习计划;另一方面通过Agents获取学习环境的教学指导和系统反馈,进一步选择后继行动步骤,如图2所示。
ITS环境下的Agents通常负责指导用户的学习进程,帮助用户分析解决问题和作出后继学习行为决策,因此Agents必须依赖相关过程性领域知识,才能给出反馈解决方案。在良构领域中,Agents通常基于给定认知结构的情况,根据领域知识事先设计学习计划图解来指导用户的后继学习行为,这是通常意义下的Agents行为机制。非良构领域ITS中的Agents行为机制比较复杂,由于存在概念的复杂性和实例的多样性,应用系统事先设计的解题途径显然是行不通的,需要通过一定的方法抽取非良构领域知识,针对当前具体情景进行个性化重组( assemble)并给出具体反馈策略,辅助和指导用户完成学习任务。
笔者拟采用数据挖掘综合算法,通过不断获取过程性任务知识,进而构建、扩展和管理知识空间,从而使Agents产生不同的行为并在不断地学习中改进系统性能。在国内,首都师范大学设计的虚拟社区智能网络教学平台可以对学习者的状态进行一定的分析推理。北京师范大学开发的Web CLTM( Web Based Cooperative Learning)平台是一个支持协作学习的网络教学支撑平台,设计了3个主要Agent:行为捕获Agent、行为处理Agent和信息反馈Agent,可以在一定程度上实现协作学习指导等功能。在目前已有的系统中,Agents还只能理解学生一些简单行为,与真实交流还存在一定差距,ITS中的Agents行为管理还需要进一步深入探讨。
5 数据挖掘技术在智能教学系统中的应用
国内外研究人员一直试图寻找在ITS环境下能够有效支持学习与训练的技术。多年的研究实践表明,数据挖掘( data mining,DM)技术在教育中最重要的应用领域之一就是ITS。数据挖掘理论形成于20世纪90年代初期,旨在从大型数据集中发现并提取人们感兴趣、未知的、潜在的和有用的知识。由于该技术能够自动分析和发现数据间内在的联系,并从中挖掘潜在的、能够预测和指导教学过程的重要信息,从而建立新的任务模式,帮助用户修正学习计划和完成学习任务。因此,从20世纪90年代起,陆续有研究人员将数据挖掘技术应用于ITS中。Ochi在1998年提出使用数据挖掘技术获取和学习相关知识;Ha.Bay在2000年提出将数据挖掘技术用于挖掘学生的学习路径;Mc Calla在2000年提出将数据挖掘技术用于增量分析学习者行为;Tiffany在2002年提出将数据挖掘技术应用于发现相似学习特征等。此外,基于数据挖掘的技术,Lo等人( 2002)曾尝试通过分析学习者的浏览行为,进而确定学习者的学习风格;Lee等人(2002)借助对网络学习者学习需求、学习行为记录、个性特征等方面的研究,探讨学习者的学习绩效评价方式;Ha等人(2005)详细勾勒将Web挖掘应用于网络远程教育的可能性,并展示在网络远程教育中应用Web挖掘的前景;维也纳大学的Hummel( 2006)通过在线学习平台分析数据库访问记录和Web服务器日志文件、管理学习者的学习行为等。
值得关注的是,2008年第一届教育数据挖掘国际会议( lst International Conference on Educational Data Mining (EDM08))在加拿大的蒙特利尔举行;2009年第二届教学数据挖掘国际会议( 2st International Conference on Educational Data Mining (EDM09))在西班牙科尔多瓦举行。数据挖掘技术在教育领域中的应用研究近年来还一直都活跃在AAAI,AIED,EC-TEL,ICALT,ITS,UM等重要国际会议中,在世界范围内进一步奠定和明确了数据挖掘技术在教育领域的重要地位、研究潜力和应用前景。
国外数据挖掘技术在ITS中的应用中,提出利用统计分析方法,通过学习者对解决问题方法的论证形成图解,并依此聚类学习者及对应的解题计划,形成领域知识库指导其他用户完成学习任务。由于非良构领域的复杂性,从单一视角提出的每一个单独的观点都可能是不充分的。只有超越单一概念维度的多维知识表征,才能完成非良构领域知识的构建。因此,仅采用聚类挖掘算法难以深入挖掘学习者学习行为的潜在模式。
6 结语
尽管在过去的几十年中,ITS领域已有相当丰硕的研究成果,提出了分类学习者特性、推理机制、认知评价、个性化导航等基础理论和方法,但这些理论应用在非良构领域还存在一些缺陷与不足,主要表现在:①基于良构领域的知识对用户的学习评价纳入自身的概念框架,因此Agents无法发现和正确判断用户的个性化学习需求;②识别所有可能的解决方案需要基于明确的任务模型;③模式跟踪只适应于良构领域的过程性教学等。
目前关于这一课题的研究还处于初期的探索阶段,需要在关键技术方面进行更具创新性和有突破性的研究工作才能形成成熟的应用技术。需要指出的是,只有面向非良构领域的ITS研究取得实质性进展,ITS才能真正广泛应用于客观世界的各个领域,灵活、全面地发挥作用。在目前各相关学科核心技术已取得重要成果的基础上,在国内外对非良构领域的ITS应用研究日渐重视的背景下,启动并推进关键支撑技术的研究是必要而迫切的。
参考文献:
[1]赵建华.ITS概述[J]中国电化教育,2007(7): 5-12.
[2] Mymic L.Outstanding research issues in intelligent tutoring systems[EB/OL]./whqlibdoc.who.int/hq/pre- wholis/ PUB 5. pdf.
[3] Loftin,R,Kenney P,Mastaglio T.Outstanding research issues in intelligent tutoring systems[EB/OL]./ mymicsurveys,com/site/files/pub_4.pdf.
[4]李红关.认知灵活性理论与基于网络的研究性学习[J].中国远程教育,2003: 22-24.
随着信息技术、多媒体技术、电子商务及电子支付的不断发展,信息技术在教学中的应用越来越广泛,出现了各种各样的网络教育平台[1]。在网络教育平台快速发展的同时,积累了很多数据,如用户基本注册信息、考试成绩、访问日志信息等,现阶段已有的数据并没有发挥其真正的价值。利用数据挖掘技术来探索这些数据背后所隐藏的信息,成为近期很热门的研究方向。
人们往往都希望在事情发生之前,能够预测到结果,预测学也因此显得神秘而玄妙。数据挖掘技术的出现,使得预测过程不再神秘,而更具有科学性。很多因素表面上看起来和结果不存在任何联系,但数据挖掘的结果却证明他们之间存在某种联系。
2.数据挖掘技术在网络教育领域中的研究现状和意义
从网络教育平台学习者个人的现实需求来看,如果能够在考试之前阶段性地进行成绩预测,并得到有针对性的学习建议,从而阶段性地调整学习方法,以备考试。而不是在考试之后才得到自己的成绩分析情况。
网络教育平台作为电子商务中的B2C服务企业,属于垂直网络结构。作为B方,为客户C方提供内容和服务。但是当前的网络教育平台多数都是以提供内容为主,如课程培训、考试培训、职称培训等,这些平台提供的内容比较相似,教学模式单一,教学资源简单堆积,若能提供个性化、智能化服务,平台则可以凭借差异化的战略领先竞争对手。成绩预测功能是智能化服务的一个部分,根据成绩预测的结果,为C方提供针对其个人的个性化辅导,提供相关增值服务,以此达到锁定用户及吸引更多用户的目的。目前主流的几大网络教育培训平台,如聚英东方、新东方在线、中华会计网等都还停留在内容提供商,没有进入到服务提供商阶段。
提供个性化、智能化服务,实现成绩预测功能,不仅是C方学习者个人的需求,也是B方网络教育平台实行差异化战略、提升竞争力、获取新的经济增长点的一个需求。
随着信息技术和互联网的发展,展现在人们面前的是浩瀚无垠的信息海洋,激增的数据背后隐藏着许多重要信息,人们希望能对这些数据进行更深入的分析,来利用好这些数据。当前使用的数据库系统可以高效地实现数据的录入、查询、统计等功能,但是无法发现数据之间存在的关系和规则,无法根据现有的数据来预测未来的发展趋势,缺乏挖掘数据背后隐藏的知识的方法和工具,使之产生“数据爆炸但知识贫乏”的现象,数据挖掘技术便应运而生。
数据挖掘是指从数据库或其他信息库中大量的不完全、有噪声、模糊、随机的实际应用数据中,提取隐含的、人们事先不知道但又潜在有用,并且最终可理解的信息和知识的过程,它与数据库中的知识发现(Knowledge Discover-Database,KDD)密切相关[2]。
从教学信息技术角度来看,数据挖掘是一种崭新的教学信息处理技术,它的主要作用是对教学数据库中的大量数据抽取、转换、分析和其它模型化处理,从中提取出辅助教学决策的重要数据。
在网络教育平台运营的过程中,积累了大量的学习者信息的数据,但是目前教育工作者们并没有对这些数据进行充分地利用。数据挖掘技术在网络教育平台的应用还处于方法研究的阶段上,利用数据挖掘技术来提供课程的个性化推荐、成绩分析、提供个性化辅导等,使得学习者能够快速有效地找到适合自己的学习资料,制定自己的学习计划,也为网络教育平台锁定用户提供了途径。
3.考试系统中成绩预测的重要性
通过对学习者的学习成绩进行分析处理,可以及时得到学习者的评价结果,对学习者出现的不良学习行为进行及时指正,以使学习者及时地调整和改进自己的学习[3]。
【关键词】教学质量;数据仓库;成绩管理
一、学生成绩管理的现状
随着高校办学规模的不断扩大以及学校专业的不断增多,均使得学校的教育管理工作变得越来越复杂化,越来越难管理,特别是针对学生成绩信息的管理,由于学生的倍增,成绩的管理与维护工作更是艰难。做好成绩管理工作,对学校的发展拥有特定的实际意义,也是各个学校最为关心并且要迫切解决的重要问题,所以随着学校对成绩信息资源利用要求的提高,原本的成绩管理模式已经不能够再满足学校的实际应用需求,只有设计更为有用的,能够挖掘出学生成绩价值信息中隐藏的价值,才是最符合学校应用的应用系统。
二、学生成绩管理的作用
在高等学校的发展过程中,教学质量,一直都是各个高校最为关注的重点问题,而学生的成绩是各个学校教学质量优劣的一个最重要的体现,因此,如何促进学校全体学生更好的提升学习成绩,关系到学校的长远发展计划,而对学生的成绩管理分析工作,是一个系统化的工作,所以通过对学生成绩的综合分析,明确学生在学习过程中的不足,有针对性的为学生解决学习上的困难,提升学生的整体综合素质与学习成绩,不管是对学校还是生活个人都拥有非常重要的积极促进作用。
三、数据挖掘技术成绩管理分析
数据挖掘技术在成绩管理中的应用,主要体现在学生成绩分析、考试题目优化、教学评价、教学方式选择以及课程的合理设置等几个方面。
(一)学生成绩分析。学生的主要任务就是学习,学习成绩也是学生在校期间表现优劣与否的最直观的体现,也是学生在校期间所学知识掌握程度的最直观的表现方式,所以对学生提供一个全面客观的评价,是学校应该拥有的责任,也是对学生最好的关爱表现方式,然而在学校的成绩管理工作进行时,通常的做法只是简单的把学生的考试成绩录入到学校的系统软件,而通过数据挖掘技术对学生成绩进行分析之后,可以充分的找出学生成绩优劣与否与学生自身、与学校环境以及教师的教学质量之间的关系,进而为更客观的评价学生成绩的高低是学生自身原因造成的还是与学校有直接的关联,为进一步的更好的学习计划的制订提供了理论依据。
(二)考试题目优化。考试的目的是为了更好的检验教师的教学效果以及学生的学习成果,是教学过程中一个重要的阶段。学校在教学时,通常是以期末考试成绩为评价学生的学期成绩的一个重要标准,然而在不同的考试教学下,学生的考试成绩是不相同的,如果仅仅以成绩评定一个教师或者学生是不客观的,为了更好的评定教学效果及学生学习的成果就要发掘学生成绩高低相关的影响,是试题较难还是教师教学方式的问题,因此就需要对这些因素进行分析,以探索更为有效的方法来评价试题的难易与成绩的关系,进而为下次试卷的出题提供帮助。
(三)教学评价。评定学生对新接触事物理解及掌握程度是教育工作者的一个重要职责,通过对学生学习成绩的评定,可以触发学生的学习动力,也是考查学生真实水平的一种比较有效的方式。在学生成绩评价时,教师也要注意评价内容要客观全面、评价方式多样并注重自评与互评的结果,获取成绩评价数据才是最可靠有效的。针对学校不同学生的不同成绩评价数据,可以利用数据挖掘工具,对这些数据进行挖掘分析,通过工具获取不同学生最终的成绩结果,进而可以更客观的排除人为因素对学生评价的影响,也可以对学生的不足及时给予及时指正改正,不但减轻了教师的工作量还克服了教师主观评价给学生造成的不利影响,为更好的营造学习氛围以及学生之间的关系提升提供了很大帮助。
(四)教学方法选择。不同的教师在教授课程时因为人员之间的差异,使用的教学方式也互不相同,也因此导致了学生考试成绩可能也互不相同,为了消除因教师教学方式差异给学生成绩造成的危害,就需要对不同教师教学模式下学生的成绩信息进行分析,以选择更优的教学方式实现对学生的教学,学生成绩数据挖掘技术的应用正好可以满足这一要求,通过对不同教学方式下学生成绩差异的研究,可以协助教育工作者更好的判别采取何种教学方式对学生学习才更有帮助,进而提高学生的整体学习水平。
(五)课程合理设置。许多课程之间往往还存在着一定的关联关系,拥有固定的先后顺序,只有把前修课程学习完成之后才可以继续接下来的课程学习,否则会直接影响后续课程的理解与接受,影响学生的正常学习;在高等学校,通过对成绩数据价值信息的挖掘,可以利用学校成绩数据库中存放的历届学生各科考试成绩信息结合数据挖掘的相关技术进行分析,并通过相关的数据挖掘算法分析这些数据信息中隐藏的潜在的影响学生学习的价值信息,最终找出影响学生考试成绩的原因,并根据这些原因制订出相应合理的课程安排计划,为学生更好的学生服。
(六)学生特征挖掘。通过成绩与环境因素的影响数据挖掘的研究,教师可以很好的掌握每个学生的学习状况,学生个人特征,并根据学生之间的不同差异,因材施教,最终把学生往更好的学习发展方向引导。为了更好的研究这一关系,可以利用数据挖掘工具,对学生学习成绩数据进行挖掘分析,通过挖掘工具的分析,不但可以获取不同学生最终的成绩结果,而且可以更客观的排除人为因素对学生评价的影响,最终对学生的不足及时给予及时校正,不但减轻了教师的工作量还克服了教师主观评价给学生造成的不利影响,为更好的营造学习氛围以及学生之间的关系提升提供了很大帮助。
参考文献:
[1]张兴科,王浩. 通过数据挖掘技术预测学生学习成绩[J]. 科技信息(科学教研), 2007,(22) :198-206.
[2]李雪燕.数据挖掘在高校成绩管理中的研究和应用[J].计算机与数字工程,2011,(07):267-278.
1数据挖掘的含义
数据挖掘,英语为“DataMining”,意为从海量的不完整的辨识度不清晰的人类使用信息中,找到其中人们不能一眼发现但是有助于人们需求的那部分信息。由此可见,数据挖掘是一种数据整理和分析的过程。数据挖掘作为一种高等信息手段,包涵了许多学科,它将以往的基本信息转化为高级信息并进行分类加以搜索,从大量的信息数据中,找到所需要的来辅助决策。其中,信息库、自动化、逻辑领域它都有所涉及和运用。传统的信息整理系统,只是简单的信息整合与分类,不存在搜索功能。相对于此,数据挖掘的优势在于提取、整合、筛选三者合一,大量的节省了人们的时间,提高了办事效率。一般来说,数据挖掘的过程可以概括为:数据清理、数据收集、数据选择、数据变换、数据挖掘、数据评估、知识表现这七大步骤。
2数据挖掘方法在计算机教学中的运用
2.1数据挖掘与教学质量评价
传统的教学模式下,要了解学生对于老师教学的满意程度,通常会采取两种方式:其一,面对面谈话;其二,通过填写意见表或反馈表。这两种方式都存在一个明显的弊端,学生与老师的接触过于直接,这样的模式下,很多学生不敢正面表达对老师的意见。对于计算机这门新学科来说,学生对于它的陌生度很高,如果老师的教学质量不能得到保证,学生也无法获取到有用的知识。随着信息技术在新兴教学系统的运用,数据挖掘被利用到了教学质量评价之中,计算机的教学评价也被纳入其中。通过建立教育质量评价系统的方式,让学生充分放心的提出教学意见或建议,能够对教师的综合教学水平进行公正的评价,极大程度上提高了教学质量。对于计算机教学这种新型学科来说,能提高学生对于学科的正确认识,端正学习态度。
2.2数据挖掘与计算机考核
传统的考试以试卷为主,试卷的批改则以老师为主。而数据挖掘运用于计算机考试之中,考试的模式从纸质试卷,变成了计算机的模拟操作。从学生的操作答题到学生最后试卷的得分上进行综合性的分析,能够有效的发现学生在计算机学习中存在的不足之处。不仅很大程度上减轻了老师的压力,而且计算机批改更为标准化,相对来说会给人更公正的感觉,避免了学生的不悦情绪。数据挖掘运用到计算机考核中,能够清楚地了解到学生在教学上的需求,从而再结合教学质量评估中,学生对于老师的教学要求。可以提高教学质量,推动学生对于计算机学习在总体学习。
2.2数据挖掘与学生兴趣和教学
数据挖掘通过对聚类分析法的运用,可以将学生按照兴趣分为多个类别,引导老师在教学中,针对性教学,以提高教学的质量。数据聚类是数据挖掘中的一个分类,是指对于静态数据分析的一门技术。它是把相似的对象通过静态分类的方法区分出不同的组别或者多个子集,而存在于一个子集或组别的对象都会有相似的属性。通过应用这种数据挖掘的技术,可以分析出大学生对计算机的学习兴趣。大致可分为三类:第一类,接触计算机较少,在日常生活中遇到的问题也极少会用计算机来解决,所以这类学生不会对计算机的学习有多大的兴趣。第二类,对计算机的接触频率不高,但是他们对计算机的认知正确并表示接受,采用分组学习时也不会有什么意见。第三类,接触计算机比较频繁,对其有着浓厚的兴趣甚至是依赖心理,这类人在计算机的学习上会充分发挥自己的主观能动性,积极的找资料,问老师,通过自学能基本满足大学生计算机基础知识的学习。由此可见,数据挖掘方法下分析出来,学校有必要改进现有的计算机授课方式。
2.3网络教学系统的引入
任何一门课程都是一个庞大的知识系统,对于学生的学习,多半知识基础理论知识的教学,在这个层面上来说,我们在教学活动中要注意要难点的掌握。要点时,老师一般会花较多的时间去分析,去深入,而面对有的知识,通常会一笔带过。这样的差距,对于某些好学的学生来说,会相当难以接受。在计算机的教学上,引入网络教学系统,赋予学生满足自身知识需求的一个通道,网络实际就是一个巨大信息库,里面有各种的知识,学生可以通过网络去学习自己想要了解但是老师并未给出详细教学的知识。而这种网络教学系统实际上就是数据挖掘的网络表现形式,由此可见,数据挖掘形式被多方运用于计算机教学之中。
2.3数据挖掘与计算机学习状况
计算机学习状况是计算机教学中老师们最为关注的问题。传统对学习状况的了解是日常老师的观察加上考试成绩的分析,从而得出一个学生对于计算机学习的优良问题。而在数据时代今天,学生评测系统已经出现,它也是利用了数据挖掘的原理,所创建的一种符合当下教学需求的软件。通过对学生考试答题的情况进行分析,了解到学生对应的知识漏洞,可以反映出学生对于知识点的掌握情况,同时,这样的方式不掺杂人的感情因素,会更为客观。虽然老师的观察能力不可置否,但是,长期的教学活动会让他们的情绪有偏颇,难免出现评判学生有失公正的现象。计算机评估学生的学习情况,还可以制定出对应的学习计划,生成复习方案。在测验完毕后,可以将所有的信息都发给学生,让其自身去补充自己的不足。对于教师教学,学生学习都有很大的帮助。
3数据挖掘对于计算机教学的意义
数据挖掘是一种很是独特的信息整理方法,在将数据挖掘运用于计算机教学的过程中,从微观上来说,数据挖掘运用于计算机教学,有助于改善计算机教学的现状,帮助教师分析自己在教学方式上存在的不足,帮助学生分析自己在学习过程中存在的缺失,推动计算机整个学科了解计算机教学对于社会的意义,以及什么样的教学内容才是对实践有用;从宏观上来说,这实际上是数据挖掘与计算机相结合的一个过程。有助于教育系统的强化和完善,从教学质量评价到学习质量评估,都是在分析教与学两个过程中的不足,并以更为科学严谨的方式,给教学活动制定合适的方案,用实践的方式帮助学生了解计算机学习的意义,推动学生的计算机学习。
4结束语
Abstract: This paper introduces the knowledge and wide application of web data mining, deeply analyzes and talks about the relative mining application among students, teachers and schools, which is the main subject of web data mining and network education, it plays an important role for improving the network education and deciding level of university, making a modern and digital studying environment.
关键词: Web数据挖掘;网络教育
Key words: Web Data Mining;Network Education
中图分类号:TP393文献标识码:A文章编号:1006-4311(2011)11-0182-02
0引言
随着互联网络的飞速发展,高等教育的教育教学模式逐渐从传统的、单一的课堂教育模式向Internet的网络教育模式发展。网络教学拥有传统教学模式所不具有的优势,突破了时间和空间上的固定限制,充分利用现代多媒体技术与网络技术,将教师、学生和计算机这三者融为一体,共享学习资源、规划学习进度,最后完成学位论文等。网络教育已成为各高校必不可少的教学手段,是高校改革教学方法、优化教学过程、实施素质教育的必然结果。
1网络教育的现状与存在问题
从1999年起,我国教育部就开始大力发展网络教育,随着近年互联网技术的快速发展,网络教育已成为当今教育发展的新生长点和现代教育技术主流的发展方向。目前,很多高校都建有自己远程网络教学站点,其中以高校精品课程网站为代表的教学网站建设对于提高高等学校人才培养质量,改进学校育人环境,激发师生工作学习的积极性和创造性,有着重要的作用。然而当前的网络教育也存在一些问题,比如,教学模式单一,教学资源简单堆积,智能化程度低,访问量少利用率低等。而接受教育的对象上也存在一定差异,学习能力高低、个人兴趣和爱好不同、学习基础程度不同。因此,网络教育平台不能充分的考虑到每个学生的需求,导致学生在网上无所适从,盲目漫游,既浪费了时间还达不到良好的学习效果。因此,网络教育迫切需要一个完善的技术手段与先进的教学思想理念,来达到帮助学生快速有效地寻找到自己所需要的教学资源的目的,并对其学习进程有个准确的指导和合理的评价。
2面向Web的数据挖掘技术
Internet快速普及与Web技术的迅猛发展,使得网上大量数据涌现,海量信息充塞互联网,用户已很难从中提取到有用信息,Web数据挖掘技术因此产生。
2.1 数据挖掘概述数据挖掘,Data Mining就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
2.2 Web数据挖掘技术Web数据挖掘是指从万维网中相关的资源和用户浏览行为中抽取感兴趣的,有用的模式和隐含的信息。这种定义受到了数据挖掘领域的普遍认同。
Web挖掘按照挖掘的对象不同可分为三类:Web内容挖掘、Web 结构挖掘和Web使用记录挖掘。
Web挖掘主要涉及四个过程:数据收集、数据选择和预处理、模式发现、模式分析。
Web数据挖掘中常用的技术有路径分析技术、关联规则、序列模式、聚类分类技术等。
最初的Web挖掘是在电子商务上得到快速崛起,网上交易瞬息万便,竞争激烈,网站每天都可能有上百万次的在线交易,生成大量的日志文件,如何对这些数据进行分析和挖掘,充分了解客户的喜好、购买模式,设计出满足于不同客户群体需要的个性化网站,进而增加其竞争力。如:当您首次登录淘宝网(TaoBao),网站会记录下您搜索过的宝贝(商品),等您再次登录网站后,在网站的首页会显示出你可能喜欢的宝贝列表及别人浏览过的宝贝对您来说可能会有潜在兴趣的宝贝,为客户提供更智能化的服务。
3Web数据挖掘技术在网络教育中的应用
Web数据挖掘技术在各领域的应用非常广泛,只要其具有分析价值与需求的数据仓储或数据库,皆可利用DM工具进行挖掘分析。一般较常见的应用案例多发生在零售业、财务金融保险、通讯业等。比如,在销售数据中发掘顾客的消费习惯,由交易纪录找出顾客偏好产品的组合,同样Web挖掘在网络教育中也能发挥其作用。
3.1 对学生的学习过程进行挖掘网络教学的主要对象是学生,只要学生在教学网站上登录过,就会留下大量的信息可以利用(如用户注册信息,页面点击率等)。对学生访问情况进行跟踪,可以了解到学生出勤情况。对学生年龄性别进行分析,可以了解学生的组成结构,能合理地安排课程设置。然后,对网上考试系统中的成绩数据进行挖掘,以不同的角度或不同的层次上采掘出一系列的统计结果,如分布情况、关系,对比、显著性检验等,采掘结果用交叉表,特征规则,关联规则,统计的曲线、图表等表示形式提供给教师,以使教师能充分利用学生的问题资源,从而提高教学质量。最后,在网上对学生的学习过程进行挖掘,得出一个对学生整个学习行为的评价,一般采用模糊综合评判及模糊聚类的方法,对评价结果采用了对定性和定量指标加权平均算出综合素质评价得分并排名的方法,而且由于学生综合素质的评价指标是动态变化的,往往选用动态聚类法对评判结果进行动态聚类分析。评定学生的学习行为,既对学生起到信息反馈和激发学习动机的作用,又是检查课程计划、教学程序以至教学目的的手段,也是考查学生个别差异,便于因材施教的途径。利用Web数据挖掘技术对这些信息资源进行挖掘,了解学生的学习情况、需求、能力、进度、兴趣等,使学生能及时调整学习计划,更好的掌握所学知识。
3.2 对教师的教学情况进行挖掘对教师的教学情况进行挖掘,主要表现在教师的教学评价。首先,教学评价可以通过网上教师测评系统收集学生或其它教师对任课教师所讲授课程的意见和评价。有关学生座谈意见、学生打分评价、平时各项教学检查、相应课程期末考试班级成绩汇总等都是教学评价的内容,把这些数据要作为教师教授相应课程的档案数据全部存入数据库。利用数据挖掘对数据库中有关教学的各项评价进行分析处理,可以确定教师的教学内容的范围和深度是否合适,选择的教学媒体是否适合所选的教学内容和教学对象,讲解的时间是否恰到好处,教学策略是否得当等。从而可以及时的将挖掘出的规则信息反馈给教师,以期更好地提高其教学水平,更好地服务于学生。
3.3 对教学管理的挖掘首先,学生的课程学习应遵循先基础后专业,先易后难的原则,利用网上教学数据库中存放的历届学生各门学科的考试成绩,结合数据挖掘的关联分析与时间序列分析等相关功能,就能从这些海量数据中挖掘出有用的信息,帮助分析这些数据之间的相关性、回归性等,得出一些具有价值的规则和信息,能对课程设置做出合理安排。其次,学校教学管理部门可以选择人工或智能组卷方式生成远程网上考试试卷,学生进行在线考试或测验。学生的考卷经系统自动评分后存入成绩库,学校直接获得各类统计分析成绩的信息。
4结束语
目前网络教学系统存在许多问题,通过WEB数据挖掘技术将学生感兴趣的潜在的有用模式和隐藏的信息从网络教育中提取出来,为学生提供更全面的教学服务,协助管理者优化站点结构,使教学组织更加合理规范,提高网络教学资源的访问效率,以及改进教学管理,提升高校的网络教育管理与决策水平,为师生们营造一个现代化的、数字化教学与学习环境。
参考文献:
[1]惠向晖,王亚伟,苏克勤,韩珂.浅谈数据挖掘技术及其在高等学校教学中的应用.光盘技术,2007.
[2]刘法伦,徐钰.数据挖掘技术在教学评价上的应用.科技信息,2009.
[3]谢英香.浅谈Web信息挖掘技术在网络教育中的应用.摘自网络.
[4]韩家炜.数据挖掘概念与技术.2000.
关键词:数据挖掘;远程教育;WEB日志;网络教学平台
中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)03-0534-02
Application of Network Teaching Decision Support Platform Based on Data Mining
CAO Zhi-yong1, LU Han-yu2
(1.Department of Science and Technology, Guizhou Radio & TV University, Guiyang 550004, China; 2.Department of Computer and In? formation Engineering, Guizhou University, Guiyang 550003, China)
Abstract: For modern distance education, educational differences in personality characteristics of the object with the traditional mode of distance education resources produced great unity of contradictory problems. Combination of data mining technology, design technology, based on data mining decision support network teaching platform, the platform provides network teaching platform, in addition to basic functions, but also by data mining analysis of server log data, and analysis of the form of graphic interface results of user feedback, and then implement the restructuring of the site and the student’s personalized service.
Key words: data mining; distance education; WEB log; network teaching platform
随着计算机和互联网的应用发展,现代远程教学平台的缺陷日益突出。依据传统的学习理论设计的网络教学平台难以适应现代远程教育的需要。如:缺乏个性化、网站结构不合理等。网络教学作为一种新型的教学手段,由于其时空不限、资源共享和交互性好等优点,较好的增强了学生的学习兴趣,提高了学生的自学能力,培养了学生的学习主动性,为此笔者开发了基于数据挖掘的网络教学决策支持平台。
1数据挖掘
数据挖掘(Data Mining,DM)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取潜在的、不为人知的有用信息、模式和趋势。通俗地说,数据挖掘就是从数据中发掘信息或知识,又称为数据库中的知识发现(Knowledge Discover in Database,KDD)。
数据挖掘技术应用于Internet,于是有了Web数据挖掘,根据数据挖掘的过程,常常把Web挖掘的分为4个基本步骤:数据收集、数据预处理、模式识别、模式分析。
1)数据的收集:在网络教育平台上,有大量的信息可以利用(如用户的访问日志、注册信息、答疑信息、考试成绩、作业情况、交流信息和学习进度等)。根据挖掘的目的明确收集学习者什么样的数据。
2)数据预处理:这保证数据挖掘质量的关键,主要包括进行冗余数据的清除,以及对错误数据和缺失数据的修复,将其转化成适合模式发现的、具有良好格式的数据抽象。对日志中的原始数据进行预处理,包括数据净化、用户识别、会话识别和路径补充等。
3)模式识别:是对预处理后的数据用数据挖掘算法来分析数据。首先确定挖掘的目的是进行分类、聚类、关联规则发现等,确定了任务再决定使用的挖掘算法。
4)模式分析:解释并评估结果,对数据挖掘得到的知识结果进行分析,清除无用或错误的知识,将感兴趣的规则、模式,以图形界面的方式提供给使用者。
2网络教学决策支持平台的模型构建
网络决策支持教学平台由于不受时间和空间限制的优越性,如今越来越受到广大师生的欢迎。图1为笔者开发的网络教学决策支持平台模型,平台按照功能分解分为学生平台、教师平台、个性化处理中心、学习调度系统四个模块,具体模块功能如下:
2.1学生平台模块
首先,获取学习者的基本状况、学习现状,以判断学生的学习特征。其次,系统设计有实时监控学习者行为的功能,通过跟踪采 集子系统进行学习数据的采集,如学生当前所学知识点,在页面停留时间,练习与测试成绩等。这些数据可以通过web服务器、客户端以及服务器来获取。最后,呈现由学习调度系统所推荐的学习内容。
2.2教师平台模块
主要提供教学资源库管理界面。教师既可以利用“课程资料管理”,在线编辑相关课程的基本信息,也可上传资源,平台支持PPT、DOC、PDF等文件类型。教师可以利用“在线考试管理”管理试题库,随机抽题组卷,系统可自动对学生答题情况进行评分,教师可利用论坛管理来管理论坛的帖子。
2.3个性化处理中心模块
个性化处理中心是一个数据挖掘引擎,是个性化智能学习系统中的核心。主要完成两个工作:其一是学习者特征库的构建。结合最新采集的信息与学习者特征库中的数据资源进行新的分析,建立和完善学习者特征库;其二是分析处理模块。应用频繁模式挖掘、分类和聚类技术、序列模式等数据挖掘算法,来处理“消噪”后的数据,最终发现用户的访问模式。
2
.4学习调度系统模块
学习调度系统是根据个性分析处理中心处理后的个性参数来调度其它子系统,并选择合适的教学资源,并将页面反馈给用户以满足其需求;同时,把用户在子系统中的个性活动信息反馈给个性化分析中心,然后由个性分析中心进行再加工,来更新学习者特征库。
图1基于数据挖掘的网络教学决策支持平台模型
3基于数据挖掘的网络教学决策支持平台
笔者设计开发的基于数据挖掘技术的网络教学决策支持平台。平台的教学功能主要有:课程创建与管理、课程资源、互动评价、在线测试、作业和练习及学习记录跟踪分析等。该平台为教师、学生提供了强大的施教和学习的网上虚拟环境,成为师生沟通的桥梁。
3.1系统登录与注册
登陆平台的主要有三种身份:系统管理员、教师、学生。系统管理员:主要负责修改系统配置,维护课程,用户信息,可根据学校的根据实际情况设定、添加、管理用户。教师:管理教学、组织教学内容、编辑课件、在线考试、审批作业、组织在线答疑、统计分析学生学习情况等。学生:选修课程、安排学习计划、查看课程内容、提交作业、参加在线测试、查看学习成绩、协作学习和交流、参与学校社团交流等。
3.2课程管理
教学资源是网络教学平台中的重要部分,资源的种类以及展现方式,很大程度上决定了平台的质量。教师负责自己的课程内容的建设、开展教学。平台支持任何电子文档、Word、PowerPoint、图片、音频、视频等。
3.3作业管理
布置一个任务,学生可以上载合乎要求的文件。作业有三种类型:1)要求学生上载一个文件:教师布置作业,指明交作业的最后日期,然后学生提交一个文件,作业内容在这个文件中;2)离线项目,不提交文件;3)在线文本,这类作业让学生在线编辑文本提交。
3.4测试管理
测验模块允许教师设计、编制测验,包括选择题、是非题、匹配题和简答题,可以生成试题库,今后,教师出题测试就可以直接由题库产生,题目可以随机选题,随机排序,题库的建立,可以手工录入,也可以文件导入的方式进行。
3.5 BBS讨论
平台同时为用户提供BBS交流工具,增强学习效果。通过BBS讨论,可以实时或非实时与学生交流,打破了空间和时间的限制。
3.6数据挖掘功能
统计分析是数据挖掘最基本的技术,通过对采集并存储到数据库中的数据进行加工处理,提供图形化界面实现对学生在线学习行为的实时统计分析。我们的平台通过对Web服务器日志数据进行统计分析。
3.7对学生的学习过程进行评价
平台设置有全面的跟踪和日志功能,对每一个学生学习过程的每个细节、行为和操作,包括访问课程的次数、学习者参与的程度、停留的时间、参与讨论的情况等进行全程跟踪,从而实现对学生学习过程的评价。
4结束语
笔者开发的网络教学决策支持系统已经与计算机应用基础课程集成在一起,并在贵州电大的测试服务器上,通过对网络决策支持系统和电大在线的比较研究可以看出,网络决策支持系统平台的优点主要在于强调远程教育的网络学习过程;加强了教师与学生、学生与学生或学生与资源的互动;突出了网络学习的环境建设,加强了个性化学习的支持;优化了网站的结构。同时借助数据挖掘技术,对学生大量的评教数据进行处理,提高教学评价的效率,为教师和教学管理部门提供决策支持。
参考文献:
[1] Hand D,Maunila H.数据挖掘原理[M].张银奎,译.北京:机械工业出版社,2003.
[2]张峰.基于数据挖掘技术的教学管理应用研究[D].合肥:合肥工业大学,2011.
[3]贾丽媛.数据挖掘在网络教学平台中的应用[J].湖南城市学院学报,2011,20(2):63-65.
关键词:大数据;学习分析;教育模式
在线学习系统中包含了大量与学习者学习行为相关的数据,例如,学习日志、学习途径、学习成果数据、课程数据、学习管理数据等。充分集中整合这些大数据,再对学习过程和学习效果进行评价分析,更有效地支持学习,优化教学服务,为教学管理与决策提供依据已成为远程教育工作者面临的重大课题。
一、目前远程教育存在的问题
远程教育中学生可以随时随地利用网络进行课程学习,不受时间和空间的限制,但同时也存在一些问题,例如:
1.评价数据单一化。
教师通常采用总结性评价对学习者的学习过程进行评价,如利用课后作业、论文、测验、出勤情况等评价数据。
2.评价方法静态化
目前评价方法采集的数据是静态的,缺乏对学习过程进行实时监测,不能实现动态的反馈,不能准确反映学习者的参与程度。
3.评价的真实性难以把握
对于一些视频课程的学习,很难判断出学习者是认真参与学习还是开着视频人却离开,而对于课后测验与作业是否独立完成也很难保证。
利用上述方法考核、分析和评估远程教育,教师既不能实时把握学习者真实的学习情况,也无法确定学生个体的学习方式、认知习惯和学习兴趣。学生也无法对自身学习效果有一个客观而明晰的认识,不能较好地制订下一步的学习计划。
二、学习分析的特征
学习分析技术是运用数据挖掘、信息可视化等智能技术来分析学习系统产生的数据,并利用分析结果提供恰当的干预、评估,其主要目的是优化学习过程,促进学习。学习分析技术具有以下特征:
1.复合化的数据采集
多样化的数据为自动化的学习支持和针对性的学习服务提供了可能性。学习分析技术采集的数据来源:一是由学习管理系统、移动终端、社会性软件中所记录的学生的学习行为数据;二是内容管理系统中的学习记录数据;三是学生学习成果数据,如作业、作品。这些不同来源的多样性数据通过第三方分析软件整合并导入到同一个分析框架中,就可得出学生学习情况的分析结果。
2.多角度的分析技术
要进行有效的分析,必须使用多种研究方法、技术与工具。学习分析技术应从网络交互、交流内容、交互内容等多个角度展开,并对数据进行挖掘、聚合、分析,结合定量研究与定性研究的数据为学习提供支持。
3.可视化的分析结果
通过可视化分析结果,使学生对学习状况、教师对教学情况有直观地了解,并作出有效的判断和分析。
4.多层次的服务对象
学习分析技术从教师、学生以及管理者的角度对学生的学习过程进行客观的预测,方便教师优化教学,改进过程评价手段,帮助学生进行自我评价、自我诊断,给教育机构和管理者提供决策依据。
三、基于学习分析技术的远程学习系统模型
学习分析技术利用数据分析探究学习过程的发生机制,改进学习,这一过程包含了数据的选择、获取、综合与报告、预测、使用、完善和分享等活动。因此需要基于学习分析技术初步规划学习系统运行的步骤。第一步,学习者结合自身兴趣和系统推荐,选取学习内容;第二步,系统记录下学生者产生的学习数据,结构先定义好再存入数据库;第三步,对预测模块进行分析,在采集学习者行为数据的基础上,与学习者的特征信息相结合,利用分析工具及模型对预测模块进行分析;第四步,在参照上一步预测模块预测结果的基础上,利用数据挖掘技术为学生推荐适合学生学习特征的学习策略及指导方法;第五步,可以利用可视化的形式将上述数据挖掘结果、分析结果传递给学生、教师和教学管理者。
该学习系统包含六大模块:(1)学习的内容。管理、维护、传递个性化的学习内容与评价给学习者,以支持学习者的学习行为。(2)学习行为数据。记录学习者在学习系统中的学习行为(比如学习时间、学习次数、学习路径、学习进度等)。(3)分析预测模块。这是整个模型的核心,整合学习者信息系统中的数据和学习者学习行为数据,通过多种技术(语义分析、社会网络分析)对数据处理和分析,对学习者未来的学习行为和结果进行预测。(4)可视化面板。根据用户角色的不同,将预测模块中的结果以可视化、图形化的方式呈现。(5)推荐模块。根据分析预测模块的运行结果,再根据学习者的学习水平和兴趣,对学习内容等进行个性化的定制和推送。(6)干预模块。允许教师、教学管理者和系统开发人员根据预测模块的运行结果,对系统实施人工干预、自动化干预。
基于学习分析的远程学习系统模型能够及时量化跟踪学习过程,提出较好的学习建议,并以可视化的形式呈现给学生和老师,帮助他们更加清楚地了解自己学习的变化过程,帮助学生更好地认知自己的学习状态,激发学习者的学习兴趣和学习激情。
模型利用采集到的学生学习兴趣发展的数据,了解学习者状态,包括学习者已掌握的相关知识、学习习惯等;建立合理的学习者分析模式与数据分析框架,从简单的资源推送逐步完善为提供基于大数据分析的适时、贴切的个性化指导,帮助学生完善知识结构,挖掘自身兴趣爱好和特长。整个学习过程既实现了学习者的自制学习和自我学习,以及教师个性化干预指导,又实现了系统根据用户特征适应性推送资源辅助学习者学习的目的。
四、学习分析技术对远程教育模式改革的价值
关键词:WEB挖掘;开放教育;信息处理
中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)18-4312-02
电大远程教育中,基于网络的教学模式运行多年,大量的优秀资源利用率不高,学生想学习苦于找不到相应资源,地市电大教师只好引导学生网上学习,但效果不佳。网络课程产生大量数据,如:学生网上学习行为,电大在线平台的应用情况等,这些数据十分分散,缺乏结构化,如何找出这些隐性数据间的关系,是提高开放教育教学质量的关键技术,让学生了解他要学习的知识网上有哪些资源,这些资源的利用情况,同一专业的其它学生学了哪些知识,从海量的数据中找到学生学习有用的信息,提高学生的学习效率,节约宝贵的时间。
1 Web挖掘技术
数据挖掘就是从大量数据中提取有用的知识,Web挖掘也叫Web数据挖掘,是网络和数据挖掘相结合,通过分析Web页面及后台数据库中相关的数据,找出隐含的知识。Web挖掘分为Web内容的挖掘、Web结构的挖掘和Web使用挖掘。
1.1 Web挖掘应用于开放教育
开放教育中几乎所有的教学活动都通过网络进行,学生学习行为、师生的交互均记录在电大在线平台的日志和数据库中,产生大量的数据文件,如何有效的分析和组织这些数据,作为电大教育的教育评价、教学决策和个性化学习依据。用Web挖掘技术分析这些数据,能很好解决开放教育中“数据丰富,知识贫乏”的现象。
算法是数据挖掘的核心,Web挖掘算法和数据挖掘算法基本相同,常用的有:回归分析、贝叶斯分析、决策树算法、聚类分析、关联规则算法等等。Web挖掘工具依据适用性、易用性和兼容性的原则,选择Google公司开发的Google Analytics,因为它是免费的网络分析工具,功能强大、简单实用,能统计和分析网站访问者、访问量、访问内容等,还能生成报表。
1.2 Web挖掘的教学特点
基于Web挖掘的教学突出特点是:
1)交互性强,体现在学生与教师、教师与教师、教师与专家的交互。
2)动态性强,各种学习资源都是动态的,都能下载和上传,最新信息也动态更新,学生能及时找到最新的资源和信息。
3)易实现协作学习,学生根据划分的学习小组协作完成课题项目等,非常方便。
4)易实现个性化学习,学生根据自己的学习时间和习惯安排学习计划,该技术也会根据学生的安排构建动态教学内容。学生不再被动地接受知识,会主动获取相关信息,该技术会推荐相关的学习资源和学习建议,真正实现因材施教。
1.3 Web挖掘实例
1)Web服务器日志挖掘
这里以Web日志挖掘为例,电大在线平台应用的是Web服务器,所以我们谈谈Web服务器日志挖掘。Web服务器日志是指在服务器在运行时生成的日志文件,如:日志、访问日志、引用日志、错误日志等。Web服务器将客户的请求发出的同时又把本次的请求写入日志,所以说Web服务器日志忠实地记录着用户访问网站的踪迹。它包含用户访问的IP地址、用户的域名、时间和日期、访问网页的连接、访问方法、访问结果(成功、失败、错误)、被访问页的文件名等。
2)日志挖掘的任务
日志挖掘的主要任务是统计查询分析和智能查询分析。
统计查询分析主要进行网站点击、客户和流量的分析。统计查询分析是低次层的数据分析,它是深层次数据分析的基础,其结果对于优化站点结构、提高系统性能和市场决策有很大的帮助。
智能查询分析通过发现数据库中的规则、模式和其他知识,根据序列模式和关联规则进行聚类分析,把分析结果智能推荐给用户,据此把用户分类,并根据分类后用户的公共属性分配不同的商务活动。
3)Web服务器日志挖掘的过程
Web服务器日志记录着访问该Web服务器的数据流信息,保存着每次访问Web页面的日志项。其挖掘的过程大体分为数据预处理、挖掘算法实施、模式分析、可视化四个阶段。数据预处理就是删除一些与挖掘算法无关的数据,根据用户的IP地址、访问路径、会话、注册信息等识别用户。把预处理的数据根据挖掘算法进行模式识别,以序列模式挖掘为例说明,它主要应用于会话内部的网页间的时间相关性问题,通过Web挖掘技术分析日志,找出用户访问频繁的序列,得到结果。Web日志挖掘过程如图1。
图1Web日志挖掘过程
当用户向服务器发出请求后,服务器端根据用户的IP地址、浏览器类型和请求的URL等信息返回到客户端,如有错误将返回错误代码,最后生成日志文件,包括访问信息和错误信息。
2 Web服务器日志挖掘系统
Web服务器日志挖掘系统由创建模式库、实时智能推荐和管理员指导模块组成。创建模式库模块是根据Web日志挖掘算法找出用户的浏览模式,并维护和更新用户的行为模式。实时智能推荐模块是根据模式库中的模式和用户的浏览行为实时并智能地推荐用户感兴趣的内容。管理员指导模块帮助网管人员优化网站结构,方便用户,提高网站访问量。
模式库的创建过程。把Web服务器日志、Web文档等数据源经过数据预处理,生成用户会话文件,把这些会话文件经过Web日志挖掘算法的处理,找出用户的访问模式(如页面聚类、用户聚类、频繁访问页组等),把这些访问模式存于模式库中,如发现与事实不符或有偏差,达不到预期结果,可根据反馈重复以上过程,甚至重开始。因此说创建模式库是一个循环往复的过程,需要专家参与。
智能推荐过程。根据当前用户的访问情况,在模式库中查找与之相匹配的模式,并动态地推荐页面集合,这些都是用户感兴趣并还未访问到的页面,这些推荐和用户的请求集成在一起智能地推荐给用户。
开放教育中使用的电大在线平台包括以下基本模块:公开讨论区,网上会议室,网上教学活动、校务公开、教学软件、教学资源、网上作业与考核、模拟实验等。学生利用该平台进行学习、做作业、互动交流等。系统管理员负责上传教学资源、作业和实验,收集和处理学习结果和反馈等。根据学生访问信息、作业和测试结果,对其进行个性化服务。
电大的学生都是用学号和密码进行身份验证的,初始密码都是8位的出生日期,只有身份验证通过后才能网上做作业、网上学习、BBS讨论等。学生的所有网上学习行为都被系统记录在学生访问日志文件里,存在服务器的数据库中。该教学平台的日志记录中除有用数据外还包括很多影响挖掘准确性的多媒体信息,如何去除这些无关数据,这里我们用SQL语句清除这些垃圾记录:
Delete From IISlog Where Target like‘%.jpg’;
Delete From IISlog Where Target like‘%.gif’;
Delete From IISlog Where Target like‘%.avi’;
以上的操作是数据净化。去除那些与挖掘无关,甚至响挖掘结果的数据,其后进行用户识别,从海量数据中找出属于同一学生的记录,并迅速找出与该学生相对应的挖掘结果和推荐集。会话识别根据不同时间段的用户访问信息生成不同的用户会话,以区分不同的时间段的用户访问。最后进行路径补充,采用一些启发性规则对不完整的用户访问序列,结合网页拓扑进行推理,补全访问路径,还可以把数据挖掘结果转存到Excel文件中,以图表方式表示挖掘结果。
3结束语
根据Web挖掘产生的结果进行资源的推荐、网站结构的改善、个性化服务的完善,高质量地决策教学。在电大开放教育教学系统中应用Web挖掘技术能提高系统的个性化服务水平,根据学生的知识结构和学习风格进行个性化教学,以提高学生学习的积极性和主动性。
参考文献:
[1]余强,张海盛.个性化Web信息服务技术研究[J].计算机应用研究,2006(2).
关键字:Web日志挖掘;网络教学;个性化
中图分类号:G420文献标识码:A文章编号:1672-3791(2012)02(c)-0000-00
1 引言
随着计算机技术和信息技术的发展,以网络为载体、利用数字电子化方式开展的教学活动逐渐成为了目前最为重要的教学形式,这种教学形式的真正优势在于能为学习者个体提供个性化的学习安排,而这种个性化的教育服务也势必会进一步促进网络教学的发展。
2 Web数据挖掘
Web数据挖掘,是在Web环境下数据挖掘技术的应用,是从Web的超链接结构、网页内容和使用日志中提取有用的模式和隐含信息。Web上信息的表现具有多样性,这也就决定了Web挖掘任务同样也具有多样性。根据处理对象的不同,Web挖掘一般可以分为Web内容挖掘、Web结构挖掘和Web日志挖掘三类。本课题重点研究Web日志挖掘。
Web日志挖掘的主要任务是从Web的服务器日志中抽取有意义的信息和模式。Web日志挖掘处理的是在用户和网络交互的过程中抽取出来的第二手数据。这些数据包括网络服务器访问记录、服务器日志记录、浏览器日志记录、注册信息、用户对话等。对这些数据进行挖掘和分析可以帮助理解用户的行为,进而改进载体站点的结构或者为用户提供个性化的服务。那么在网络教学中应用Web日志挖掘就可以通过挖掘相应站点的日志文件获取学习者的访问内容、停留时间、访问频度等,从而发现其学习访问模式等有用信息,进一步提升整个网络教学的品质。
Web日志挖掘的研究围绕着分析Web站点性能、理解用户意图和改进Web站点设计三个应用方面进行,常用的技术主要有统计分析、关联规则分析、序列模式分析、聚类与分类分析等。Web日志挖掘一般分为数据预处理、模式发现和模式分析三个基本阶段。
2.1 数据预处理阶段
服务器端数据、客户端数据和服务器端数据收集都是Web日志挖掘的数据源。数据预处理阶段的主要任务是将各种数据源得到的使用信息、内容信息和结构信息转换成适合数据挖掘和模式发现所需要的数据模型。数据预处理是在将日志文件转化为数据库文件之后进行的,是为了得到可用于挖掘的可靠和精确的数据。这个过程一般分为数据清洗、用户识别、会话识别和路径补充4个步骤。
1)数据清洗是指删除日志文件中一些与挖掘任务无关的数据,包括删除、合并某些记录,处理用户请求访问失败的记录等内容。2)用户识别的主要任务是处理多个用户通过服务器或防火墙访问站点的情况,是将用户和请求页面相关联的过程。3)会话识别的任务就是把属于同一个用户的同一次访问请求识别出来,也就是将用户的访问记录划分成单个的会话。一般采用超时识别。4)路径补充就是根据引用日志和网络拓扑结构把访问日志中没有记录的用户补充到用户会话文件之中,确保获得用户完整的访问路径。
2.2 模式发现阶段
模式发现阶段是Web日志挖掘的核心部分。经过数据预处理之后,应用一种合理的挖掘算法或综合应用不同的算法,如关联规则分析、聚类和分类技术等,来处理“消噪”后的数据,最终发现用户的访问模式和规律。
2.3 模式分析阶段
Web日志挖掘的最后一步就是模式分析。通过模式挖掘之后,生成的规则数目庞大,表达晦涩,得不到很好的利用,这就需要对模式发现过程产生的规则和模式进行过滤,通过模式分析和应用技术处理之,选择用户易于理解和棘手的方式显示出来。常用技术有可视化技术、联机分析技术和智能查询机制等。
3 网络教学中的Web数据挖掘方法
3.1 关联分析
关联分析是寻找在同一个事件中出现的不同项的相关性。关联分析发现关联规则,运用在Web挖掘环境中的关联规则是指发现用户会话中经常被用户一起访问的页面集合,这些页面之间没有顺序关系。购物篮分析就是一个非常典型的关联规则应用,该应用通过发现顾客放入“购物篮”中不同商品之间的联系来分析顾客的购买习惯。在Web中,关联规则作为启发式规则,可以发现学习者对内容页面之间的访问关系,调整页面之间的结构关系,预测学习者可能访问的内容,使其最快捷地访问到感兴趣的内容。在网络教学中就可以利用关联分析寻找各门课程之间的内在联系,根据A课程与B课程在一起浏览的情况,推导出A和B在一起是起着积极作用还是负面影响,进而可以选定课程之间的关联,及时制定策略建立或删除A和B课程之间的关联。
3.2 分类分析
分类分析是预先定义好几个类,然后将数据项映射到某个类中去。在Web日志挖掘中使用分类能够将用户配置文件归属到特定的用户类别,建立数据各特定类别的用户概图。例如把学生的知识能力水平分成入门级、初级、中级和高级,利用分类技术将学习者投射到某一个级别中,为每个级别提供相应的个性化资源和学习支持服务,还可以用于远程协作的学习小组分配。可以利用有监督的归纳学习算法来实现这种分类。
3.3 聚类分析
分类与聚类是不同的两种方法,分类中的类及相关属性是预先定义好的,其目的是运用分类算法将没有划分类别的数据标记为特定的类标号;而聚类中的类别事先并没定义,其目的是将大量的个体数据,根据属性之间的相似性,将原始数据集合划分为若干个子集。在网络教学中聚类是一个重要的方面,它帮助网站设计人员从用户数据库中发现不同的用户群,并且用学习模式来刻画不同的用户群的特征。通过聚类分析可以帮助网站设计者更好地了解自己的用户,使教学活动能够在一定程度上满足学生的要求。
3.4 序列模式分析
序列模式指在事务之间寻找相应的时序关系,在时序数据集中发现在时间上具有先后顺序的数据项。根据序列模式的特点,利用序列模式分析技术我们可以对用户的浏览趋势进行分析,在网络教学中学生的课程学习是循序渐进的,且具有一定的关联和前后顺序,进行序列模式分析可以预测学生的未来访问模式,且有助于针对特定用户群安排特定内容,可以解决远程教育中针对各种层次学生进行因材施教的问题。
4 基于Web挖掘的个性化网络教学系统
网络教学作为一种基于Web的,以远程方式进行的教学活动,打破了过去教师、学生面对面、共集一堂的时间和空间的限制,使更多的人能够享受到有限的社会教育资源,而引入个性化后的网络教学将是一个智能化的系统,可以更多且及时地了解到学生的状况、需求、能力差异、学习进度、兴趣爱好,并动态地根据这些因素调整学习计划及进度,让学生得到针对其个性化的教育。
4.1 系统模型
基于Web挖掘的个性化网络教学系统设计思想是:通过获取学习者在Web上的个人信息、学习行为信息和Web日志数据,如访问频度、内容、访问时间长短及偏好,经过数据预处理、模式发现找出有用的规则和模式进行综合分析,结合教学资源知识库的信息,得出学习者学习过程的一般模式规律,对学习内容和进度进行自动组合,重构页面间链接,为学习者提供良好的个性化服务,使学习者更好地发展自我。根据上述的设计思想,提出一种基于Web日志挖掘的个性化远程教育系统模型,如图1所示。
4.2 系统结构
4.2.1 数据预处理模块
数据预处理模块负责对服务器端的访问日志进行预处理,以得到满足Web日志挖掘要求的事务数据。主要是根据挖掘任务进行数据清洗、用户识别、会话识别和事务识别。
1)数据清洗 数据清洗是整个预处理的基础,主要是将有噪声的、不一致的、冗余的数据从Web访问日志中清除或合并。可以采用纵向缩减和横向缩减进行清洗,例如当学习者对某个页面发出访问请求时,这个页面中的图形、脚本、图像等资源就会被自动下载,并写入日志数据中,但在网络教学网站中,只有包含教学内容的HTML文件与用户会话有关,而后缀名为.jpg,.gif和.jpeg的图片文件,后缀名为.wav的音频文件以及后缀名为.js和.cgi的脚本文件都属于噪声信息。这时我们就可以利用纵向缩减中的后缀过滤法进行数据清理。2) 用户识别 用户识别是为了得到同一用户访问的所有路径的集合。用户识别在对用户进行访问模式挖掘或聚类分析时尤为重要,因为群体是由个体组成的,只有对个体有了详细的认识才能清楚地识别群体特征。3)会话识别 一个会话是学习者从进入到离开网络教学站点这段时间内的一组网页访问,可以根据学习者登陆系统、完成学习、最后退出的过程来识别会话。Web日志中存储着大量的访问信息,时间跨度大,一名学习者可能在此期间多次访问了该站点,那么会话识别的意义就在于可以将不同时间段内的学习者访问区分开,将学习者多次访问的页面划分成多次用户会话。会话的划分有多种方法,有基于时间划分的,有基于站点拓扑结构划分的。而最为常用的方法就是通过设置一个用户在站点的持续时间或页面停留时间阈值来识别用户会话,如果请求时间超过阈值则认为新会话开始。4)路径补充:由于本地缓存和服务器缓存的存在,使得难以识别学习者访问的网页序列,而路径补充就是补全那些不完整的学习者访问序列。路径补充可以遵循一些原则,比如通过在网页的标志中设置过期时间,使得本地缓存失效,这样就可以保证Web日志记录中保存了用户的真实访问路径;还可以结合访问日志、引用日志、日志和网站拓扑结构来实现路径补充。在完成数据预处理之后会就能得到网络教学系统中的Web访问事务数据库,学习者对网络教学站点的访问情况都将存储在Web访问事务数据库中,每一个事务是一组内容页面的集合,代表着学习者一次有意义的访问。
4.2.2 Web挖掘引擎模块
在Web事务库中已经存储了数据预处理的结果,下一步就可以离线利用统计分析和聚类方法进行Web事务库挖掘。
1)统计分析 统计分析是Web挖掘中最基本的方法,也是分析用户行为最常用的方法。通过记录学习者经常访问的URL,跟踪统计学生访问次数、总停留时间、该学习者的课程数、计算学习者对哪些课程停留时间较长等,得到学习者的学习特征风格,建立和完善学习者学习模型,建立学习者个性数据库,为不同的学习者提供合适的学习策略提供帮助。2)聚类分析 将物理或者抽象对象的集合分组成为类似的对象组成的多个类的过程称为聚类,其目标就是在相似的基础上收集数据来分类。聚类分析不需要预先定义类的特点或属性,而是从用户的访问行为中发现潜在性的知识,从而能更好地体现智能性。页面(资源)聚类和学生聚类是实现个性化网络教学最为重要的两种方法。如果通过聚类发现若干个网页属于同一网页(资源)聚类,当学生访问其中一页(资源)时,可推荐类中其它页面(资源)。当学习者具有相似的学习习惯或学习兴趣时,可以利用学生聚类法对他们提供相同的个性化服务。
4.2.3 知识库应用模块
应用统计分析、关联规则分析、分类和聚类技术和序列模式等挖掘算法对Web事务库进行了挖掘和分析,其结果存放在知识库中,此时网站设计者可利用知识库中的信息和模式为学习者提供合适的学习策略和学习建议,进一步改进网站结构,实现真正意义上的个性化信息服务。
5 结 语
Internet技术的发展和网络的普及扩展了数据挖掘的应用范围,利用Web数据挖掘技术对网络教学网站上的各种数据源进行挖掘,把握用户的兴趣,有助于开展网站信息推送服务以及个人信息的定制服务。
参考文献
[1] 冯春辉.Web日志挖掘在网络教学中的应用研究.计算机技术与发展,2010,6.
[2] ,丁华福,姜伦.Web日志挖掘中数据预处理技术的研究.计算机技术与发展,2010,5.
[3] 李中,苑津莎,徐小彩.基于Web日志挖掘的客户访问兴趣分析.华北电力大学学报,2009,5.
[4] 苏新宁,杨建林,等.数据仓库和数据挖掘.清华大学出版社,2006,4.
[5] 李燕风.Web访问信息挖掘系统.计算机工程,2003,29(15).
[6] 张娥.Web使用模式研究中的数据挖掘.计算机应用研究,2000,3.
[7] 韩晓红.网络教学的特点与模式[J]. 甘肃高师学报. 2004(02).
[8] 许晓非,高尚,常桂然,刘积仁.基于Web的远程教育学习环境[J]. 小型微型计算机系统. 1999(09).
【摘 要】信息技术在高职教学中越来越扮演重要的角色,学生在学习中利用计算机技术、网络等进行课堂外的自主学习,极大提高了学生的积极性、主动性、创造性,也提高了学生的综合能力。
关键词 信息技术;自主性学习;能力
一、信息技术在学生自主性学习中的应用实践
1.信息技术使学生的学习自由化
进入新世纪以来,信息化技术对教育的改革发展起到了显著的作用,教育进入信息化教育时代,信息化对人们的学习产生了巨大的影响,特别是青年一代,信息技术使他们的学习突破了学习围墙的限制,扩展了学习的手段与范围,学习不再局限于传统的课堂,学生可以利用计算机、ipad、智能手机等进行随时随地的学习,学习的时间和空间得到了扩展和延伸,学习的模式由单一的课堂听课、课堂实验向多种形式转换,满足了学生的多样性和个性化需要,学生的学习更加自由和自主。如:笔者在教学中,对学生的作业可以在网络课程平台中提交、也可以发电子邮件或QQ离线发送,对学生学习中的问题可以QQ或微信、微博留言,还可以短信等,教师可以及时回复学生,师生的互动交流更加便捷、流畅、自由,信息技术为提高学习的有效性、自主性提供了支撑。
2.信息技术使学生的学习更加趣味化、形象化
众所周知,信息技术对世界、对人类的影响是空前的,信息技术深刻改变着人们的工作、生活及学习方式,人类认知世界、探究知识奥秘的模式发生了变革,视频点播、动画fiash、在线互动及测试、图片等使学生的学习更加趣味化、形象化,抽象的原理知识感性化,降低了学习难度,丰富了视觉感受,最大程度的启迪了对知识的理解,而丰富的多方位的学习资源库,为学生拓宽知识面,了解相关专业知识、标准、发展动态等提供了便捷的途径和平台。如:在《电子技术》课程中,其资源库包含焊接标准、电子元件检查方法与标准,各种动画fiash(如PN结的形成、截止饱和失真动画等)、电子信息行业发展动态等。降低了理论知识的难得,难得重点学生更加容易理解,同时知识的外延也得到了拓展。
3.信息技术使学生的学习自主性提高,综合素质得到提升
教育信息化是教育理念和教学模式的一场深刻革命,由于资源的丰富、网络无处不在,移动通信设备的智能化,学习的时间、地点、内容、方式越来越成为自主选择。学习方式由被动式向主动式、互动式学习转变,泛在学习、移动学习、个性化学习逐渐成为现实。如:笔者进行了解后得知,有的同学通过打游戏的方式来记忆英语单词,有同学应用仿真实验来观察验证理论等等。除此之外,在每个学习任务结束时,教师可以要求学生用ppt、微视频等来总结学习收获,这样不但能锻炼培养学生的表达能力、思维逻辑能力,同时锻炼了计算机技术、多媒体技术应用能力。学生综合素质得到提升。当然,学生学习自主性的提高、综合素质的提升不能仅仅依靠学生自由、独立的完成,教师应当给予恰当的学习情境设计及任务安排,引导和指导学生完成学习过程,使学习及提升具有目标性,效果更好。
二、未来信息技术对学生自主学习的作用浅析
1.信息技术的高速发展,发掘了学生自身原有的动力和天分
新一轮教育信息化的浪潮已然随着硬件的高速变革和软件的高度智能化来到教师和学生面前,“微课堂”、“翻转课堂”、“E课堂”、“学习空间”等已经走入校园,走进教学。处于信息化的时代,学生获取知识的途径不再是课堂,而是线上学习越来越成为学习知识的主要途径,课堂成为交流学习成果,答疑解惑的场所,比尔·盖茨声称,“五年以后,你将可以在网上免费获取世界上最好的课程”,而且这些课程比任何一个单独的大学提供的课程都要好。线上学习能做到个性化教学,根据个人的学习数据制定相应的学习计划和辅导。利用数据挖掘的关联分析和演变分析等功能,在学生管理数据库中挖掘有价值的数据,分析学生的日常行为,可得知各种行为活动之间的内在联系,并作出相应的对策。学习行为的数据将自动留存,更易于后期的学习行为评价和评估,教师不再基于自己的教学经验来分析学生的学习中偏好,难点以及共同点等,只要通过分析整合学习的行为记录轻而易举就能得到学习过程中规律,这样对教师的下一步工作重点有指导意义。并且线上学习能做到个性化教学,根据个人的学习数据制定相应的学习计划和辅导。利用数据挖掘的关联分析和演变分析等功能,在学生管理数据库中挖掘有价值的数据,分析学生的日常行为,可得知各种行为活动之间的内在联系,并作出相应的对策。这种开放的课堂、翻转的课堂,相对于传统的课堂,整个班级一个教学方案,每个学生接受同样的教学资源和方法更加个性化,更能充分发挥学生的自身天分爱好,激发学习的原动力,使学习获得更好效果。
2.信息技术对学生综合素质的培养起到很好的支撑作用
大学肩负着培养人的举止、行为、社交、人文素养及职业道德等综合素质责任,网络资源的丰富,使学生拥有了更好的课程选择和推荐、更好的校友资源、更好的实验室、更多的优秀教授、成功人士的经验分享,这些来自于工业界和研究界的经验资源的感染和熏陶,使得学生从开始就像一个社会人。与此同时,职业修养和职业道德的陶冶,使大学出来的人更加具有职业精神。当然,网络也拉进了人与人之间的距离,更多更好学习伙伴,娱乐就是学习,大学是目前能够想到的最好的交往和创新碰撞的场所。据了解,最近几年的教育学国际会议和期刊,娱乐教育和社会化网络学习是各国学者研究的重点。如何在没有人监督的情况下让人自主管理自己,看来只有社交圈子和娱乐能够担负重任。教育行为学和教育行为诱导将发挥更大的作用,例如斯坦福大学进行的“翻转课堂”(Flipping the Classroom)的实验。 第一步就是改变班级人数, 增加在线互动。 他说“仅仅把讲座录像搬到网上就跟传统课堂一样乏味,所以大约每15分钟左右, 在线讲座就会弹出一个小测验以检验学生掌握的情况。” 此外, 斯坦福在“Flipping the Classroom”的实验中还增加了社交媒体的元素。它允许学生互相之间提问。 斯坦福大学校长Hennessy发现, 在实验中,学生们互相之间的回答非常快。 这种“共同学习“的模式非常有效。学校也将成为更纯净的社交圈,在这个社交圈中,学生的举止、行为、社交、人文素养及职业道德等深层意识形态的潜质得到洗礼和升华。
3.信息技术对学生学习行为的挑战
随着网络资源的普及和开放,在线教育如果仅仅是将传统的课堂搬上网络,也许更加不适合学习的原有规律。NMC(新媒体教育联盟)通过历史研究,将人类的学习行为归类为社会学习、可视化学习、移动(位置)学习、游戏学习、讲习学习,每种学习方式,基本上对应者信息与知识的载体的技术方式。也就是说,技术限制了人们的学习方式,一旦有新的技术改变信息和知识的传播模式,人类学习的方式马上会产生根本性的变化。互联网时代,开放的社会和资源,进一步解放人们的学习行为,越来越多的才子不用在学校里面接受所谓学习方法的熏陶,教育正在进行或者未来必定主流的模式将是:视频成为主要载体,教育资源极其丰富;翻转课堂;按需学习;终生学习。对于学习来说,在信息技术革命的今天,教化在撤退,支持在推进。然而,无论哪种学习方式,无论多么丰富的教学资源,对经过无数次洗礼的高等职业院校的学生而言,的确面临着新的学习行为习惯的挑战。面对开放的学习环境,没有了课堂的各种约束,如课堂的考勤、面对面的沟通互动、教师对学生学习行为的实时监控等,学生是否有较强的学习愿望,明确的学习目标、较强的自我控制能力及良好的学习规划等,都对教师和学生构成了新的挑战。作为教师,必须加大学习情境的设计、教学过程设计,同时对学生日常的学习行为进行网络上的实时记载及考核。而对于学生而言,信息化技术支持下的学习将伴随着人的一生,泛在学习、移动学习、个性化学习成为未来学习型社会的主流,学习阶段由在校期间向人的一生延伸,所以,学生必须在校开始锻炼培训自身的学习习惯、学习能力及自我控制能力,并且有能力对自身的未来进行合理的科学的规划,从而为未来奠定良好的基础。
三、结束语
信息技术的飞速发展,使教育面临一场深刻的革命,信息技术突破了学习围墙,扩展了学习的手段与范围,使师生拥有了获取信息的平等地位,构建师生积极互动的教育新模式。可以说,信息技术的深度应用,迫切要求教与学的“双重革命”,加快从以教为中心向以学为中心转变,从知识传授为主向能力培养为主转变,从课堂学习为主向多种学习方式转变。越来越少的课堂,越来越多的网络;越来越少的教室,越来越多的咖啡厅;越来越少的讲授,越来越多的交互;越来越少的编制,越来越多的合作;越来越少的办公室,越来越多的实验室……。这些场景已经随着技术的倒逼,悄悄渗透到了教育领域。学生教师也将在此革命中的不断成长提高,而学生更将在学习中发挥其主动性与能动性。
参考文献
[1]刘延东.把握机遇.加快推进开创教育信息化工作新局面——全国教育信息化工作电视电话会议讲话
引言
近年来,随着高等教育信息化的深入研究与技术的普及,越来越多的国内外专家学者开始重视学习分析技术的理论与实践研究,2010―2013年连续四年,新媒体联盟和美国高校教育信息化协会提出了学习分析技术,并预测其将成为教育技术领域的主流技术。[1]这一技术的提出使得传统教学中无差别化的大班教育模式的弊病逐渐得到改善,教师一味灌输、学生单纯接受的学习方式逐渐变成以学生为中心,尊重个体差异化,“因材施教”变成了可能。
国内已有的研究大多以模型对比分析或基于概念框架的案例分析为主,从构成要素、分析方法、分析工具等多维度入手对案例进行解读。但很少有研究从学习分析的各个环节对案例进行剖析,因此笔者借助西蒙斯学习分析过程模型对案例展开对比分析,从数据类型、分析过程、追踪预测、个性化或适应四个环节对三所国外高校的具体应用案例进行对比分析,寻求不同项目之间的差异及其原因,为建立更为普适性的模型奠定基础,同时为国内相关案例的开展提供借鉴。
国外案例分析框架
1.概述
模型是科学研究的重要工具,本文使用西蒙斯学习分析过程模型对来自英属哥伦比亚大学“自我导向学习”、美国普渡大学“课程信号”、马里兰大学“自我检查活动”进行四个关键环节的对比分析,得到不同案例之间的共通性与差异性。
2.案例分析框架
(1)学习分析过程框架
在西蒙斯的学习分析过程模型中[2](如右图),数据来源主要分为两类,一类是由学习管理系统、课程管理系统产生的数据,或来自移动设备、社交媒体的交互数据,这类数据用于分析学习者特征以及所处情境并生成学习者档案;另一类是来自课程、作业、测验成绩等具体学习数据,通过使用语义分析以及连接技术得到有关课程知识习得情况的智能数据。经过两类学习数据以及实时数据追踪进行分析计算,并合理建模预测,系统根据预测结果推送个性化学习资源、工具等。学生进行自我诊断并自适应,教师进行及时干预、警告和协助。
(2)具体环节
①数据类型主要分为学习者数据以及智能数据两类,在学习者数据中学习行为类型可分为活动参与度(登录平台次数、平台在线时长、课程访问数量)、积极性(新消息查看时间、新任务查看时间、作业提交时间)、态度(教学材料的点击次数、课程资源浏览时长)、自我诊断(根据教师反馈修改次数、修改及时性、修改时长)四个方面,智能数据可分为同伴协作(讨论区提问次数、解答回复次数、回复内容被赞频率)、学习效果(作业测验完成百分比、测试成绩、作业评定)两个方面。
②分析过程指通过社会网络分析法、语义分析法、内容分析法、统计法、数据挖掘[4]等学习分析技术对搜集到的数据结合情境因素进行深入分析阐释,了解学习者的学习过程、学习需求,形成学习者风格,分析复杂的交互过程,建构预测模型。
③追踪预测环节通过对学习者的数据进行实时追踪,使用已有的预测模型,对学习者的学习结果进行预测,对高危学生提出预警,并根据实时数据对预测结果不断修正。
④个性化或适应[3]作为学习分析的最终目标,一方面指系统个性化向学习者推荐学习资源、同伴、工具、路径等,根据不同学习者的特征以及学习进度进行推送。同时教师根据可视化分析给予学生相应的帮助,选取不同的教学策略有针对性地对学生进行指导。另一方面,学生自我诊断,实现学习者对资源的自主建构,提高主观能动性。
3.案例描述与分析
(1)英属哥伦比亚大学“自我导向学习”
【项目目标】为了对学生学习成绩预测的各项指标进行合理建模,以便为学习者的自我导向提供支持,英属哥伦比亚大学对学生三个学期基于Blackboard的在线生物课程数据进行回归分析并建模,使得学习者可以进行自我监控,在掌握学习数据的同时与同伴进行比较,以了解自己的优势与不足。
【项目流程】通过对课程内容的访问、论坛、聊天室、测验、自主交流工具等方面的分析,将与学习者学业成绩呈显著相关的变量归纳为3个关键变量,为了得到有效的LMS追踪数据,只保留完成所有课程的学生数据,最终选取了118名学生作为样本。[5]
其中,使用编写工具、搜索功能、访问成绩、查看资料等操作记录作为交互过程被搜集为学习者数据,通过这些数据可得出学习者的简要介绍,同时为之后的分析提供数据支持。学生的作业完成情况、聊天室、讨论区信息的发送数目等作为智能数据与学习者数据一起用于分析。[6]为了实现实时数据分析,本案例使用SNAPP社会网络分析工具与LMS无缝对接,提取学习者在线学习产生的数据,形成交互视觉图,以更直观地显示学习者的学习动态。当LMS中有成员在论坛中消息时,网络结构图会实时更新。实验结果表明:该模型以81%的准确率预测了该门课程将会不及格的同学,从理论层面证明了基于LMS数据挖掘开发“早期预警系统”的可能性,教师可以根据预警系统快速识别处于“危险”中的学生,从而及时给予干预。
【总结】通过本案例我们看到了学习分析的广阔前景,较高的预测准确率使得自我导向预测模型的可靠性有了提高,从理论层面上实现了对“早期预警系统”开发的可行性,同时在数据处理时形成完整的步骤,为今后的研究提供了很好的参考依据。但是用作科学预测的指标还需进一步完善,寻找是否还有其他指标对成绩有预测作用。[7]对用于指标的探索性因子分析应在更多的教学情境中检验和修正。
(2)美国普渡大学“课程信号”
【项目目标】随着班级规模的持续扩大,在高等教育教学的过程中,尤其是在线学习中学生缺席、未充分参与课堂、学习滞后等现象频繁出现,但作为教师很难快速识别高危学生并及时调整课程。为了缓解持续下降的新生保有率以及持续增长的毕业周期等问题,使学生尽快跟上教学节奏、避免掉队,美国普渡大学启动了“课程信号”项目帮助学生优化学习过程。
【项目流程】“课程信号”项目于2007年实施。基于Blackboard平台,课程信号系统对学生数据进行搜集。数据来源主要有两类:一类是包括学习者地区、种族、性别、奖惩、前期学业历史、与系统交互次数、课程努力程度等一系列学习者特征的数据,此类学习者信息帮助生成学习者档案;另一类是来自课堂表现,即学生所获学分百分比的数据。系统结合两类数据,并根据SSA算法分析计算得出每位学生的数据,由所得数据在学生和教师端显示红、黄、绿三色信号灯预警。系统进行有效干预[8],推送合适的学习资源帮助学生完善学习过程;学生也可以及时自我修正,有效避免了毕业周期延长的现象;同时教师也能及时发现学生的各类问题。对比数据发现[9],使用课程信号系统后,成绩为A、B的学生增加了10.37%,学生的整体学习成绩有了明显提升。
通过对比各项数据与成绩的相关性,并经过多次的完善与调整,该系统建立了较为科学的SSA算法进行预测,并对学生数据采取实时追踪,更加精确、及时地为学生的学习提供分析。
【总结】作为学习分析领域的经典项目,经过不断优化完善,“信号课程”项目积累了大量的学习数据可供参考分析,其项目流程以及该系统在美国应用广泛。
(3)美国马里兰大学“自我检查活动”
【项目目标】为实现学生的自我诊断与评估,以直观的数据形式帮助学生了解自己的学习进程并与匿名同学之间进行比较学习,这样既保护了学生的隐私,同时也增强了他们的主观能动性。学生在充分了解自己的优势和不足后,通过自我组织学习过程,制订学习计划、学习策略等方法,从各角度进行自我修正与提升。
【项目流程】美国马里兰大学(UMBC)在2007年开设了“自我检查活动”(CMA)[10],这个学生自我检测评估工具利用数据仓库集合从学生管理系统中获取的背景资料、等级等学习者档案信息数据,以及从Blackboard平台中收集的课程访问次数、时间、点击次数等学习者与系统的交互数据,作业成绩等智能数据。该系统在集成两类数据后通过Google Analytics对学生数据进行提取分析,形成可视化分析报告提供给师生,学生根据分析报告中的可视化描述,可清晰地了解自己的学习情况以及学习活动的参与度,同时该系统支持同学之间匿名进行比较,使他们能快速了解自己在班级中的活跃度及所处位置等。学生通过实时更新的个人化反馈,及时修正自己的行为;对于使用的教学材料,教师也可以进行相关干预。
CMA项目的实施对学生的学习起到积极的推动作用,在为期两年超过110门课程的跟踪调查中,有39%的学生等级有较为明显的提升。
【总结】在学习分析过程中,基于Blackboard平台的数据大多关注用户的文档管理、电子邮件的发送、聊天室讨论区的互动;而CMA项目则通过对数据的分析对学生进行合理评估,同时学生通过与其他同学的比较找到差距,提升了学习的主观能动性,并增强了对学习的责任感。
(4)案例分析总结
通过对国外三所高校的学习分析案例比较后,笔者就数据类型、分析过程、追踪预测、个性化或适应进行比较分析(如上页表)。
通过比较分析可得出:
①所获取的数据维度越广,需要的分析方法越多。
三个项目的分析过程中,学习者参与度、态度、学习效果数据均被搜集但有一定的局限性,数据来源应更加多样化,英属哥伦比亚大学搜集到同伴协作的智能数据,并使用社会网络分析法对学习者学习网络的构建情况进行解读,涉及学习情境因素对学习者的影响。相比而言,美国普渡大学及美国马里兰大学的数据来源范围较窄。
②项目目标不同使用的分析方法也不同,精准预测需要建模。
为了对学习者的学习行为进行预测,英属哥伦比亚大学及美国普渡大学需要建立相关算法模型,而美国马里兰大学只需进行数据挖掘,即可分析形成可视化描述。
关键词:网络学习行为;监控;可视化
中图分类号:G434 文献标志码:A 文章编号:1673-8454(2015)13-0032-04
美国教育部2009年的研究报告《Evaluation of Evidence-Based Practices in Online Learning》分析发现:在线学习比面对面教学更有效。但一直以来,基于网络教学系统的在线学习普遍存在重课程内容建设和课程设计而忽视网络学习活动组织和评价反馈的问题。调查表明:46.2%的人认为影响网络学习质量最主要的因素是“学习监控机制”(曹梅,2002年)。网络学习推崇自主学习与自我监控,而“缺乏自主性、独立性,缺乏自我控制的学习能力”的中国学生网络学习行为整体特征的表现折射出了开展网络学习行为监控研究的必要性和紧迫性。
一、网络学习行为及分类
与传统学习相比,网络学习行为由于学习环境、学习对象的表现形式、学习者的心理和行为等方面的变化而呈现出新的特征,如行为环境的开放性与全球性、行为情境的虚拟化与多样化,行为控制的自主化与个性化等,彭文辉(2006年)、刘中宇(2008年)、邵艳丽(2008年)等从不同角度诠释了网络学习行为的表现特征。总体而言,网络学习本质上是一种自主学习的行为,包括多种发生于网络的学习活动 。
针对网络学习行为的界定问题,多位研究者构建了网络学习行为模型,如彭文辉等人提出的多维度网络学习行为模型,把网络学习行为分为信息检索学习行为、信息加工学习行为、信息学习行为、人际沟通和交流的行为和基于问题解决的学习行为。从微观角度讲,学习行为应该具有层次深度的考量,根据对学习效果的贡献程度,把学习行为分成低级、中级和高级等不同层次,这也有助于对学生的学习行为进行有针对性评价。
低级层次的学习行为是指简单的操作行为,包括登录系统、浏览内容、浏览资源、点击栏目、查看个人空间等;中级层次的学习行为是指网络交互行为,主要包括:答疑、作业、论坛、测试等交互行为;高级层次的学习行为是指学生利用网络学习平台开展协作,解决实际问题的行为,随着信息技术与移动互联技术的发展,高级层次的学习行为一般会超越单一的网络学习系统而发生。本研究将主要针对基于网络学习系统的中低层次的网络学习行为进行分析研究,主要包括:
(1)答疑:学生在开展网络学习过程中遇到问题时可以利用“在线答疑”功能提出问题,寻求教师或同学的实时帮助,也可以解答他人提出的问题;
(2)作业:教师针对教学内容设置不同类型的作业题目,教师通过学生提交的作业情况评价学生的学习效果;
(3)论坛:学生在论坛上针对某主题或案例发帖、跟帖、讨论交流,建构知识;
(4)考试:分为水平考试和总结考试,可以针对某模块的内容进行学习效果测试,也可以对学生某门课程的学习效果进行测试;
(5)评论:学生在学习课程资源时,对课程资源的价值进行评论;
(6)投票:教师在课程建设时,创建问卷或投票题目,学生参与问卷调查或投票,便于老师获取有价值的参考数据;
(7)班级发言:网络学习系统可以创建班级学习空间,学生在班级空间中个人所学与心得,共享集体智慧;
(8)第三方评价:主要是老师学生行为的实时评价,如当学生的作业被评为优秀作业时、当学生提出的问题被教师列入常见问题库时、当学生的答案被评为优秀答案时,学生的学习行为将获得额外奖励;
(9)消极操作行为:当学生删除提问问题、评论、作业等操作时,可视为学生实施了消极操作,这种行为将被额外处罚。
二、网络学习行为监控
由于学生的自我监控力度不够,网络学习行为一般是教师监督和激励下发生的,网络学习监控也作为一项重要功能融入到网络教学系统中,通过学习监控,教师掌握学生的学习状态和效果,并将监控结果反馈给学生,以实施有效学习。笔者借鉴李克东教授对学习监控的定义界定,把网络学习监控解释为:为了保证网络学习的成功、提高学习效果和质量、达到学习目的,对学生的网络学习活动组织进行计划、检查、评价、反馈、控制和调节的一系列过程。
网络学习行为监控侧重于学生的过程性评价,针对所有的网络学习行为的实时评价监控,总体来讲,监控内容主要有四个方面。
1.学习时间的监控
主要监控学生登录网络学习系统的总次数、访问系统资源及栏目的总次数及日平均访问次数,浏览资源的总停留时间等,了解学生实施网络学习的态度及投入情况。
2.学习内容及进度的监控
学生需要根据老师制定的授课计划完成学习任务,网络教学系统要实时监控学生内容完成情况,记录学习进度,便于学生作出预警干预。学生的任务执行过程包括选择学习任务、在线学习、自主协作、提交成果、评价考核等。
3.学习交互的监控
学习交互包括学生与网络教学系统的交互、学生间交互以及师生间交互。当学生在学习过程中遇到问题时,可以通过网络教学系统提供的交互工具获取帮助,也可以为他人提供帮助。交互行为以点数的形式设定转化规则,然后以网络学习行为成绩的形式呈现学习交互监控结果,主要包括班级发言、评论发言、参与投票、在线提问、论坛发(回)帖、提交作业与考试等。
4.学习效果的监控
根据教学安排,提交课程作业和水平测试,进行形成性评价,考核学生理论学习及技能掌握情况。
通过对上述内容的监控,实现四个功能:第一,实时定位学生的个性化学习状态,并作出预警干预,引导学生按学习计划完成学习任务;第二,评价学生是否达到学习目标,有助于记忆和理解;第三,监控结果及时反馈给学生,将有助于学生调整个人学习计划;第四,为老师提供决策依据,及时调控网络学习干预。
三、网络教学系统学习监控的可视化实现
网络学习系统中的学习行为记录以数据信息的形式存在,如何快速、准确地通过这些数据监控学生的网络学习行为?如果把这些行为数据以人们习惯接受的图形、图像等形式呈现,使教师和系统管理员以易识别、易理解的方式获得监控信息,所以,引入可视化技术将是一个有效的策略,网络学习系统在数据分析基础上对学习者的学习行为进行可视化呈现,通过统计图形图像的形式记录学生的学习档案。
1.网络学习行为转化
监控学生的网络学习行为,并以图形图像等形式呈现行为趋势,需要采取一种方法把学生的学习行为进行量化转变处理。本研究将采用点数转化的方式来实现,在点数转化基础上,实施图形图像可视化的转化。依据学习行为对学习结果的贡献程度,把网络学习行为的点数转化设计如表1所示。
2.网络学习监控数据可视化的技术支持
(1)数据库技术
网络学习系统的运行通常是以一个数据库管理系统为基础,数据库管理系统为数据管理提供了安全、可靠和高效的运行环境,它记录了学生进入系统的时间、次数以及所有的交互行为。
(2)数据挖掘技术
网络学习系统通过多种途径采集多方面的数据来反映学生的学习行为,这些大量的数据如何分析才能得出针对学生学习评价的导向性结论,给出科学性的评价?这就需要对海量知识进行行为数据建模,实施Web数据挖掘。每位学生都以学号登录,系统记录该学号的登录时间、IP地址、交互行为,并存入相应数据库,经过数据预处理过程,形成网络学习行为信息矩阵,再利用统计分析、路径分析、关联规则挖掘以及时序模式发现等算法,提取学生的行为导向,掌握学生的学习情况。
(3)可视化技术
可视化技术是一套在线分析处理技术,利用OWC(Office Web Component)组件绘制图表,可以把网络中大量的交互信息转化成电子表格和图表等形式,使隐性信息显性化,并以表格或GIF图形的形式在Web上呈现。另外,使用OWC组件可以任意设置颜色、图例、标题等布局参数,使网络学习监控系统的界面更加直观与清晰。
四、网络学习监控可视化技术的应用
笔者基于学习网络教学系统实施网络教学与学习,针对上文提出的学习监控内容探究可视化的应用,数据可视化呈现方式基本有三种:二维表格、综合统计图和单项统计图。网络学习系统的可视化监控分两个方面:网络学习系统基础运行数据监控和网络学习行为的实时监控。
1.网络学习系统基础运行数据监控
了解网络学习系统各教学机构、课程及教师等方面的整体数据情况,有助于宏观监控网络学习系统应用情况,有助于决策制定。
(1)课程信息可视化
课程信息统计是针对网络教学系统中每门课程的基本信息进行数据呈现,掌握每门课程的建设情况,包括知识点数、栏目数、课程资源数、作业个数、试卷个数、论坛数量、论坛主题数量、论坛发帖数量、课程问卷数量、课程通知数量、常见问题数量、在线答疑数量及课程总访问量等。其统计内容如图1、图2所示。
(2)教师信息可视化
网络学习监控系统还可以对任课老师的信息进行统计,整体掌握老师的课程建设与应用情况,主要参数有:批改作业数量、批改试卷数量、带班数量、带班学生数量、答疑数量、发帖数量、回帖数量等。
2.网络学习行为数据监控
(1)学习时间与操作有效性的可视化
网络学习系统以二维表格的形式实时记录并直观反映某时间段内学生的登录时间、总停留时间和已学习时长,并详细记录学生的所有操作行为,对学习有效性进行监控。其记录截图如图3所示。
(2)学习内容与进度可视化
学生登录网络学习系统后,在个人学习空间中呈现在学课程的状态,包括学习进度、作业完成情况、考试完成情况等,基于这些反馈信息,学生进行自我监控与调整。学生学习进度二维数据一览表截图如图4所示。
(3)学习论坛数据可视化
论坛是网络学习交互行为的主要内容之一,论坛的活跃程度一定程度上能反映出学生的学习投入程度和兴趣点,所以对论坛的数据处理有助于老师尽快抓住教学内容的兴趣点。其可视化效果如图5所示。
(4)作业考试提交数据可视化
作业与考试能有效反映学生的学习效果和学习质量,学生提交作业与考试情况的直观显示有助于教师尽快了解学生的作业与考试进度,进而对学生的学习行为实施反馈与有效干预。其二维数据截图如图6所示。
信息时代的生存技能更加依赖于学生的自主学习能力,而网络学习将是学生获取知识与技能的主要手段之一,如何在自由的网络学习环境中,快速获取所需要的信息,学生的自我监控能力固然重要,但教师的网络学习行为监控同样不可缺少,可视化视角是网络学习行为监控的重要视角,提高了网络学习行为监控的客观性,对教师的网络学习干预提供准确及时的反馈依据,提高网络学习质量。
参考文献:
[1]李东.利用现代远程教育平台检测学生网上学习行为的研究与实践[D].重庆:重庆大学,2006.
[2]郭魏.网络学习行为监控可视化系统的设计与实现[D].大连:辽宁师范大学,2010.
[3]杨金来,张翼翔,丁荣涛.基于网络学习平台的学习行为监控研究[J].计算机教育,2008(11):65-68.