前言:我们精心挑选了数篇优质数据挖掘学习计划文章,供您阅读参考。期待这些文章能为您带来启发,助您在写作的道路上更上一层楼。
关键词: E-learning应用平台; Web数据挖掘; 个性化学习; 个性化搜索引擎
中图分类号:TP392;G434 文献标志码:A 文章编号:1006-8228(2013)09-05-03
0 引言
计算机通信技术的日益强大支撑了建设学习型社会的需求,远程教育借助它的灵活性与选择性渐渐走进人们身边,成为学习的一种普遍方式。自1996年我国开通了“中国教育与科研计算机网”,开放、灵活的E-learning便迅速被人们所接受并应用于各种网络学校和远程教育之中。
随着时间的推移,人们要求不仅仅只是远距离的教学,更多的是个性化的学习。个性化教育理论认为,学习过程应是针对学生个性特点和发展潜能而采取恰当的方法、手段、内容、起点、进程、评价方式等,促使学生各方面获得充分、自由、和谐发展的过程[1]。但是目前的远程教育学习系统并不令人满意,首先是系统缺乏智能性,学习系统面对的用户并非是一类人,而是不同背景、不同目的、不同时期的一系列请求,面对这些请求,缺乏智能化的系统就难以实现因材施教;其次是缺乏有效的监督机制和有效的学习帮助支持,导致学生偏离学习目标、遇到困难时不能及时得到帮助;再者是有用的教学资源没有被有效利用,造成了资源的极大浪费。“以人为本”的教育理念的逐渐普及,个性化学习方案总体上应该做到学习资源的多维性、学习价值追求的多重性、学习风格的独特性、学习过程的终身性和学习方式的自主性。
基于Web智能的网络教育是现代远程教育的一种重要手段,其可以通过网络来营造虚拟的学习环境,在一个平台上向学生提供丰富的学习资源,从而帮助学生开展基于资源的探究式学习;在虚拟的学习环境中,教师和学生、学生与学生间可以方便地进行同步或异步的交互。数据挖掘便是实现Web智能网络教育的重要方法,主要是通过获取学习者在Web上的学习过程行为数据,如访问信息、时间、次数及喜好等,经过挖掘流程处理,得到学习者的模式规律,从而给学习者提供良好的个性化服务[2]。
1 Web数据挖掘相关分析
1.1 Web数据挖掘基本过程
Web是一个强大的交互环境,所以Web事务度量就需要数据的获取与处理,Web数据挖掘指的是从大量的、不完全的、蕴含的、模糊的WWW资源上提取隐含在其中有用的信息和知识的过程。其处理对象是大量的业务数据,目的是为了提取有价值的知识,提高信息利用率。Web数据挖掘又被称为资料探勘或者数据采矿,是数据库知识发现中的一个步骤。根据大量业务数据的不同类型,Web数据挖掘可以分为:Web内容挖掘、Web结构挖掘、Web使用挖掘[3]。其中,Web内容挖掘是挖掘Internet的页面和后台交易数据库,包括结构化的数据挖掘与非结构化的数据挖掘。无论是哪种数据挖掘,都是为了寻找隐藏着的、大量的、有价值的信息,并且为Web提供更好的服务。
以下给出Web数据挖掘的基本流程。
⑴ 目标数据采集:数据采集就是要记录用户访问行为。数据来源包括服务器端、客户端和端。为了有效地实施挖掘算法,仅仅采集数据是不够的,还需要进行下一步操作:预处理。
⑵ 预处理:目标数据经过预处理才能有效的实施挖掘算法,也就是从目标数据集中除去明显错误数据和冗余的数据,进一步精简所选数据的有效部分,并将数据转化为有效形式。数据的预处理的质量与Web挖掘的效率是紧密相关的。内容包括数据净化、用户识别、会话识别、事务识别及路径补充等。
⑶ 模式发现与分析:模式发现就是对预处理后的数据实施具体的、合理的挖掘算法或综合应用不同的算法。其最终目的是发现用户的访问模式,预先为用户设定学习内容类别。模式分析的目的是根据实际应用,通过观察和选择,将模式发现的统计结果、规则和模型转换为知识,经过筛选后用来指导实际应用,也就是在预先的类别中再次为用户提供个性化资源和学习支持服务。
⑷ 用户反馈:利用数据挖掘与学习内容绑定等各种技术,学习者的学习过程会是以可视化方式进行指导。
1.2 相关算法分析
协同过滤这一概念最早出现在1992年,由Goldberg、Nicols、Oki及Terry提出,随着大大小小系统的应用,协同过滤推荐迅速成为Web数据挖掘中一种很受欢迎的技术。该技术分析用户兴趣,在用户群中找到指定用户的相似用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测[4-6]。
相似性计算是协同过滤推荐算法中最关键的一步,传统的相似度计算方法有三种。
⑴ 余弦相似性
把用户评分看做n维项目空间的向量,用户间的相似性通过向量间的余弦夹角度量,设用户i和用户j在n维项目空间上的评分分别表示为向量k,e,则用户i和用户j之间的相似性为:
Sin(i,j)=cos(k,e)= ⑴
⑵ 修正的余弦相似性
余弦相似性度量方法中没有考虑不同用户的评分尺度问题,修正的余弦相似性度量方法通过减去用户对项目的平均评分来改善上述缺陷,设经用户i和用户j共同评分的项目集合,则用户i和用户j用户之间的相似性为:
Sin= ⑵
其中,Rij代表用户i对项目c的评分,和分别表示用户i和j对项目的平均评分。
⑶ 相关相似性
设经用户i和用户j共同评分的项目集合用Iij表示,则用户i和用户j之间的相似性sin(i,j),通过Pearson相关系数度量:
归根结底,三种相似方法均为基于向量的相似度计算方式,进行对象属性之间的严格匹配。
余弦相似性度量方法把用户评分看作一个向量,用向量的余弦夹角度量用户间的相似性,然而没有包含用户评分的统计特征;修正的余弦相似性方法在余弦相似性基础上,减去了用户对项目的平均评分,然而该方法更多体现的是用户之间的相关性而非相似性。相关性和相似性是两个不同的概念,相似性反应的是聚合特点,而相关性反映的是组合特点;相似相关性方法,依据双方共同评分的项目进行用户相似性评价,如果用户间的所有评分项目均为共同评分项目,那么相似相关性和修正的余弦相似性是等同的,用户对共同评分的项目集稀少,使得相似相关性评价方法实际不可行。
2 基于Web数据挖掘的个性化学习系统模型
基于Web数据挖掘的个性化学习系统采用的是三层B/S模型,如图1所示。
个性化与智能化功能模块的实现都是以Web为基础的。服务器是一个核心,用户通过客户端发送一系列请求,Web服务器作出相应的响应,也就是在后台数据库中查询信息,查询到的信息再返回给Web服务器,最后服务器通过网页的形式呈现及反馈给用户。
2.1 主要功能模块分析与设计
基于Web数据挖掘的个性化学习系统主要是由学习者、学习者个人秘书、管理员、个性化推荐引擎及教学资源等模块构成。其中系统的核心部分是“学习者个人秘书”。当学习者通过身份验证后,便会进入个人的学习页面。“学习者个人秘书”根据学习者的访问习惯和学习者提交的要求等信息进行自动整合(这里主要是由用户信息收集和用户信息建模两个模块来实现),并进行内部建模,形成一套完整的学习方案,并对此方案进行资源调度,进而反馈给学习者所需的资源信息。“学习者个人秘书”也就是所谓的个性化处理引擎,它主要由四个模块组成:用户信息收集、用户信息建模、个性化学习方案、学习资源调度。该个性化学习系统方案构建如图2所示。
⑴ 用户信息收集模块
信息收集模块是实现在线学习个性化服务的基础,它收集用户请求,跟踪用户的行为,结合用户数据库中事先存放的用户个性化特征数据,经过预处理,对用户信息建模提供个性化的策略。
⑵ 用户信息建模模块
信息建模模块则是运用数据挖掘技术对这些信息进行分析,不断更新或者初始化用户数据库中动态部分,以生成个性化推荐策略并发送给个性化学习方案模块。
⑶ 个性化学习方案模块
学习方案模块是“学习者个人秘书”的核心模块,它结合前面提供的一系列用户特征信息,并进行整合后自动生成一套教学方案,把教学方案中所需要调度的资源传递给资源调度模块。
⑷ 资源调度模块
资源调度模块是根据教学方案中需要调度的资源从视频库、作业库、试题库等资源库中调度并反馈给用户。其中,资源库中保存学习者的基本信息、学习历史、访问历史、对知识的掌握情况、学习喜好等个性特征。学生的个性特征也分为静态信息与动态信息。如学生的姓名、性别、年龄、ID、密码等都属于静态信息,如学习历史、学生做过的练习和测试题的答案、学习者的知识结构等都属于动态信息。学生的个性化特征信息是实施个性化教学策略的基础。
总之,整个个性化在线学习系统就是通过数据挖掘技术,把用户在学习过程的所有行为记录下来,并结合用户数据库,从中挖掘出用户个性化学习特征,为个性化教学策略的产生提供可靠的依据。在本文,学习者个人秘书个性化引擎的加入,主要是实现个性化学习系统中视频主导、测验穿插、在线交流、引导学习等功能。其中视频能提取该集视频所具有的知识点,作为关键字在知识树中进行串联。知识树是惟一呈现给用户的学习接口,让用户不再注重于选择何种视频、哪位老师所教,达到最快的学习效率。再就是测验穿插,是在用户不主动去做测验的时候,类似强制于用户做测验,否则无法进入下阶段测试。概括来说,学习者个人秘书模型设计实现以下功能:记录学习者进行的所有学习活动;定时给予用户学习建议与误区纠正;能主动与其他学习者的学习秘书进行交流;记录每次学习周期,学习者的学习路线。
2.2 Web数据挖掘在系统中的应用
数据挖掘是开发Web智能的学习系统的关键所在,它对个性化学习模型的构建、个性化的学习资源的提供、个性化学习的指导、系统性能的改进等方面应用非常多。
⑴ 个性化学习模型的构建
学习者模型的构建本就是根据学习者不同的个性特征参数,对学生学习活动进行跟踪,并且记录学生学习的相关信息,如:学生经常访问的URL的次数、停留时间、访问的课程数等等。Web数据挖掘用去噪和模式进行“模式发现”,得到学生学习的个性特征,建立、完善学生学习模型,建立学生个性数据库,为不同的学生提供智能、个性的学习策略。
⑵ 个性化学习资源的提供
在系统进行模式发现后,需要为学生从后台数据库中调度学习资源,这时候就需要系统将学生无关及学生不感兴趣的资源进行筛选。Web数据挖掘中的统计分析技术可以根据学生经常访问的页面推测学生下一步的行为,推测出其感兴趣的相关资源,从而减少学生的搜索时间,合理提供备用资源。
⑶ 个性化学习的指导
一个好的学习系统能适应的并不只是一类人,而是不同背景,不同能力,不同目的的人,因为每个人的学习能力、兴趣、习惯以及基础都有很大的差异。若采取进入系统平台前让用户提交测试用户属性信息的一些表单,初始化学生学习特征,但是其中的属性却是时刻变动的,普通的学习系统无法做到随机应变。利用Web数据挖掘技术,挖掘用户的使用数据日志,分析用户的浏览趋势,从而形成一组按时间排序的会话,预测用户未来的访问模式并做及时的指导。这样针对不同类型的用户,系统可以安排特定的内容,做到真正意义上的“因材施教”。
⑷ 系统性能的改进
Web数据挖掘技术提供网站构架及用户的使用信息,管理员可以根据这些信息,控制Web缓存、负载平衡和网络构架等问题,从而做到了系统的安全性与稳定性。
3 结束语
基于Web数据挖掘的个性化学习系统研究,以“个性化E-learning系统研究与实现”课题为背景,实现了Web数据挖掘技术的应用、学习知识点概念相关性的算法分析与设计、且构建一个基于Web的学习者模型,阐述系统研究思路,并完成了系统设计与实现应用。在一定基础上为在线学习系统的个性化应用提供理论与推广参考价值。同时,本文虽取得了具体的应用效果,但在个性化学习资源的组织与动态呈现上未能与学习者模型联系,以呈现针对不同用户的个性化学习内容页面。这将是今后需要进一步研究的问题。
参考文献:
[1] 陶剑文.基于多Agent的协作式网络学习系统模型研究[J].计算机时代,2006.7:64-66
[2] 单蓉.一种基于用户浏览行为更新的兴趣模型[J].电子设计工程,20l0.4:61-62
[3 唐远洋,黄尔嘉.知识挖掘技术与网络教育资源的组织[J]. 情报资料工作,2005.4:107-109
[4] 游文,叶水生.电子商务推荐系统中的协同过滤推荐[J].计算机技术与发展,2006.9:97-99
[5] 邱明虹,何跃.从Web日志中挖掘用户兴趣路径算法改进[J].计算机工程与应用,2008.26:129-131
关键词:高职教育;个性化学习;数据挖掘;商业智能
中图分类号:TP311.13
作为我国高等教育一支重要生力军――高等职业教育近几年来的发展可谓迅猛,无论是学校数还是学生人数,高职专科的规模已是我国高等教育的半壁江山。高职教育对人才的培养目标是为国家和地方经济的发展输送适应生产、建设服务等一线急需的应用型高素质人才,《国务院关于大力发展职业教育的决定》中就提出了“坚持以就业为导向,深化职业教育教学改革”,要求加强职业院校对学生实践能力和职业技能的培养。
1 现状
目前,高职学生在学校完成系统的课程学习依然是高职教育教学的主要方式,在此过程中,由于学生个体特性、就业意向、专业方向等各种因素的影响,获取的知识无论从方式方法、内容结构,还是真正掌握的程度来说都因人而异,而这其中有相当大的部分是学生主动性选择的结果;此外,在高职教育教学改革的尝试中,大类招生、拓展专业等多项措施在很多职业院校中已然试行,这就给予学生更多的自和选择的机会。
然而,在自主选择的过程中,由于没有一个可参照的、适合自己的挑选标准,高职学生进行各项选择时在很大程度上有着“扎堆随大流”、“哪个课能混好过”的心理,这就导致主动选择的课程,其学习过程并不顺畅、学习效果也不理想,没有提升自身知识结构的质量。这种高职教育中教与学环节的脱节会对高职学生的能力培养产生有着不可忽视的影响。
2 研究思路
随着教育信息化的深入发展,先进的信息技术手段在教育教学的方方面面都得以有效利用,这也为学生综合能力培养的探索与尝试提供了新的途径,数据挖掘技术就是其中很重要的一种。数据挖掘指的是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。在此过程中,数据源必须是真实的、大量的、含噪声的,而从中发现的是用户所感兴趣的知识内容,这些知识应该是可以接受和理解、并且能加以进一步运用的。
数据挖掘技术之所以在教育行业有更为广泛、实际的应用,这是由于各个学校都会有自己的一整套数据库系统,用于记录学生的学籍信息、课程教学过程等历史数据,这样,就可以尝试运用先进的数据挖掘技术和智能分析工具,通过对高职教育研究和教学过程中积累的海量数据进行采集分类、挖掘和分析,从多角度、多层次出发,构建识别个体特点、知识构成和获取方式等要素之间关联模式的数据模型。数据挖掘是一门交叉学科,其理论和方法有很多,包括K-最近邻分类器、判别分析、人工神经网络和分类树等,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。在这里就是要将数据挖掘方法与高职教育教学研究相结合,设计实际的分析应用系统,具体来说:
(1)数据挖掘技术面向高职教育这一特定领域中的主体――高职学生,针对专门的指标,包括个体特性、专业要求、就业意向等,着眼于课程这个知识载体,对它们之间的关系进行深层次、智能化的挖掘、分析;
(2)数据挖掘的应用会具体到建模、变量筛选和导入等方面,而不只是一些抽象的挖掘算法的研究;
(3)数据分析采用先进的商业智能工具,同样,数据的展现手段基于平台,具有开放化、模块化、网络化特点。
3 系统框架
系统定位于个性化学习分析,其框架结构参见图1,主要由数据集成、数据建模、数据分析及展现等部分构成。具体来说,数据集成模块完成定义数据结构、装载、清洗、合并数据的功能;数据建模是指建立数据分析OLAP及数据挖掘模型;数据分析旨在分析和比较各种不同算法得出的结果,寻找最为匹配的算法,而数据展现的作用是根据分析结构灵活创建数据报告。
图1 系统框架结构
在此架构下,各个子系统的功能如下所述:
(1)数据集成。分析和归纳课程教学过程中产生的系列数据,根据其特征和行为设计及定义便于分析和挖掘的数据结构,然后并进行数据集成。数据集成的工作包括从异构数据源获取数据,将其进行清洗、转换、合并,然后加载到数据仓储中。数据集成执行的时间、相互的顺序、成败对将来的分析结果的有效性则至关重要。
(2)数据建模。典型的数据挖掘工具将在构建了数据仓库后进行分析并生成结果,一些工具也可以使用关系型数据进行分析,数据分析的结果独立于数据仓库中使用的数据。数据挖掘核心的部分就是选择挖掘算法并建立数据模型,这样就可以根据学生个体信息、学生成绩等数据之间的关系将这些学生划分成分析有意义的组群并预测他们的行为;当把这些组发送回分析过程时,数据挖掘引擎允许分析人员和用户根据这些簇进行划分和细化。
(3)数据分析与展示。以学生个体信息和课程数据为输入,利用所筛选出的最佳建模方法,逐步提出一个可实现个性化学习分析的数据模型,以衡量及提高模型预测的准确度。将分析结果以特定的客户端或Web方式进行展现,以建立的分析结果展示平台,具有高度的开放性、通用性和可扩展性。通过建模创建了正确的模型,数据挖掘的重点就从分析转到结果上,数据报告的展现方式有多种,可通过专业的报告工具,也可自行编写Web网站进行。
4 结束语
在高职教育教学研究中运用先进的数据挖掘技术手段,针对各项课程教学、学生管理数据进行深度挖掘、分析,研究个性化学习模式,为学生的自我学习规划提供具体化、智能化分析结果以供参照,在此情况下,先进技术手段的支持,对教与学都有着不可忽视的影响。同时,也为人才培养的探索与尝试提供新途径。
参考文献:
[1]赵云鹏,石丽,刘莹.基于数据挖掘的高校规模分析及应用研究.第九届全国信息获取与处理学术会议论文集[C].2011.
[2].数据挖掘在高职院校教学管理中的应用[J].清远职业技术学院学报,2010(12).
[3]干娟.基于决策树算法的学生综合测评系统的设计[J].安徽电子信息职业技术学院学报,2011(04).
>> 从家庭视角探究中西方文化价值观的差异 动画片《功夫熊猫》中的中西方文化价值观的异同研究 从中西方文化价值观的差异性看公益广告的翻译 中西方文化价值观交融的绝对性与相对性分析 中西方网络广告的文化价值观比较 高中英语中西方文化对学生价值观的影响分析 浅谈中西方文化背景及价值观差异 大学生文化价值观及其班级旅游研究 中西方文化背景下的大学生心理健康教育研究 浅谈大学生外语教学中中西方价值观有效融合途径 《红字》中的西方文化价值观解析 从《当幸福来敲门》看西方文化价值观 《特洛伊》中的西方文化价值观解析 中西方核心价值观比较研究 中西方体育价值观比较研究 浅论大学生文化价值观的培育 大学生文化价值观调查与分析 高等教育模式中的大学生多元文化价值观 浅谈新疆大学生文化价值观教育 大学生文化价值观的培育与优化 常见问题解答 当前所在位置:l.
[3]任友群,郑旭东,吴F瑜.深度推进信息技术与教育的融合创新――《教育信息化“十三五”规划》(2016)解读[J].现代远程教育研究,2016(5):3-9.
[4]杨现民,唐斯斯,李冀红.发展教育大数据:内涵、价值和挑战[J].现代远程教育研究,2016(1):50-61.
[5]余鹏,李艳,吕鹏.高等院校大数据挖掘与决策分析体系的应用研究[J].现代教育技术,2016,26(8):102-108.
[6]朱汉民.中国传统文化导论[M].长沙:湖南大学出版社,2010.
[7]欧阳剑波.中国传统文化、、西方文化碰撞的当代审视[J].青海社会科学,2011(6):17-21.
[8]杨玲.从网络流行语看大众文化特征[D].武汉:华中师范大学,2006.
[9]郭志刚.社会统计分析方法:SPSS软件应用[M].北京:中国人民大学出版社,1999.
[10]安兴茹.我国词频分析法的方法论研究(I)――统计分析要素的界定、分类及问题[J].情报杂志,2016,35(2):75-80.
[11]程树铭,吕亚萍.试论语义特征分析法[J].江苏理工学院学报, 2015(3):25-30.
[12]张敏.数据挖掘技术及应用[J].信息技术,2010,34(8):167-169.
[13]齐英艳,李建国.当代西方思想文化对中国青年知识分子的影响[J].中国青年研究,2008(9):25-30.
[14]闵会轩.中国社交网络中的文化价值观分析[J].东南传播,2015(1):34-36.