美章网 资料文库 软件工程数据挖掘进展研究范文

软件工程数据挖掘进展研究范文

本站小编为你精心准备了软件工程数据挖掘进展研究参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

软件工程数据挖掘进展研究

摘要:

随着计算机技术的不断发展,数据挖掘也在得到不断的应用和发展。数据挖掘指的是通过对海量数据进行集中,并从中发现或提取有价值的信息或知识的一个过程。软件工程数据挖掘技术是属于数据挖掘技术的一个十分重要的分支,但是本身又有与传统的数据挖掘技术有所区别,具有自身的特殊性。本文对软件工程数据技术挖掘进行了概述,并分析了其发展当中所面临的任务以及挑战,并提出了一些解决的方法,希望软件工程数据挖据技术能够更好地为人类的进步发展服务。

关键词:

软件工程;数据挖掘;进展

互联网正处在不断的发展当中,随着计算机技术的不断发展,数据挖据技术也在不断地被提高,特别是软件工程数据挖掘技术。在目前的数据挖掘技术当中,我们不断致力于自动化技术以及智能技术的开发和应用中,并且不断挖掘其潜力,使软工程数据能够对更加庞大的数据系统进行处理,同时,我们也对技术分析工具不断地进行完善,并使得数据挖掘技术能够更好地为软件工程的研究服务。

1软件工程数据挖掘研究和数据挖掘研究

1.1数据挖掘研究

我们主要将数据挖掘与计算机应用技术和软件工程相联系,数据挖掘之所以能够在庞大的数据当中得到自己想要的数据信息主要是由于它采用了一种新的计算方式,所以我们也将它称为数据挖掘,实际上,这也是一种十分新兴的数据分析方式。由于现代软件工程项目所要研究的任务十分庞大,软件代码量正处在急剧增长当中,伴随着软件代码量的增长,数据量也在不断增加,只依靠传统的数据计算方式不再满足现代的数据分析的要求,因此,人们十分热切地期望有这样一种数据分析模式,能够实现有效信息数据的采集、整理的工作。软件工程数据挖掘就是这样一种数据分析模式。

1.2软件工程数据挖掘研究

软件工程数据挖掘属于软件工程领域当中数据挖掘的一种应用和发展,它能够通过庞大的软件工程数据对现有的技术进行利用,也能够开发出新的算法以及新的数据挖掘技术,并通过提取、分析等一系列步骤,得到软件开发者有价值的信息或者知识的一种过程。软件工程数据在一定意义上属于传统数据挖掘技术的范畴,但它属于软件工程领域,并且有着与传统数据挖掘技术相区别的特点,其特点表现为:软件工程当中数据的提取和处理;软件开发者的数据选择;挖掘算法的选择。

2软件工程数据挖掘的应用现状

2.1数据挖掘技术得到广泛应用的原因

数据挖掘技术之所以能够得到十分广泛的应用,有两个十分重要的原因。

(1)随着计算机存储容量呈现出快速增长的趋势,网络传输带宽也在不断得到增加,在应用软件当中可以存储可供分析的大量的数据信息。

(2)基于计算机技术的不断发展,软件开发的技术也得到了发展,许多数据挖掘算法也能够被彻底地进行研究,所以许多算法都进入到一个前所未有的领域当中,对于用户所需要的隐性需求也能够进行挖掘。除此之外,数据挖掘技术还具有其他的优点,比如存储简单方便、应用成本低等。数据挖掘技术只需要对现有的数据平台进行详细的一系列分析,并不用依附在其他技术平台当中,这就大大减少了一些硬件成本。所以,数据挖掘技术在软件项目的开发中受到了越来越多的重视,也越来越被广泛地应用。

2.2软件工程数据面对的挑战

软件工程数据挖掘也属于挖掘技术的一种,因此,它在操作过程上和传统的数据挖掘有很大的相同之处,我们可以将其大致分为三个主要的阶段:数据的预处理、数据的挖掘、最终结果的评估。在数据的挖掘当中,我们常见的任务包括数据的分类、数据的估计及预测、异常检测和复杂信息的提取等方面。将软件工程数据挖据和传统的数据挖掘相比较,我们会发现软件工程数据拥有自己的特点,这些特点表现在这些方面:

2.2.1数据比传统挖掘中的数据更为复杂

这表现在软件工程数据除了包括版本信息和软件报告等一些较为传统的结构化的数据,还包括了注释、代码在内的一些非结构化的数据。这是两种截然不同的数据结构,不能使用相同的算法来运算,但是值得注意的是,这两类数据之间有着十分重要的内在联系,这就导致了软件工程的数据更加复杂。

2.2.2最终呈现的分析结果的特殊

在传统的数据挖掘的结果中,主要是通过文字或者报表等形式来对结果进行呈现,但是在软件工程数据的挖掘中,除了需要给用户最终的统计结果,还需要提供给软件开发者一些其他具体的信息,比如缺陷定位、涉及结构等相关的信息。所以,这就导致了软件工程数据挖掘需要对一些较新型的结果提交的方法和手段进行深入的研究。

2.2.3挖掘结果难以进行统一的评价

传统的挖掘技术由于发展的时间较久已经形成了一套较为成熟的评价标准,就软件工程数据挖掘来说,软件开发者所需要的信息更为具体全面并且复杂,这就使得表示方式有各种形式,彼此之间也无法进行比较,这就导致难以形成评价结果的统一。所以,我们不难发现软件工程数据挖掘的在数据的预处理和挖掘结果的表述上仍然有较大的发展空间。

2.3开发出更高性能的数据挖掘技术

(1)在对数据挖掘技术进行开发的过程中,软件工程项目更加重视有关重用分析规则的发现和项目的检索。这主要是利用静态动态网络以及树状网络结构相结合来进行规则研究,从规则角度出发进行软件工程内部整体性的挖掘,有利于规则索引手段得到更多的发展,丰富了检索的规则形式,进一步使得检索效率得到提高。

(2)数据挖掘技术和价值的体现还依赖于应用,不同的数据挖掘算法所拥有的应用领域各不相同。例如,我们在市场营销当中,往往会使用Apriori算法,这是因为它适用于市场营销,这就体现在它不仅能够基于现有的数据来进行分析,还能进行预测,并且预测的准确度很高。由于传统的定位技术还存在一定的缺陷,所以需要将数据挖掘技术进行创新融合,从而使得缺陷定位系统更加健全。由于存在一些恶意软件的检索功能,因此,我们需要利用性能更高的数据挖掘技术,及时准确地得到病毒的相关信息,并且能够对病毒进行及时的数据分析以及评估,不断对数据分析的可行性进行提高以及对软件工程开发的安全性能不断进行提高,最终使得软件工程的研究成为一种动态发展的过程。

3结束语

总而言之,软件工程数据挖掘技术在不断的发展当中,相信在未来一定会取得十分瞩目的发展,得软件工程项目的发展变得更加地智能化与自动化。就目前的研究状况而言,软件工程数据挖掘有着十分广阔的发展前景,随着计算机技术的不断发展,其技术也会不断得到改善,从而更好地为我们的社会发展服务。

参考文献:

[1]贺玮.软件工程数据挖掘技术的研究进展[J].科技风,2014(17):141+145.

[2]马保平.关于对软件工程中的数据挖掘技术的探讨[J].电子技术与软件工程,2015(19):196-197.

[3]黄世云.软件工程数据挖掘研究进展概述[J].电子技术与软件工程,2014(21):89.

作者:李思特 单位:同济大学软件学院