美章网 资料文库 软件开发中信息库的数据挖掘范文

软件开发中信息库的数据挖掘范文

本站小编为你精心准备了软件开发中信息库的数据挖掘参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

软件开发中信息库的数据挖掘

摘要:

随着社会的发展与进步,计算机在社会生活中的各个方面得到了广泛的应用,这样在一定的程度上也就使得了软件技术的发展也会有着很大的发展。在当前社会中,软件技术中的数据挖掘技术就已经成为了软件开发中的一个重要的环节,这样在一定的程度上能够更好提高软件的整体的性能,在实际生活中来满足人们的生活需要,软件技术在开发过程中,就会使其最终构成软件开发信息库,这样在一定的程度上也就是能够实现资源上的共享,有利于对相关技术的传播,进而能够推动软件开发技术的提高。因此,本文主要就是笔者结合自身的工作经验对软件开发信息库的数据挖掘来进行分析,提高相关的建议,仅供参考。

关键词:

面向软件;开发信息库;数据挖掘

在当前社会中,为了能够更加的适应时代的发展与科学技术的颈部,软件开发在信息领域中逐渐的建立起来,同时也取得了一定的成就,在我国的发展上已经是初具规模了。但是在当前的软件开发总通常都是对软件项目的维护与跟踪,这样在一定的程度上是没有真正的发挥出信息库的真正的意义与优势。随着时代进步,越来越多的软件开发的工作人员充分的意识到这一点,进而在开发中也就开始利用数据挖掘该种方式来进行软件的开发。

1软件开发信息与数据挖掘软件

开发信息库主要就是软件开发过程中相关数据的总和,其中充分的体现出信息的数据化,通常情况下主要是包括以下几种信息:①项目信息数据,其中主要是对开发的过程、其中的重要数据、任务细节等。收集项目的信息数据对于后期的开发在一定的程度上是有着重要的作,主要是关系到了软件的最终性能。②源代码,软件开发项目中其中关键的部分就是源代码,这其中在一定的程度上直接的就关系到其执行的能力。源代码包括了软件开发系统的设计代码,升级代码、以及修改代码。③软件开发系统中的相关软件数据等。数据挖掘又被称作是数据中的知识发现,这其中主要包含有四个方面:①数据抽取,通过在数据源来抽取所需要的数据进行研究。②数据预处理,这主要是实际的抽取数据与在开发中所需要的数据是不相符合的,这样必须要对数据中的信息来进行清洗、归纳等。③知识发现。这是数据挖掘中的关键环节,在这个环节中就应该要对数据挖掘中的一些有用的信息中来发现有用的数据,并且需要在实际开发中得到一定的应用。④知识表示,是在软件开发中的表现,对于前三个步骤要进行整理与归纳。在发现实体之间的关系中来进行总结与分析,这样在在一定的程度上也就能够将其中的关键规则进行关联性的应用。

2面向软件开发信息库的数据挖掘

2.1软件开发信息库获取数据方式

2.1.1数据来源

数据来源主要是对数据来源进行获取,若是想要提高有效的数据就首先必须要有数据,这样才能够进行挖掘。软件开发信息中是有着很多的信息能够挖掘的。一般是可以在网络上的开源软件中来获取相关的源代码信息。也就是说,软件开发公司中所开发出的数据信息其若是合理的话就能够建立起相关的信息数据库。

2.1.2数据抽取

在对数据进行抽取之前,首先是需要对我们研究的目标进行一定的确定,这样在一定的程度上就能够保证我们所抽取的数据具有一定的针对性。比如说,想要对软件的源代码进行修改,这样是需要对管理系统领域内的相关代码修改过程进行明确。而软件开发信息库本身就具有一定的复杂性、数量极多特点,这样在一定的程度上必然就会提高数据抽取的难度。所以,在对数据进行抽取的时候是一定要对于数据源的访问权限进行获取,这样才能够充分的了解数据的相关信息。

2.1.3数据预处理

数据预处理主要是有三个步骤:①在对配置系统进行科学的管理,并且还要对没有效的数据进行清除。将重要的信息与软件开发项目导出,这样就能够将分析的结果存储起来。②缺陷系统数据处理,主要是对缺失的属性来处理,在处理过程中是需要对数据之间进行分析之后再进行处理。③对于噪声数据的处理,软件开发的时间与地点的不同,这样也就是会导致任务前后之间的关系也是不同的,这样就会导致系统中会出现噪音,这样就是需要对噪音的数据进行处理,这样也就会为后续的工作奠定了基础。

2.2软件开发信息库的关联修改

在较大的软件系统中,这其中的有一部分的记录在缺失中有着一定的依赖关系,这样在关系就在一定的程度上就会带的软件系统在修复的时候会更加的复杂。因此在,在对关联修改进行数据挖掘的时候是当前多名学者研究的方向。

2.2.1分类研究

当前学术中很多的学者都是将关联修复看作是分类的角度,这样在一定的程度上也就是表示,若是运用已经确定的文件来进行修改,这样就需要对其他文件进行修改或是不修改。有的一部分人员在选择决策数据的时候,都是在已经选定的文件来选择1~2个设定的文件,这样其中的一个为既定的文件组,将其文件的数量、名称等作为依托。这样也就可以很轻松的来判定文件是否与另外的文件相符合。

2.2.2聚类研究

还有一部分的相关研究人员会使用聚类的方式来对数据挖掘进行研究。相关的额研究人员会把修改属性来设定其是否对模块产生影响,同时还是应该要对修改的信息来聚类。

2.2.3规则研究

很多的研究人员会采用关联的规则来进行研究,这种方法通常都是根据软件的记录来记录相关的数据,这样就能够对软件进行修改。在当前中比较常用的关联修改工工具是“玫瑰”,高中软件在使用的时候主要是通过软件代码的方法来进行关联的。在对关联规则修改中,都会对对改动分来进行增加或是减少等,随后还应该要设置支持数来进行依托的。

2.3分析软件演进

软件演进的分析说的就是数据的转换。对于缺陷系统、管理系统中的数据进行转换。①需要的是对这些系统中的信息能够有着科学有效的分析,这样对于系统的有效的数据要分析到位。②要软件开发的整体结构进行全盘的考虑。

2.4缺陷分析

在这个步骤中,主要是根据实际情况来对软件开发的缺陷进行研究与分析。神经网络等分析方法是一个十分有效的方法,在一定的程度上也是对源代码的提取有着很大的帮助性的作用。

2.5软件开发信息库系统的发展

软件系统的发展与应用都是处于长期不断的变化发展中,这样软件的发展也会使得软件系统在不断的改进,这样在一定的程度上也就能够保证软件开发信息库的的质量,软件系统在开发的时候是能够从以下几个角度中来进行分析。①软件代码,解析树法是软件代码中比较常用的分析方法,该种方法在使用中没有给语义上的重视。②软件系统,软件系统。③软件产品。

3总结

在当前的软件开发总通常都是对软件项目的维护与跟踪,这样在一定的程度上是没有真正的发挥出信息库的真正的意义与优势。而随着时代的发展,软件技术中的数据挖掘技术就已经成为了软件开发中的一个重要的环节,这样在一定的程度上能够更好提高软件的整体的性能,在实际生活中来满足人们的生活需要,软件技术在开发过程中,就会使其最终构成软件开发信息库,这样在一定的程度上也就是能够实现资源上的共享,有利于对相关技术的传播,进而能够推动软件开发技术的提高。

参考文献:

[1]张惟慎.面向软件开发信息库的数据挖掘综述.科技创新与应用,2016,03.

[2]高强,贾志淳.面向软件开发信息库的数据挖掘综述.电子制作,2014,10.

[3]周丽英.面向软件开发信息库的数据挖掘综述.中国管理信息化,2016,06.

[4]黄胜.面向软件工程数据挖掘的开发测试技术.复旦大学,2015,05.

[5]白洁,李春平.面向软件开发信息库的数据挖掘综述.计算机应用研究,2008,01.

作者:邢蕾 单位:辽宁公安司法管理干部学院