美章网 资料文库 数据仓库技术的企业纳税论文范文

数据仓库技术的企业纳税论文范文

本站小编为你精心准备了数据仓库技术的企业纳税论文参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。

数据仓库技术的企业纳税论文

1山东省基于数据仓库技术的监控系统整体设计

根据数据仓库技术的系统部署,我们将整体的监控系统分为4层:数据源层、数据交换层、展示层、数据中心层。其具体的系统部署如图1所示。其中,数据交换层主要由省、市数据平台的集成,从而形成可覆盖全省的数据系统。实现该系统的集成是通过在省、市建立ODS数据抽取的源适配器的方式,以此对数据进行统一的平台,在省局中建立ODS目的适配器,从而形成数据采集平台;而数据中心平台则由ODS、数据仓库中的OLAP服务器、J2EE服务器组成,通过应用适配器将集成的采集到的数据放到ODS中,并通过时间或者是批次的方式统一存放到数据仓库,而部分会回流到ODS中;展示层是由web服务器、展示工具等组成,其目的是将决策分析的报告结果或查询结果进行展现。

2对数据仓库模型设计

数据仓库作为一个面向主题的、集成的系统,其属于动态变换。因此,在对整体进行设计之后,必须对数据仓库的边界和功能进行定义。本文主要从税收的收入、税收监控信息和队伍建设入手,因此,将功能划分为以下部分,具体如图2.

3纳税评估模型构建

3.1纳税评估概述以及流程设计在完成对监控系统的统一设计之后,可实现对数据的收集和分析。而所谓的纳税评估是指税务机关通过纳税人提交的申报资料,日常的征管信息等进行综合的审核分析,并及时对税务缴纳进行评定和处理。而为了设计的方便,我们采用企业税负率这个指标来对模型进行设计。因为企业税负率在会计中的定义是指企业应缴纳的税费和企业的应税销售收入的比率。纳税评估的流程设计具体如图3所示。

3.2数据挖掘技术算法的确定数据挖掘是针对特定的数据而进行的分析和处理的一个过程。因此,选择不同的数据挖掘技术,其根据是对所选取的结果的挖掘。本文选用Apriori算法,来实现对企业税负率和企业违规等之间的关联挖掘。APrfori算法是有R.Agrawal等人在上个世纪90年代提出的,其主要用在大型数据库上的数据快速挖掘。其主要采用逐层迭代的搜索方式,使用候选项集来找频繁项集的过程。其基本的思路是首先找出所有频繁1-项集,然后用找出频繁2-项集,在利用找出,这样反复找到的K,在第K+1项集是不能找到的过程,并且在这其中利用最小支持度进行筛选,再通过最小置信度与频繁项集产生的关联规则。在选择上述的数据挖掘算法之后,对其参数进行设置。所谓的参数主要是指min_conf与min_sup。并通过模型对进行挖掘。

3.3算法的验证通过模型计算我们可以得出以下的结果:批发行业中为退税企业并且其税负率小于2.5的主要集中在类1;退税企业并且其税负率大于2.5主要集中在类2;不是退税企业and税负率小于2.5的企业主要分布在类3;不是退税企业and税负率大于2.5的企业主要分布在类4.同时我们采用收集不同行业样本,对评估模型进行验证,从而得出其平均的阀值为2.57,误差为2.8%说明评估模型有效。

4总结

纳税评估模型被广泛的应用于企业、政府等各个不同部门。因此,利用现在计算机技术,加强对企业纳税评估的建设和推广,对维护我国的税务环境具有重要意义。

作者:黄敏单位:陕西财经职业技术学院