税务研究 2011年 第11期
税收征管
浅议行业税收数据模型搭建一般方法
上一篇 下一篇内容提要:数据深度利用是税收信息化发展的必然趋势。税收数据本身是一种相对复杂的数据,具有多因子、高噪声、随机性、非线性、非高斯分布和不均匀分布等特性,常规的数理统计方法往往不能适应日益增长的数据利用需求。税收数据建模将数理统计、模式识别、人工修正、机器学习等方法融合在一起,对税收数据进行深度挖掘,将隐蔽的、有价值的规律挖掘出来。税收数据模型主要有分行业建模和分税种建模两大类,相比较而言,本文认为对于基层税务机关来说,结合本地区行业特点搭建行业税收数据模型,更具有针对性和可操作性。本文结合本单位搭建水泥行业税收数据模型实践,探索建立行业税收数据模型的一般方法。
关键词:数据,行业,建模
数据深度利用是税收信息化发展的必然趋势。税收数据本身是一种相对复杂的数据,具有多因子、高噪声、随机性、非线性、非高斯分布和不均匀分布等特性,常规的数理统计方法往往不能适应日益增长的数据利用需求。税收数据建模将数理统计、模式识别、人工修正、机器学习等方法融合在一起,对税收数据进行深度挖掘,将隐蔽的、有价值的规律挖掘出来。税收数据模型主要有分行业建模和分税种建模两大类,相比较而言,本文认为对于基层税务机关来说,结合本地区行业特点搭建行业税收数据模型,更具有针对性和可操作性。本文结合本单位搭建水泥行业税收数据模型实践,探索建立行业税收数据模型的一般方法。