中国税务 2018年 第11期 “互联网+税务”

税收数据资源管理与应用探讨

徐夫田 王心慧 韩冬雪 上一篇 下一篇

我国税务系统经过多年的信息化建设,累积了海量数据,如何有效管理和应用海量数据这一基础性战略资源,尤为重要。国家税务总局山东省税务局探索大数据、虚拟化、分布式并行数据库等新兴技术在税务系统的应用,采 用 greenplum+hadoop 搭 建了混搭式的大数据分析应用平台。本文结合省局数据资源平台应用实际,对税收数据资源的管理和应用进行探讨。

一体化整合,构建税收大数据平台

税收数据包括税收业务类数据、外部交换数据、互联网涉税数据等。山东省税务局通过一体化整合构建了数据资源平台,作为税收数据标准,为内部分析应用以及外部共享提供全面、规范、快捷的有效数据服务。此平台归集整合了各类基础数据,累计有超过8 000 张数据表,150 多亿条记录,数据量约20tb。

>>阅读全文