搜索
热搜: 活动 交友 discuz
打印 上一主题 下一主题

[其他范文] 统计调查工作中数据可视化的创新探索论文

[复制链接]
跳转到指定楼层
楼主
发表于 2022-4-2 19:15:01 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
统计调查工作中数据可视化的创新探索论文




内容摘要:


数据可视化是统计调查数据发布、传播的重要载体,能够更直观、有效地展示统计调查数据开发成果,更有利于发挥统计调查分析研究作用。当前政府统计部门统计调查数据可视化手段还比较简单,运用比例还不高,这与大数据等信息技术飞速发展,数据发布载体多样化,数据受众需求不断提高形成了较大反差。


本文通过分析传统政府统计调查数据可视化方式,总结现有手段的局限性和不足,并结合新数据可视化软件、平台,探索政府统计调查数据可视化创新技术方式及其运用场景,为统计调查工作不断发展、进步作出努力。


关键词:政府统计调查;数据可视化;创新


一、数据可视化相关概念及研究背景


(一)数据可视化相关概念


数据可视化是关于数据视觉表现形式的科学技术研究,其中数据视觉表现形式是以某种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量。数据可视化是一个处于不断演变之中的概念,其边界在不断地扩大,主要是指技术上较为高级的技术方法,允许利用图形、图像处理、计算机视觉以及用户界面,通过表达、建模以及对立体、表面、属性以及动画的显示,对数据加以可视化解读。


数据可视化技术主要借助图形化手段,直观地传达数据集的关键方面和特征,进而有效地传达与沟通信息。其基本思想是将数据库中每一个数据项作为单个图元元素表示,大量的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的分析。


(二)数据可视化发展历程


数据可视化通常被认为伴随统计学的诞生而出现,用图形图像描绘、记录量化信息的思想,从人们开始观察这个世界进而产生测量、管理的需要时就出现了。15-17世纪是可视化起始阶段,随着测量学、绘图学快速起步,三角测量技术、数学函数表相继出现,数据可视化也开始了早期探索。18世纪伴随早期统计学的萌芽,数据可视化进入孕育期,出现了直方图、柱状图、饼图、圆环图等图形形式。19世纪官方统计机构在欧洲普遍建立,数理统计成为一门新的学科,可视化图形开始制定分类和标准,数据可视化成为展示数据信息的常用方式。20世纪借助计算机科学技术带来的高分辨率图形展现和交互式图形分析,数据可视化进入发展黄金期。进入21世纪,随着大数据的发展,海量、高纬、多源、动态的数据特点使得数据可视化技术也取得了长足进步,帮助数据受众从大尺度、复杂矛盾甚至不完整的数据中快速挖掘有效信息。


(三)创新政府统计调查数据可视化方法的意义


随着现代信息技术的突飞猛进,大数据时代使政府统计部门能够通过行政记录、商业记录、互联网与传感器记录等途径,多领域、深层次获取和使用全面完整系统的数据,统计调查数据得以迅速丰富完善。与此同时,统计调查数据发布载体也发生着日新月异的变化,伴随着通信技术、多媒体技术、智能终端等软硬件设施的发展普及,政府统计部门发布统计调查数据的载体不再局限于平面纸介质。


现代数据可视化技术在数据加工中融合了美学因素,顺应了官方微信公众号、微博、短视频平台等统计调查数据新兴宣传展示载体多媒体、动态化的功能需求。同时,网络媒体时代读者碎片化、快节奏的信息汲取方式,也要求数据可视化手段与时俱进具备简洁明了、可交互等特征,以更好地帮助公众理解政府统计调查数据及其分析解读。


数据地图、单词云、时间线、交互图表等新的数据可视化方法可以更好揭示经济发展规律,通过整合琐碎信息,将繁杂的信息要素化繁为简,帮助统计工作者分析经济运行情况,揭示经济发展核心问题,以更加直观明了的方式向公众展示统计数据。同时借助交互功能提高受众参与度,通过互动性提高统计调查数据透明度,提升政府统计公信力。


新的数据可视化方法还可以更深层次揭示社会现象,通过多维度收集数据,并对各维度的数据进行分析、对比得到多种可能,进而分析研究数据间的关系,有利于全方位、多角度分析社会问题。形式多样的数据可视化手段还便于公众认知深层次的社会现象,理解社会热点问题,加强政府统计工作与群众的联系,提高公众对统计工作的配合度,促进统计调查事业发展进步。


二、传统数据可视化方式及其不足


当前,政府统计部门对统计调查数据的可视化主要方式还是通过Excel制作数据表、柱状图、折线图、饼状图等,它们的共同不足是平面、静态,注重突出单个指标的特征,所展示的数据间关系、趋势较为单一。这些可视化方法基本都基于规范采集的结构化数据,难以呈现规模庞大、种类繁多的大数据各变量间的复杂关系,也无法满足公众对数据深渡分析解读的需求。


数据表是政府统计部门最常用的反映统计资料的表格,通过对统计指标加以合理叙述的形式,使统计资料条理化,简明清晰,便于检查数字的完整性和准确性。其主要不足是简单罗列统计指标名称、数据等信息,未使用线条、图形等便于理解数据间关系的表达载体,需要用户自行开展较为复杂的抽象对比分析,难以满足公众具象直观了解统计调查数据资料的需求。


柱状图以长方形的长度为变量,用于比较两个或以上的价值(不同时间或者不同条件),只有一个变量,常用来比较同一指标下的不同群体。其最大不足是只能比较单个变量在某一特定指标下的特征,难以反映海量数据间的趋势性关系,且许多条形图可能还会造成趋势线的印象误导,而不是突出离散值,多组柱形又可能变得难以解析。


折线图是显示值如何变化的一些相互连接的点,通常随时间的推移而变化(连续数据),常用来比较多组数据间的变化趋势。其不足同样也是表达的数据量有限,且关注重点在趋势线,难以分析比较离散的数据点,同时太多的趋势线也使得用户很难看到单根的线,增加了受众在同一纬度比较单个数据关系的难度。


饼状图将单个变量标记成相同颜色的扇形楔形块,然后由多个变量组成一个正圆,用于展示一个数据系列中各变量的大小与总和的比例关系,突出主导份额和非主导份额,常用于显示简单的总数细分。其不足是可表达的信息非常有限,无法多维度展示趋势变化等数据关系,且公众通常难以准确估计扇形面积,如扇形块过多会使得变量值更加难以区分和量化。


三、统计调查工作中数据可视化的创新探索及运用


目前,新兴数据可视化工具主要有可视化库类:如基于java的数据可视化库Echarts,图表种类多,能够实现动态可视化效果;报表BI类:如百度图说、海致BDP等,支持Excel数据导入,可把表格数据转换成复杂图表形式展现;大屏投放类:如阿里DataV提供了丰富的模板与图形,支持多数据源,拖拉式布局,实现高水准大屏效果;专业类(地图、科学计算、机器学习等):如专业地理信息系统软件ArcGIS能制作精准的数据地图,Excel在2016版本后也增加了PowerMap组件,用于数据地图制作,MATLAB、Python、R等还能绘制更为复杂的统计图表。可预见随着5G技术的推广运用,更大带宽、低延时的网络将支持VR/AR等虚拟现实、增强现实技术运用于数据可视化领域,给统计调查数据展示发布带来视觉革命。


现代数据可视化技术在信息技术飞速发展的推动下取得了长足发展,很多在线数据可视化工具为用户提供了多条件、不同维度的数据筛选,结合美学更加直观具象地展示数据,特别是大数据间的内在关系,并为相关统计资料赋予了交互功能,提高了用户参与度。下面仅根据政府统计工作,结合部分数据可视化工具在实际工作中的运用成果,探索新的数据可视化技术在统计工作中的运用途径。


(一)地图图表。地图图表是基于空间或地理分布,直观展现各区域分析指标分布情况的图表。通过将地图作为数据解读的底图,然后在底图上描述数据间空间、数值、趋势等关系,能够非常直观地展示带有地理分布关系特征的统计调查数据信息。


如今年初浙江调查总队在浙江调查微信公众号发布的2019年浙江省域常住居民可支配收入五彩图(图1),该图基于ArcGIS软件将浙江县级行政区划地图作为底图,分类赋予不同可支配收入相应颜色,直观展示了浙江省域居民收入情况。相比于数据表等传统统计图表,该图能够全面具象反映浙江省内区域经济发展和民生状况,收到了受众的大量关注、转发,阅读、在看量比一般推文大得多,排名全年前五。


图12019年浙江省域常住居民可支配收入五彩图


地图图表衍生的热力图能更直观展示大数据信息,可用于特定专项调查研究。笔者年初撰写的《大数据视角下衢州精密智控疫情情况分析》中衢州健康码红码持有人申领时地区分布热力图(图2),就是根据当时全市全部7400多组健康码红码人员数据信息,运用海致BDP数据可视化平台制作。相比传统图表突出特体数据特征,难以反映海量数据间的关系,该热力图直观展示了当时衢州健康码红码人员来源情况,为精密智控疫情提供了参考依据。


图2衢州健康码红码持有人申领时地区分布热力图




更加简便制作地图图表的方式是运用Excel的PowerMap组件,以某地部分小区房屋均价(表1)为例:先使用地址转经纬度坐标插件,将表中小区名称转化为经纬度坐标,再把经纬度添加字段到地图图表位置信息栏,即可在地图上显示位置点信息。然后将表中均价变量添加字段到高度栏,形成地图为的底坐标的柱状图,最后将小区名称添加到类别字段,形成区分颜色的地图图表(图3)。我们还可以在时间栏添加字段,该图表的柱状图部分就能随时间赋值产生动态生长效果,截图为gif格式动图后,在微信公号等新媒体上能起到很好的动态展示效果。且该图表具备交互功能,当鼠标移动至单个柱上,图表会弹出该柱所涉全部信息,非常有利于文稿演示说明。


表1某地部分小区房屋均价




图3某地部分小区房屋均价地图图表




值得一提的是,当前政府统计工作中有一些统计调查数据是自带位置信息的,如CPI手机采价器数据中包含基站定位信息,批量转换为经纬度坐标后可以制作价格数据地图图表,方便用户直观获取不同区域价格信息。商业数据如网约车运行轨迹等也可作为地图图表的位置信息,在专项调查研究中加以分析利用。没有位置数据但具备地址信息的专业如房价调查楼盘信息也可以用转换插件,将文字地址转换为经纬度坐标值用于分析解读。


(二)单词云图。词云是通过形成“关键词云层”或“关键词渲染”,突出出现频率较高的“关键词”的视觉图。它可以过滤掉大量的文本信息,使公众只要一眼扫过文本就可以领略文本的主旨。单词云图的基本原理是根据一段文字表述中某一词组出现的频率来决定该词组的字体大小,然后由不大小的词组组成一个具象图形,其活泼生动的形式能够很好地表达原本只能通过抽象文字描述的统计资料信息,可在非正式的统计调查资料宣传发布中推广使用。


如疫情期间企业面临的困难及期盼(图4),由调查问卷中开放性问题企业回答情况汇总形成,直观展示了电费、社保缴费等在疫情期间获得了减免,并希望能够延长减税降费时间的期盼,同时也反应了部分税费、金融优惠未享受,产品出口受影响,应收账款回收难等问题。相关关键词组成了一个托腮思考的人像剪影,寓意企业面临困难积极思考解决问题的方法,图表生动形象,契合主题,能够迅速抓住读者注意力,非常适合网络媒体平台宣传使用。


图4疫情期间企业面临的困难及期盼


制作单词云图的简便在线工具有很多,Python语言等专业工具还可以实现更加高阶复杂的单词云图。实际统计工作中,面对开放性问题,统计分析说明往往只能通过文字归纳阐述问卷答案,需要读者自行加工理解相关信息,其间还可能掺杂作者个人理解,与客观实际产生偏差。相对于抽象的文字表述,单词云图以关键词出现频率为依据,一定程度上科学反映了文字表述的关键信息,且其融合了美学设计思想,在快节奏的阅读中更易吸引读者。


(三)其他图表。新的数据可视化手段还能制作很多Excel无法实现其他类型图表,如树形图(图5)、关系图(图6)等,它们均具备多媒体、动态、交互特征,适用于很多特定情况下的统计分析表达,值得统计工作者深入学习研究,并在统计调查工作中探索运用,以扩大统计调查资料的接受面和影响力。


图5树形图


图6关系图


四、 总结思考


大数据等信息技术蓬勃发展的新形势下,新的数据可视化方法给政府统计工作发展进步提供了新路径,也给统计调查人提出了新的要求。我们要积极提升自身业务水平,不断提高统计宣传能力,努力在公众和统计调查数据间搭建一座从数据到观点的全新认知桥梁。


(一) 提高数据可视化意识


与数据可视化技术飞速发展相比,当前一些统计工作者还缺乏对数据可视化重要性的认识,把可视化简单理解为统计调查数据的图表形式,相关可视化工作主要还是借助Excel等传统工具,通过新的可视化手段深入挖掘解读数据的意识还不强。政府统计部门作为数据生产和利用单位,理应紧跟时代步伐,进一步提高数据可视化在统计宣传工作中的地位,强化统计工作者对可视化技术重要性的认识,提升在统计工作中积极运用可视化技术的意识。


(二)提升数据可视化能力


新的数据可视化工具需要统计工作者具备理解数据、处理数据、对数据进行设计等专业能力,还要具备能够抓取注意力的审美能力。长期以来,政府统计宣传工作主要注重内容建设,重点培训统计工作者的文字工作能力,对统计调查数据宣传发布的外在形式关注不够,统计工作者宣传统计调查成果的能力也不足。我们要努力提升政府统计工作者的综合素质,借鉴广告学、新闻传播学相关技术手段,加大统计宣传工作的美术包装和创意设计力度,使统计调查数据的深渡挖掘与形式美观齐头发展,统计工作者的综合文字能力和宣传能力并重提高。


(三)扩大数据可视化效用


好的数据可视化作品想要达到最佳宣传效果,还要有形式多样的宣传发布载体。近年来,官方微信公众号等统计工作宣传平台越来越受到各级政府统计部门的重视,新兴数据可视化技术要借势信息技术、新媒体等强势发展的XX,在统计宣传工作积极扩大数据可视化技术的运用比例,加大对统计数据、统计分析、统计报告的图解力度,用精美的设计揭示统计数据的意义,用符合受众习惯的方式吸引更多人关注和理解政府统计调查工作。







文章转载网络,只供大家学习交流,版权归属作者,如有侵权请与网站管理员联系。
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享淘帖
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|公文学堂——公文学习好助手 ( 桂ICP备14006725号

桂公网安备 45010302000992号

GMT+8, 2024-5-8 23:24 , Processed in 0.108431 second(s), 30 queries .

Powered by Discuz! X3.2

© 2001-2013 Design S!|??

快速回复 返回顶部 返回列表