机械荟萃山庄

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 2363|回复: 0

武汉1183位求助者的大数据分析下的数字形象

[复制链接]

2万

主题

2万

帖子

16万

积分

超级版主

Rank: 8Rank: 8

积分
164747
发表于 2020-2-22 12:42:28 | 显示全部楼层 |阅读模式

在微博求助患者信息部分,本研究样本涵盖清博大数据提供的2月3日到2月10日期间的400余万条微博数据,从中提取出新冠患者求助信息4233条,经过去重与核实之后得到1183条求助数据。我们进一步提取了每一条微博中的年龄,小区和求助详情等信息。同时我们通过抓取5686个链家小区,将求助患者的地址对应到小区,从而进一步获得街道、区县、房价和房屋年份等信息。

在微博文本的词频统计部分,由于微博用语较为灵活,我们对部分词汇做了规范化,例如将“母亲”统一规范成“妈妈”、“父亲” 统一规范为“爸爸”、“爸妈”统一规范为“父母”。

在媒体分析部分,我们参考了《2286篇肺炎报道观察:谁在新闻里发声》的采样标准,抽取的样本涵盖国内主要的19家媒体,具体包括5家中央机关媒体(新华社、人民日报、中国青年报、中国新闻周刊、健康报)、6家全国性市场化媒体(财新、界面新闻、澎湃新闻、三联生活周刊、人物、第一财经)、2家垂直领域权威自媒体(丁香园、八点健闻),以及武汉、广州、北京三地的3家地方机关媒体(长江日报、广州日报、北京青年报)和3家地方都市媒体(楚天都市报、南方都市报、新京报)。抽样的时间范围为2019年12月31日至2020年2月7日。

在具体样本的选择上,本研究以电子版报纸、官方微信公众号以及新闻客户端作为样本收集来源,患者报道相关性标准界定为病例通报、就诊状况、患者治疗方案、与患者相关政策、对患者生活影响等主题,过滤与患者无直接相关关系的主题,如非肺炎患者的市民报道、与患者无关的志愿者报道、与患者无关的防控政策等,共收集到1413条报道样本。

RUC新闻坊的这篇求助者画像值得一看,她们根据微博上的1183位求助者做出了数据提取。透过冷冰冰的数据,从1183个求助背后,或许得以一窥疫情的残酷。
一:微博上求助的患者年纪偏大,多为65岁以上,这符合新冠50岁以上成年人高危的数据统计,也反映出老年人面对疫情最为无助的事实。
二:求助信息中,【爸爸/妈妈】等这两个词高频出现,证明微博上多为子女为了父母求助。我想这也是求助超话一直在牵动着所有人的原因:我们都身为子女,对失去父母的恐惧与痛苦感同身受。
三:有三分之一的求助者距离医院超过3km。从封城第一天,封市内交通后求助者如何就医就是一个被提出、被攻击、因为求助者再次浮现的问题,即使今天这个问题可能得到因为新冠收治得到缓解,也不要忘记还有非新冠病人。
四:武汉小区年龄价格与患者数量分布。这大概是除了子女为父母呼救外最让人震惊的一个数据:患者分布最多的小区大多为2000年左右、房价多为均价20000左右——我想对大多数关注疫情的人来说,这绝不是所谓“底层”,这就是绝大多数人都认为、并自居的一个“中间”的生活水平。
那些在微博上求助的人,那些我们认为自己在转发帮助的人,从来都不是“弱者”,他们就是运气不好的我们。







本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|机械荟萃山庄 ( 辽ICP备16011317号-1 )

GMT+8, 2024-5-18 20:48 , Processed in 0.089832 second(s), 20 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表