


「谁做研究查百度?」
「哈佛啊!」
这是最近网络相当流行的一个段子。
其源头来自 哈佛大学与波士顿大学团队近期联合发表的一篇论文,该研究结论称「 对中国武汉市医院流量和搜索引擎数据分析表明,当地 2019 年 8 月已经发生新冠疫情」。
DASH 平台截图
这篇论文被发表在哈佛大学的论文预印本平台(Digital Access to Scholarship at Harvard, DASH)。
虽然这是一篇 未经同行评议、也未在期刊正式发表的论文, 但由于该论文第一作者 John Brownstein 本身就是美国广播公司(ABC)的撰稿人,研究结论迅速以新闻报道的形式在新闻网站刊发。
随后,BBC、CNN 等媒体纷纷以「哈佛大学发现 COVID-19 在去年 8 月已在武汉地区流行」为题进行报道,其中不乏政要身影。
特朗普在其个人社交媒体转发该消息
路透社发布该结论
然而,尽管这篇文章出自大名鼎鼎的哈佛大学医学院等知名高校之手,但其研究设计、数据、方法、结论却都存在很大的问题。
哈佛是怎么用百度搜索的?
该研究结论中的「搜索引擎」,就是百度。
确实,这种研究设计和方法让人很有耳目一新的新颖感——该研究利用卫星图片分析过去两年间武汉地区 6 家医院停车场停放车辆数量的变化,对比武汉地区同期「咳嗽」、「腹泻」等关键词检索的百度指数,试图以此论证武汉地区的新冠肺炎疫情最早可能发生于 2019 年 8 月。
实际上,类似的方法并非在这篇文章中第一次应用。
在此之前,有不少研究对互联网数据和卫星遥感数据在预测流行病变化趋势上的作用做出过探索。如 2009 年有研究者在新英格兰杂志上发文,通过 Google Insights for Search 中腹泻相关检索数据的波动,预测沙门氏菌等消化道病原体引起的流行病爆发 。
但与之前的类似研究相比,这篇文章只「借鉴」到了研究方法的皮毛,却在核心的研究设计上出现了逻辑性的问题。
首先,这篇研究的作者虽然以搜百度为重要研究方法,却并没有在论文中提及用来获得百度检索指数的具体关键词。
诡异的是, 无论通过「咳嗽」、「腹泻」、「拉肚子」等常用关键词进行,都无法重现论文中提供的变化曲线。
该文中展示的「咳嗽」、「腹泻」等关键词百度检索指数随时间推移变化曲线
通过「腹泻」、「拉肚子」、「呼吸困难」、「气短」等关键词进行百度指数检索中,均无法再现该论文中的变化趋势
很快百度官方出面回应:武汉地区「咳嗽」和「腹泻的检索量和检索曲线与往年的流感季及秋冬季相比,均无明显变化,该研究结论「非常牵强和不严谨」。
有热心网友通过邮件联系到了该文的通讯作者 John Brownstein,得到的回复是,该团队所用检索关键词居然是「腹泻的症状」——这显然不符合中国人的语言使用规范和习惯。
此外,新冠肺炎作为一种呼吸道传染病,虽有消化道症状、神经系统症状甚至泌尿生殖系统症状的报道,但绝大多数患者仍然以发热、咳嗽、呼吸困难等呼吸系统症状为主。此前钟南山团队发布研究结果显示,仅 3.7% 患者出现腹泻症状,远低于出现发热(87.9%)、咳嗽(67.7%)。
钟南山团队研究
在通过百度指数等搜索引擎趋势数据的使用上, 这篇研究在得出主要结论时,却在没有排除「消化道传染病」混杂因素的情况下,选择了「腹泻」这一新冠肺炎不典型的症状作为反映新冠肺炎流行趋势的指标。
实际上,研究者也选用了「咳嗽」这一与新冠肺炎相关度更高的症状检索数据,但其结果显示,与往年季节性流感的数据对比后并无明显差异。
这样看来,研究者并非不知道其他疾病对于搜索引擎数据的混杂偏倚,但在探讨「腹泻」的检索数据变化的时候,却选择的了无视和含混不清。
开车,不开车?这是个问题
该研究的另一个关键数据来源是通过卫星图片中停车场的车辆变化,来反应当地新冠肺炎的流行趋势。 这一方法成立的重要前提是:停车场的卫星图片可以用来估算医院的就诊患者人流量。
这前提在目前的美国可能是适用的——美国群众对汽车的保有量和对汽车的依赖度都很高,驾车去医院看病是一种主流行为。 但如果我们把时间地点放到 2019 年的武汉,会发现这前提无法成立。
在我国人口密集大型城市,医院停车难是一个普遍存在的问题。在武汉这样公共交通和医疗资源相对发达、医院大多集中在人口密集区域、停车条件相当有限、外地就诊患者比例较高的城市,驾车并停在医院停车场看病并非主流选择,更为现实的选择是,借助公共交通系统或驾车到医院后放下人离开。
除了中美两国患者就诊习惯差异外,医院停车场内的车辆也不一定来自就诊患者,也可能来自医院工作人员,停车场的改造扩建、医院周边设施的停车环境变化也可能对医院内车辆停放量造成影响。
在通过卫星图像分析医院的车流量时,对于 2019 年 1 月初~2020 年 4 月底总共 15 个月的时间跨度、6 家医院的停车场的研究范围,这篇文章一共分析了 140 张卫星图像。 平均到每家医院停车场,相当于每月只有 1~2 张卫星图像。
但对于一家医院来说,无论是某个月份的某一周、某一周中的某一天、某一天中的某个时间,都可能存在很大的停车量波动,这一点在该研究中所附的图像中也有明显体现。 但该研究只在卫星照片上标注了图片采集日期,对于具体采集时间却只有「中午」这个模糊的时间段。
在数据分析的过程中,研究者没有控制数据采集时间的变量,而是直接对来自不同医院、不同时间的数据进行了拟合曲线和回归分析。
这里有一张该文中医院停车量的拟合曲线图。不难看出, 由于采集数据量太少,各家医院的停车辆波动十分剧烈。
在作者声称出现「显著增长」(steep increase)的 2019 年 8~11 月期间,图中的拟合曲线波动,几乎都来自湖北省妇幼保健院和武汉天佑医院数据中的一次剧烈增长的离群值,其后这两家医院停车量数据再次明显下降。
有网友发现,将停车数量曲线中 10 月份武汉天佑医院的离群值去除后,该论文的核心论点——停车数量在 2019 年下半年的波动——将不复存在。
然而,对于这些潜在的系统性混杂偏倚因素,这篇研究并没有引用相关的研究论文进行分析和讨论。
WHO 回应:研究结论无证据支持
当地时间 6 月 10 日,世界卫生组织紧急项目负责人回应称,没有证据能够支持该研究结论。
世卫组织发言人回应
研究设计存在逻辑性漏洞、数据采集不规范、分析结论各种「硬伤」、通讯作者扮演记者、将舆论的热度置于结论科学性之上……虽然这篇文章出自哈佛大学医学院等知名高校研究团队之手,但其研究水平与后续操作,实在是难以与其平日的盛名匹配。
这样一篇蹭热度的研究是怎么被哈佛预印本平台接受的?在学术研究领域,莫非下蛋母鸡的名字比蛋自身的水平更重要?我们不得而知。
学术研究也许的确需要「蹭热度」,但绝不能只要新颖,不要严谨和学术规范。疫情肆虐之时,更应遵守科学和道义。 (责任编辑:gyouza)
“特别声明:以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布,本平台仅提供信息存储空间服务。
Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”