很多过往的案例都可以包装成医药大学堂的实验案例,这样就免得有人对号入座了。
这个话题,高翰文先讲了通过咳嗽治疗伤寒的实验案例来讲解样本自选择偏差对因果关系识别的冲击。
其实就是后世流行的幸存者偏差故事的翻版,医药大学堂收治了很多反复咳嗽的伤寒病患者,集中了很多人力物力来治疗咳嗽,避免其加重伤寒,但效果并不明显,伤寒病患者并不见减少。
直到后来联合良民委员会全面走访社团才发现,那些不仅咳嗽,还发热的,基本已经放弃治疗,甚至病亡了十几人。
医药大学堂,是知道伤寒会发热的,但发热的病人太少能坚持到医药大学堂就医参与医学实验了。明明自己看似什么都没做,却因此错过了真正的原因,发热,发热才是引起伤寒死亡的最主要原因。
所以,我们自己辛苦统计调查的东西,也会欺骗自己。自己不一定有错,原因可能是一部分对象永远无法到达而已。
而后,高翰文又讲了一个医药大学堂实验黄花蒿治疗疟疾的案例。杭州外地人多,特别是码头一带的流民帮工流行吃折箩。这玩意,人一多,又都在水边,吃这些,明显疟疾就明显闹了起来。
这个黄花蒿治疗疟疾,无论是直接吃、煮汤药、炮制后用,还是用酒精提取,各种方案都尝试了,但效果一直不明显。
杭州码头,时不时有帮工闹疟疾都成家常便饭了。特别是这几年蚊子变多了后。
直到后面,医药大学堂发现,凡是改行不去码头的,基本都能治好。凡是一直待在码头的,基本肯定会多次复发疟疾。
当医药大学堂扩大样本范围后发现,只要不是在草丛、水潭边上,黄花蒿治疗疟疾效果都很好,而草丛、水潭边最容易滋生蚊虫,而蚊虫居然就是疟疾传播的最大来源。
如果我们一开始选择的样本有偏差,哪怕我们可能看似纯好心也会影响我们的结果与基于此的因果判断。
讲完了样本自选择与样本选择,但凡有脑子的就该知道,了解这个世界的因果是多么复杂了,儒学那套依靠直观道德判断进行经验裁决的路子有多不靠谱。
但这并不是全部。
高翰文又通过医药大学堂统计公告的各科室病患死亡率来讲解反向因果问题,这个最简单,因为在大学堂的附属医院的重症科室死亡率最高,基本接近二分之一。当然,由于名字就给予了提醒,院长才意识到是要死了才去重症科室,所以死亡率高是正常的。否则就要因为过高的死亡率扣科室奖金了。
最后,高翰文犹豫了一下,还是把反映遗漏变量的实验案例讲了出来。
这个案例,跟皇帝有关,高翰文谨慎了一些措辞才讲了出来。
“医学大学堂还做过体重与寿命的研究,尽管一开始,与其体重除以身高后的比值异常,会缩短寿命。道理很简单,太胖太瘦都不合适。但奇怪的是结果一直不理想。但这个比值正常的也没见能多活几年。”
“直到后面发现,我们大明很多士绅天天吃肉喝酒的,又缺乏锻炼,本应该很胖的,却因为沾染了抽烟,而形容消瘦。而调查为了满足稳定跟踪十年的周期,基本选择的士绅的家族或者家丁。”
“当排除抽烟后,结果立马显现出来了。”
高翰文一边讲,一边自顾自地在黑板上画着排除抽烟前后的曲线变化。现场一片沉寂。