上世纪80年代,托夫勒在他的《第三次浪潮》中首先描述了科幻版的大数据(big data),当时的数字化数据的产生速度以现在的眼光来看其实是非常缓慢的,而且当时云计算尚未兴起,充其量处于大数据时代的前夜,因此我暂且把他所指的大数据称作“科幻版的大数据”。10年前,当我念博士的时候,旁边宿舍里一哥们整天价都沉默寡言在带有弧形显像管屏幕前,不知道他在倒置什么。
上世纪80年代,托夫勒在他的《第三次浪潮》中首先描述了科幻版的大数据(big data),当时的数字化数据的产生速度以现在的眼光来看其实是非常缓慢的,而且当时云计算尚未兴起,充其量处于大数据时代的前夜,因此我暂且把他所指的大数据称作“科幻版的大数据”。
时隔30年后,耄耋之年、青松不老的托夫勒先生有幸目睹了他曾经想象中的图景变为现实。信息技术革命发生后,整个世界在微软、谷歌、IBM、腾讯等大大小小的力量的推动下,全世界每年会创造18亿兆的数据,而且,这个数字每两年会翻一倍。据说,2014年12月31日1天中人类产生的数字化信息的体量是美国国家图书馆藏书数据的总和。在互联网上,你的手指每一次碰触屏幕,就会产生相应的数据;你在微信里每晒一张图片,就会给这个世界创造0.4M的数据……昨天晚上7点多时,一时兴起在京东订了一盒荞麦茶,结果是今天早上九点半时分,京东哥的电话就来了:“有你的包裹!”是的,大数据技术像雾像雨又像风,拂面而来,却又捕捉不到。那么,大数据时代对于医学会带来什么?
10年前,当我念博士的时候,旁边宿舍里一哥们整天价都沉默寡言在带有弧形显像管屏幕前,不知道他在倒置什么。处于好奇,我凑上去看时,却只是发现一大堆乱七八糟的代码和FTP之类的东西。我问这是啥,他答曰“跑数据”。再问啥数据要这样子跑,他开始很不屑地白了我一眼:“蛋白三维建模呢”。我带着挫败感回到我的电脑旁,开始从PubMed出发。
这一次的旅行意义非凡。我开始知道,在这么一个互联网上的一个网站中,PubMed包含了为数众多的数据库,从蛋白质到核酸,从疾病到基因,Protein Cluster、OMIM、Nucleutide……每一个数据库里,眼花缭乱地分类存放着生物医学的大量信息。比如要研究某个帕金森病病人是不是因为一个基因的异常所致,你就要知道前人已经知道的哪些基因与帕金森病有关,在PubMed上进入gene数据库,输入Parkinson disease后,你会发现迄今有716条相关的研究记录;进一步点击其中一个记录比如SCNA,数据会将你导向这个基因的相关信息(见下图);在进一步,你想要知道这个基因在人的哪个染色体上,它的核苷酸序列如何,旁边都有些其他什么基因,将来这个基因会编码成啥样的蛋白质,长啥模样,你都会从医学海量的信息中被指明迷津。10年前那个沉默寡言的哥们后来连着发了三篇像样的SCI论文,都是关于蛋白结构模拟方面的,后来就去了米国,至今杳无音信。现在想起来,他就是我念书那个时代大数据的先行者。
那么,讲个不那么枯燥的故事。有一天,我的一个患者非常生气地向我诉说她在保险公司所遭受的愤怒。50多岁的她在保险公司投了一份健康保险,合同约定如果她住院,就会报销相当一部分医疗费用。然而,2月前她因眩晕、恶心、呕吐真的住院了,出院后前去办理保险理赔时,对方说:对不起,我们调取了你以往的病历信息,上面显示你以往并不健康,患有某某还有某某疾病,因此,我们不能赔付。
母体排卵的时间可以通过体温的变化来推算,受孕的时间可以精确到分钟,胚胎在母体中的10个月里会经历数次胎心和B超的检测,出生时会有一个系统的评价,而且,通过现代的基因分析技术和疾病遗传建模过程,可以对这个孩子未来容易罹患的疾病进行预测。一个人每天摄入了多少糖、蛋白质和脂肪,行走了多少步,消耗了多少卡路里,平均心率是多少,血压多少,睡眠多少小时,排尿多少毫升……诸如此类,都会产生健康相关的数据。更不用说生病了去医院,验血、心电图、CT、B超……诸此等等,都会产生大量的信息和数据。通过这些数据的汇集和分析,可以产生一定的结论。其中有意思的一项研究是首都儿科研究所对1948年至1954年在北京协和医院出生的人进行分析(想象一下,这些数据的采集有多困难,60年哪!)表明,出生体重可以影响成年后多种疾病的患病风险,胚胎发育时期的不良影响可以持续终生。比如低体重儿更容易患冠心病;出生体重与其成年后的血压呈反比,出生体重过低的人成年后血压会更高……等等。
这些其实仅仅为医疗方面大数据应用的雏形。随着可穿戴设备的兴起,每个人都可能会被大数据的传感器所包围。数月前有人对于iPhone中关于定位服务收集个人隐私的事情进行了披露。的确,一个人一天中去了哪里,在某地逗留了多久,又去了哪里,都会被定位数据收集系统所收集;如果把地图信息和定位数据整合,那么一个人一天所做的事情就一目了然:比如在中午12:10分到12:50,定位一直处于南二环东段的星巴克,而且调用星巴克WiFI登录数据,就会知道这天中午你在星巴克点了2杯大杯的拿铁(另一杯可能是给你女朋友滴 )……通过调阅你最近半年的网购数据,可以分析出你喜欢喝illy的咖啡,再通过两次咖啡购物的消耗量,可以推算你每天的咖啡消耗量,也会再进一步预测你患肥胖症的风险下降多少,患帕金森病的风险下降多少,胃溃疡的发病风险增加多少等等。
不仅如此,一个人一生中会有多次就医经历,每次就医都会产生大量的数据,这些数据的整合和分析可以得出许许多多有价值的结论,不但可以洞悉过去,还可以预测未来。同时,大规模基因测序技术的成熟,使得健康大数据时代真正到来。人类面对自己海量的医学健康数据会做些什么?
一年前的一个寒冷的下午,一位64岁的男性患者在儿子的搀扶下走进了我们的诊室。两年半以前,他曾经是我们科的一个住院患者,这次是因为眩晕3小时而来。打开HIS系统,调取他的2年半前住院病历后,PACS系统随后打开,他2年多前的颅脑MRI的数据迅速出现在我面前,数据显示:当时患者右侧PICA有串珠样明显狭窄的征象,当时给予抗血小板药物和他汀长期治疗。那么这次患者眩晕再发最大的可能因为这条动脉闭塞所致。于是紧急启动溶栓程序,颅脑MRA确认,的确为右侧PICA闭塞。由于根据前期数据预判了患者此次的疾病,因此有准备的战争占有了先机,节省了宝贵的抢救时间,经过紧锣密鼓的治疗,患者症状很快缓解。
这虽然谈不上是大数据使用,但已经与大数据时代的脉搏吻合了。追逐时代的浪潮,医学信息的大数据时代正在到来,让我们学会搜集、整理和分析这些信息,为患者的健康而服务,这正是大数据时代对医生的要求。
更多精彩内容请关注微信号“神经科学”(Neuroscience-Brain)——原创的医学健康资讯!
微信号“神经科学”(Neuroscience-Brain)为陕西省人民医院老年神经科(神经内三科)一群热爱科学的临床医生自创的公共平台,励志宣扬医学和神经科学前沿知识,篇篇原创,句句精彩!金宝搏网站登录技巧 老年医学网独家授权转发,其他任何机构未经授权谢绝转载。
copyright©金宝搏网站登录技巧 版权所有,未经许可不得复制、转载或镜像
京ICP证120392号 京公网安备110105007198 京ICP备10215607号-1 (京)网药械信息备字(2022)第00160号