描述
开 本: 32开纸 张: 胶版纸包 装: 精装是否套装: 否国际标准书号ISBN: 9787111536635
我们很多人都在网上查找过有关医疗健康的信息,例如,偏头痛的症状、药物的药效、癌症患者需要的资源信息、性病的症状以及肥胖的标准。皮尤 (Pew) 研究中心的一项调查报告显示,美国逾八成网民在网络上搜索过此类信息。如果医生和医学研究人员能够从这些搜索记录中得到一些有意义的新发现,如果网民搜索所产生的数据能够提供独一无二的信息,那么这些搜索记录将会带来怎样的影响?埃拉德•约姆-托夫认为,这些医疗大数据可以辅助常规医学研究和诊疗手段,为医学界提供独特的视角与信息,改变医学研究模式。通过本书,约姆-托夫讲述了针对互联网搜索的研究为科研人员提供的巨大帮助——帮助他们进一步了解了处方药的副作用,癌症患者与家属的信息需求以及神经性厌食症的部分成因。约姆-托夫还认为医疗大数据收集可以在不损害个人隐私的前提下造福人类社会。人们为什么愿意在互联网上搜索健康信息?在他看来,一个原因是人们似乎认为在线匿名搜索有关肥胖、性和怀孕等话题的信息更加安全。他认为,网络上的一些内容会促成神经性厌食症的产生,在分析此类内容的消极影响时,他表示,计算机科研人员可以通过识别疾病风险因素和传染源等方式提高搜索结果质量,改善大众健康水平。通过医疗大数据,医生可以了解患者在得知悲观的诊断结果后所作的反应,从而更好地诊治患者,并帮助病人更客观地认识自己的病情。
医疗大数据讲述了大数据对商业模式的影响,整个商业模式从传统的端对端的商业模式,如何转变为线上线下相结合的商业模式。医疗大数据对整个医疗行业商业模式的影响意义深远,从医疗产业的上游,诸如研发、生活到临床,到患者治疗、体验等,这一条产业链都发生了巨大的变化。大数据不仅颠覆了传统医疗行业的经营方式,也开启了个性化医疗商业模式的来临。
致谢
前言
第1章 身处数据时代
线上活动产生的数据
从互联网数据看现实生活
互联网数据和隐私隐患
能否在不违反伦理道德的前提下,使用互联网数据的研究?
互联网数据如何在医学研究中发挥作用
第2章 解答难以启齿的问题
查询者身份与查询内容的关系
网上获取的健康医疗信息对查询者是否有用?
查询者提供的自身信息有多精确?
第3章 厌食症:与互联网相关的疾病
厌食症的支持者认为:“这不是疾病,而是一种生活方式。”
神经性厌食症与媒体之间的关联
有害干预
第4章 大众健康问题
用互联网数据来监测药物安全
回看过去,找到致病的风险因素
维加斯出现的疾病并不一定只在维加斯传播
第5章 患者希望了解的疾病信息与互联网对他们的帮助
量化分析悲伤的五个阶段
从互联网查询词句看情绪波动
后 记
附 录 如何获取互联网数据
搜索引擎的查询词句
雅虎知识堂
推特
网络爬虫程序
数据集收集
起因
一个阴郁的秋日清晨,我在纽约收到母亲发来的电子邮件,一同收到的还有多封其他邮件,而母亲的邮件却没有主题,这往往不是什么好兆头,因为这意味着她可能不知道该在主题行里写些什么。我把一封封邮件看完,最后读到母亲那封时,我知道我担心的事情还是发生了。母亲血常规检查的诊断结果为癌症。她在邮件里说,病情不是非常严重,但是需要选择治疗方法,可以选择较为温和的观望治疗,也可以选择可怕的放化疗和手术。那天我在办公室里走了一圈又一圈。身在5000英里之外,我什么忙都帮不上。作为一名计算机研究人员,我当时觉得应该上网查一查有关癌症的信息。正是那一刻的不知所措让我后来有了研究互联网医疗的念头,并写下了这本书。
尽管自认为擅长使用搜索引擎,而且我的工作就涉及设计搭建搜索引擎,但那天我却感到十分挫败。很多网站上的讨论只涉及诊断结果和医生能够提供的信息,对于还不了解自己身体状况的病人或者普通网友来说,这些信息并无太大意义。更糟糕的是,大多数讨论癌症结果的网页将所有可能出现的结果一一列出,容易让人误以为它们出现的概率相同。即便是我这样一位外行,也发现这样不妥。
几天后,我接受了母亲患病的事实,而且母亲进一步检查的结果显示,她的状况没有我和家人起初担心的那么糟糕,于是我开始回顾在互联网上查询疾病信息的经历,并思考怎样才能利用互联网促进医疗的发展。对我来说,这并非全新的领域。当时我在互联网大亨雅虎的科研部门工作,协助完善雅虎的搜索引擎。不过除了完善搜索引擎外,那几个月里我也在考虑一些更为宏观的问题:现在使用互联网的人这么多,而互联网公司也在不断收集人们上网时产生的数据,我们能否通过这些数据了解到医药领域的一些新鲜有趣的信息———一些从其他渠道很难获取的信息。医生能否通过数以万计查询癌症信息的人产生的数据获得一些有用信息?这些信息能否改善医生与患者的沟通与交流?能否为诊疗模式的改变提供一些新的思路?
互联网数据可以发挥怎样的辅助作用?
互联网数据反映着现实生活,人们上网时产生的一些信息展示出他们在现实生活中的行为。试问你上次度假,在确定目的地之前,是不是在网上查询了酒店信息?后来是不是又在自己常用的社交网站上传了照片?或是发微博力荐了自己特别钟爱的美食?这些行为所产生的在线数据透露出你的线下生活。不过,互联网数据还有其他的优势。其一,通常情况下,你只有去医院看病或者接受检查才会产生医疗数据,而互联网数据则不同,它的生成几乎是时刻都在发生的,具有一定的连贯性。其二,在一些情况下(我们将在第2章展开深入讨论),较之与医生交流沟通,大家更愿意在线上分享自己的敏感信息。其三,互联网数据反映出人们的在线活动,这些活动可能具有医学价值,有关这一方面的内容我将在第4章展开讨论。
本书的主要观点是:与现实生活紧密相关的互联网数据可以改变医学研究模式。这种观点目前已得到证实。但是只有当医学研究人员和计算机研究人员携手合作,才能从互联网数据中获得启发,从而为医学发展提供独特的思路。利用互联网数据开展的研究项目非但不会取代临床试验和其他形式的医学研究,反而能让常规研究手段发挥更大的作用,便于进一步研究之前难以解答的问题。从某种意义上讲,互联网数据将催生一个新的学科领域。
本书的主旨之一是希望能为医学研究提供一些新的理念。目前,我们的研究尚处于初始阶段,对于互联网医疗的探索还只是冰山一角。但我们已经收集了大量的数据,它们能够而且应该发挥出积极的作用。
本书是我们在互联网医疗领域数年探索的结晶。最初的研究主要关注人们对疾病的认知方式。我们发现,人们的行为举止对于人类健康和医疗的研究来说是大有裨益的数据源。诚然,我们的研究方法不能取代常规的医学研究方法,但却能让后者在不便收集信息的领域发挥更大的作用。
过去几年里,研究人员发现了一些药物的新副作用,钻研了体重和受人欺凌之间的关系,探究了癌症患者和患者家属在信息方面的需求,深入了解了厌食症患者的世界,甚至找到了体重过轻明星的媒体形象与厌食症的公众认知之间的联系。如果仅靠常规手段,医学研究人员很难找到甚至不可能找到这些问题的答案。以上这些研究表明,用互联网数据进行医学研究,在四个主要领域里优于用常规数据和工具进行研究。在一些情况下,研究人员为了验证自己的假设,需要获取更敏感更客观的数据,而这些数据很难在现实中借助常规医学手段获取,这时互联网数据研究的优势便显现出来。本书将解释互联网的数据量为何如此庞大,并介绍数据的收集方法,然后探讨在这四个领域里利用互联网数据能有何作为。
我们进行的互联网数据研究最近开始被称为“数据学”。本书将讲述我们的研究团队是如何在“数据学”领域处理和解决问题的。我们使用多种研究工具和材料,包括先进的统计技术、用户研究、在线调查问卷,以及数以亿万计的搜索引擎查询词句和社交媒体上的文章。由于普通大众对这些工具和材料多不熟悉,本书将展示如何利用它们深入了解人类的行为。
本书旨在让医学研究人员和医务人员读者了解互联网数据的优势所在,并认识到借助这些数据可以探索常规医学研究无法触及的领域,进而促进医疗的发展,让关注跨学科研究的读者看到即便是两个看似毫不相干的领域也可以联系起来。希望本书能在如何通过互联网数据研究来改善医疗方面触发读者的新想法。亚瑟C·克拉克的第三“定律”
认为,足够先进的科技皆无异于魔法。希望至少本书的部分研究成果能让即便是医学或计算机科学专业的读者产生“堪比魔法”的第一印象,也希望他们在阅读本书后能推动相关领域的进一步发展。目前互联网数据仍有巨大的研究空间。
移动互联网、大数据、云计算、认知计算、人工智能等技术在医学领域的应用一定会促进发现疾病的发生、发展和转归规律、医学模式的创新及医疗生态的重构。本书的理念、思维和观点将为应用互联网技术改善医学提供助力。
——北京大学人民医院原院长、医学大数据研究中心主任 王杉
合理利用医疗大数据,充分保护个人隐私,确保医疗大数据的标准和质量,对促进医疗大数据更为广泛的使用至关重要。同时,政府对数据的有效监管,避免因互联网医疗大数据的利用而产生的医疗事故和纠纷,也是医疗大数据应用的重要的环节。
——深圳华大基因研究院副院长、信息中心主任 方林
本书向读者展示了怎样将这些数据与常规的医学研究方法结合,更好地理解疾病的成因,寻找更为有效的治疗方案,为人类健康服务。书中的论述、分析和具体案例的讨论,会给医护人员、医疗机构、管理部门、公众健康服务部门乃至大健康领域的创业者们带来深刻的启示。
——泓华医疗集团创始人、董事长兼CEO 曾人雄
本书不是一本纯技术或者纯理论创新类的书籍,更是为了吸引医学和计算机界、医疗服务领域的跨界者认识到基于互联网研究常规医学研究难以触及的新方法、新思维,并通过自身工作经历,结合案例娓娓道来,可谓是互联网医疗行业盛宴的一道“前菜”。
——上海理工大学医学信息工程所 孔祥勇
本书恰好给出了关于医疗大数据的答案:由数据认知到转化应用,由数据获取到隐私保护,通过一些实例向我们展示了“如何通过线上行为数据分析其健康状况”,相信这对于大数据在医疗领域的应用具有很强的指导意义!
——互联网医疗中国会行业研究员 关普璟
推荐序一
本文系应机械工业出版社之邀请为《Crowdsourced Health: How what you do on the internet will improve
medicine》中译本撰写的推荐序。通读了译本全文,虽未能阅读英文原著,但也能感受到该书的新理念、新方法、新观点和新思路,可谓开卷有益。
作者埃拉德•约姆-托夫(Elad
Yom-Tov)作为一个非医学专业人士,从个人的特别经历开始,延伸到以民众的健康与疾病诊断、治疗需求为导向,探索研究如何将互联网查询、日志等海量数据应用于改善医疗,如:网民搜索药物的药效、不良反应,偏头痛的症状,肥胖的标准,厌食症、癌症、性病患者需要的资源信息及其产生的数据,都能够提供独有的互联网数据信息,辅助传统常规医学研究、疾病诊疗,甚至可能用于流感、“非典”(SARS)等传染病的预警和监测,为公共卫生、医学研究提供独特的视角、信息和研究模式,同时提出了医疗互联网面临的挑战(隐私保护等)。
移动互联网、大数据、云计算、认知计算、人工智能等技术在医学领域的应用一定会促进对疾病的发生、发展和转化规律的认识,推进医学模式的创新及医疗生态的重构。该书的理念、思维和观点将为应用互联网技术改善医学提供助力。
——北京大学人民医院原院长、外科教授、医学大数据研究中心主任、中国医师协会副会长、中国医院协会副会长 王杉
推荐序二
我们正朝着精准医疗的时代大步迈进。
斯坦福大学的Snyder教授以自己作为实验对象,收集和分析了自己的基因组、转录组、表观组等组学数据,医学影像数据、可穿戴设备数据和生活环境数据,甚至社交数据,希望给自己建立一个全时全景的健康模型;美国、欧盟、中国等都宣布要投入巨额的研究经费来实现精准医疗;美国国家癌症研究所(NCI)代理所长Douglas
Lowy和国立卫生研究院院长Francis
Collins在新英格兰医学杂志(NEJM)上借美国总统奥巴马的“癌症登月计划”,宣告我们正处在“走向彻底治愈癌症之路”;美国、日本等国家将大量的科研经费投入到脑科学领域的研究,试图破解人类的智力极限。
希望在不久的将来,“AlphaGo”不仅会越来越多,也越来越强,超验骇客所描述的“硅元智能”很快就会到来。所有的这些都将辅助我们正在进行的医疗大数据“拼图游戏”,最终将利用物理、化学、计算机、生物和医学等学科的知识和技术,解决人类的健康问题。未来,人类健康活到120岁将不是梦想!
埃拉德•约姆-托夫先生具有深厚的搜索引擎技术研究背景,他的遭遇和我认识的或听说过的一些朋友一样: 计算机背景,家人或自身遇到严重的健康问题,在目前的医疗条件下感到无助和恐惧,都想依靠自身的技术背景,借助互联网大数据解决问题。
本书围绕“与现实生活紧密相关的互联网数据可以改变医学研究模式”展开讨论。无疑,互联网正以前所未有的速度改变我们的生活。书中包含大量的实例,如互联网大数据对新药物及其副作用的研究;互联网作为工具用来研究病患家庭的心理状态;互联网对人们的日常社交生活和自身隐私数据的保护;互联网对人类的罕见病研究的作用(PatientsLike Me只是众多医疗健康社交网站中的一个);互联网在流行病学的研究方面起着重要的作用;Google、Yahoo、百度等企业在这方面做了大量工作;以及互联网在健康数据的标准制定以及数据众筹上非常出色的表现[GA4GH(Global
Alliance for Genomics and Health)就是一个很好的例子]。
正如埃拉德先生所引用的狄更斯的名言,医疗大数据“既体现了这个时代的愚蠢,也体现了这个时代的智慧”。就像核能的开发利用一样,一切事物总有其两面性。合理利用医疗大数据,充分保护个人隐私,确保医疗大数据的标准和质量,对促进医疗大数据更为广泛的使用至关重要。同时,政府对数据的有效监管,避免因互联网医疗大数据的利用而产生的医疗事故和纠纷,也是医疗大数据应用的重要的环节。
一些题外话:每个人的医疗健康大数据都是个人的宝贵资产。不可能在没有人奉献个人医疗健康大数据的情况下,就指望有医疗健康大数据,或指望医疗健康大数据对整个医疗健康体系的促进。我们可以考虑利用“区块链”的概念,像比特币一样运营个人健康医疗大数据,这将是一个有趣的、值得探讨的问题。
——深圳华大基因研究院副院长、信息中心主任 方林
推荐序三
毫无疑问,这是一个数据的时代,一个半天产生的数据量就相当于人类社会自诞生到公元2003年所产生的数据量总和的时代!数据渗透到当今每一个行业和业务领域,成为重要的生产要素,改变着产业结构,甚至重新塑造着行业的边界,一个“大数据”的时代或已来临。
全球著名咨询公司麦肯锡称:“人们对于海量数据的挖掘和应用,预示着新一波生产率增长和消费者盈余浪潮的到来。”有经济学家甚至预测,统治经济增长理论长达六十年之久的索洛增长模型(Solow Growth Model)会被改写——除了资本、劳动力和全要素生产率之外,推动经济增长的要素还应该包括“大数据”。
作为中国医疗健康领域的探索和实践者,泓华医疗正在探索“大数据”在“以患者为中心”的医疗健康领域应用的广阔前景,并形成了自己的一些理解,应机械工业出版社邀请,在此做一个抛砖引玉的分享,希望能对各界同仁有所启示。泓华医疗以“让健康更简单”作为办医的核心理念和追求目标,其内涵就是希望在全国连锁医院、诊所和家庭护理服务的基础上,通过包括移动医疗、大数据、人工智能在内的新技术的应用构建线上线下医疗服务无缝对接平台,让医疗健康服务需求者获取医疗服务时更简单,让医疗服务提供者提供医疗服务时更便捷,并让利益相关各方能获得实实在在的良好的场景体验,从而做真正专业、靠谱的医疗服务。
医疗健康服务的本质在于“通过使人类更健康来创造价值”,必须充分尊重患者、医生、护士、社会的利益和价值立场才能实现。这是办医者应该坚守的价值理念,也是办医者在生死面前应该秉持的敬畏之心。医疗无小事、人命关天,是医学人文精神的真实体现。遵循这样的理念,收集、整理、挖掘和利用患者在诊疗过程中产生的数据并以患者更健康、更方便等权益为出发点,采集和分析包括患者基本数据、电子病历、诊疗数据、医学影像数据、检验数据、临床管理数据、医疗设备及仪器监测数据、诊疗保健过程的行为数据等信息,为人们更好地理解疾病产生的机理、寻找更好的治疗路径,并最终使人类更加健康的前景提供了广泛的想象空间。
同时,正如本书作者一再强调的,“大数据”的来源远远不局限于医院和诊所。过去,与健康相关的数据信息大部分来自医疗机构,只能反映人们健康状况的局部与片段,大部分仅为疾病症状描绘以及对相关因素的浅层次分析。移动互联时代,通过对人们行为模式的观察与数据挖掘,借助智能手机、智能手环、其他可穿戴设备等,我们能搜集人们的日常生活数据,研究视角从而从医学转向健康。这些健康数据反映了人们日常起居、生活习惯、生理变化、潜在病灶、病情发展、用药频次、康复状况等多个方面的状况,同样具有医学上的临床价值。《医疗大数据:大数据如何改变医疗》一书向读者展示了怎样将这些数据与常规的医学研究方法结合,更好地理解疾病的成因,寻找更为有效的治疗方案,为人类健康服务。对于医疗大数据这样一个新兴的交叉学科,作者更是大声呼吁,强调跨界融合的开放性思维的重要性——只有医学专业研究者和计算机专业研究者联手合作,才能从互联网数据中挖出宝藏,从而为医学发展提供独特的创新型解决方案。这些论述、分析和具体案例的讨论会给医护人员、医疗机构、管理部门、公众健康服务部门乃至大健康领域的创业者们带来深刻的启示。
然而,技术可以习得,如何坚守医学人文精神却是一个现实而紧迫的难题。写下这篇推荐序之时,正是媒体、公众、医疗从业者和监管部门热烈争论、深刻反思“谁该对魏则西之死负责”之际。得知患者罹患“滑膜肉瘤”这种不治之症后,魏家人辗转不同医疗机构,最终找到通过竞价排名靠前的医疗机构,花费巨资接受境外已经被质疑的所谓“生物免疫疗法”。这种号称效率很高的治疗方法,不但没能挽救魏则西的生命,还让他在生命的最后时刻痛感某些医疗机构的欺骗和虚伪。同为“大数据”的应用,在这个过程中我们看到的却是办医者理念的扭曲、贪婪和自私:企业的社会责任被抛弃、监管的混乱和医学人文精神的丧失。痛定思痛,追责当事责任人固然重要也很简单,但我们都应该从这次事件中吸取教训。大数据的应用同样是一把双刃剑,我们要从体制机制上寻找根本原因,通过这次事件引发的全民大讨论,从而为行业未来发展和医疗大数据的应用构建制度基础和理性的认识。
《医疗大数据:大数据如何改变医疗》一书,向我们展示了那些充满悲天悯人情怀的医学和计算机科学研究者如何用他们的智慧为人类健康服务,也引发了我们对新技术对我们医疗保健切身利益的影响的多角度思考。我热情推荐这本书,因为它同时也在提醒我们,在我们这个阶段,除了技术之外,我们更需要医学人文精神的回归!
——泓华医疗集团创始人、董事长兼CEO 曾人雄
推荐序四
互联网 时代,海量数据的挖掘应用成为重要命题。该书作者是多年从事搜索引擎相关工作的互联网人士,结合自己的家人对疾病信息的需求,探讨了在互联网上如何获取有用的医疗信息,从而帮助患者获取诊疗数据,帮助医学专家开展疾病研究。互联网医疗的应用是一个全新的模式,尚处于探索研究阶级,同时涉及医学、信息技术、工程技术等专业交叉学科,其研究并不是一蹴而就的,在应用上也有着方法、理论、技术、安全隐私甚至伦理问题。国内对“互联网大数据”概念的热炒和严格意义上的学科研究、尚缺乏更多专业人士和体系支撑的现状形成了鲜明的对比。当然我们也欣喜地看到越来越多的医学专家和互联网行业相关人士加入这一新兴产业,推动中国全面健康促进的工作中来。
从信息技术(IT)时代到数据技术时代(DT)的大趋势已成为科技界的共识。如何开展大数据研究工作?哪些工具和材料能够让我们挖掘出数据背后的价值,哪些医疗专业知识适合通过互联网来实现变革?该书不是一本纯技术或者纯理论创新类的书籍,而是为了吸引医学和计算机科学领域、医疗服务领域的跨界者认识到基于互联网研究常规医学难以触及的一种新方法、新思维,并通过自身工作经历,结合案例娓娓道来,可谓是互联网医疗行业盛宴的一道“前菜”。
现代医学从传统医学到社会医学模式的转变,使得人们对医学的研究关注点向病前预防和病后康复转移。越来越多的人们通过互联网了解健康知识、与自身疾病相关的专业知识,或求医问药。互联网运营商和服务公司掌握了大量数据,这些数据如果能安全有效地应用,可以对公众健康状况产生积极影响。比如,对药物反应特别是副作用的长期追踪调查,就是常规医药研究不可企及的。很多药物在上市前小样本测试时没有问题,但很难保证上市后对大规模人群不存在严重副作用。基于互联网医疗大数据的研究对医疗机构和卫生监管部门的工作将大有裨益。大规模的医疗数据收集、整理、开发和利用在国内还是一个新课题,尤其最近出现的一些互联网医疗数据事件,个别商业互联网公司并未在医疗信息的传播过程中承担应有的责任,也让从事医学信息教学研究的本人深感国内互联网医疗大数据研究的必然性和必要性!
数据时代,隐私和安全成为互联网医疗信息利用的第一个问题。如何在不违背伦理道德的前提下使用医疗数据并发挥价值?
互联网医疗信息的利用与使用者(患者)的角度和角色有关:我们很难想象一个自信的成年人公开讨论自己的疾病信息。匿名原则与实名利用相结合,借助用户自身对信息的关注推测人群分类,将带来有意义的成果。这给予了我们很大的启发:在利用互联网医疗信息时,要在设计时即考虑使用者的自身感受和使用习惯对结果和数据的重要影响。而这些往往是国内研究者从假想的理想角色、设定用户的使用习惯而开展的医疗数据研究所缺乏的,作者平实的叙述值得学习。
该书作者通过对厌食症和相关因素的关联阐述了一方面人们使用互联网医疗信息,一方面此类信息也会给出反馈,并影响人们对疾病健康的态度。让互联网医疗数据发挥专业、智能的作用,是利用医疗大数据的前瞻性问题。现代互联网的功能已经不仅仅局限于检索信息,更多的是利用反馈实现自动更新,这已成为未来互联网发展的趋势。作者虽未探讨人工智能等新技术的应用,但相信其展示的量化分析、药物监测、传染病传播等研究所采用的技术都将构成医疗领域人工智能开发与工作的基础。
在附录中提到的获取互联网数据的方法也很实用,大家可以参考国内外类似的网站与数据信息。使用通用的数据获取方法借助搜索引擎“爬取”数据、清洗、分类、智能分析与展现,都是包括本人在内的希望从事医疗健康大数据研究和应用的同仁们可以开展的尝试。
——上海理工大学医学信息工程所 孔祥勇
评论
还没有评论。