+-
神州医疗弓孟春:医疗人工智能的进步需三个领域同时发力
[ 导读 ] 在院内除了传统的临床数据的生产以及运用以外,大批量的组学数据的进入以及组学数据的处理和标准化流程开始部署到医院。这带来最大的可能性是我们终于在临床数据这一个维度之外有可能把其他组学的数据在院内引入进来。

11月30日,科技频道主办的“新技术·新动能”创新者论坛在北京·国贸大酒店举办。

以“AI驱动产业升级”为主题,旨在为行业人士提供一个如何引科技赋能产业的学习交流平台,此次论坛邀请了平安科技、海尔U+、神州医疗、深醒科技、文安智能等在AI落地产业过程中领跑的企业共同参与。论坛现场,演讲嘉宾与业内人士深入探讨了新技术如何建立商业价值,并且最终赋能传统产业等话题。

神州医疗副总裁弓孟春出席“新技术·新动能”创新者论坛。并带来《人工智能时代的医疗能力突破》的主题演讲。他的主要观点如下:

以下为演讲速记(有所删减):

各位上午好,今天非常荣幸代表神州医疗,代表我们CEO介绍神州医疗做的工作。

我是临床大夫出身,以前在协和医院做医生,一个很偶然的机会进到神州医疗做相应的管理工作。我在负责中国国家罕见病注册系统,同时我也在SNOMED INTERNATIONAL \ IRDiRC两个国际担任一些职务,后面会有相应的介绍。

今天他们给我的题目和我最后列的题目有点不太一样,但是精髓是一致的,这是我们医疗领域面临独特的一个点,其他领域数据来源也好,结构化也好,标准化程度也好都是非常有利于支撑整个人工智能产业的发展的。但是医疗领域现在面临的问题非常严峻,我们需要大批量的数据来支持我们算法的优化、临床的应用,但是偏偏当你去找数据的时候你会发现我们传统的医疗产业对数据生产能力非常弱,它生产出来的数据要么是结构化太差,要不然互相之间不能互联互通,所以没有办法支撑后面的产业应用。我把AI加入这里,是因为大批量的组学数据加入到库里面来需要我们更新的技术和更强大的计算力量处理新的数据。

神州医疗的愿景是把这三个的技术都做一些融合,医学信息学、生物信息学及人工智能这三个领域同时发力才能使得我们可能在医疗人工智能方面做出一点点进步,这是我今天主要想讲的一个内容。

医疗领域现在在数据的积累和成长方面的一个比较典型的趋势,我们其实已经过了数据的拐点,现在大批量的组织数据的进入使得临床单一维度的信息得到特别快速的扩充,像现在一个人身上可以同时绑定它的行为、基因组、环境暴露、微生物组、蛋白质组等等各种各样的组学信息,每一个组学之间都可以实现跨组学的检测分析、相关性分析,因果关系分析等等,它其实为我们整个新的计算技术在这个领域应用提供了非常大的空间。神州医疗致力于把数据转换成信息,信息转换成知识,知识再转换临床的动作,造福于患者,后面我会逐一展开介绍。

医疗人工智能发展趋势

我们医学从一个传统的evidence循证医学时代到source learning时代就是以信息学为基础框架的生产系统里,医院的数据能够积累形成医院的一些科研和数据资产,然后更进一步形成新的证据和支持,然后通过人工智能数据下的临床支持系统再干预患者的诊疗过程,再更进一步的产生这样的循环。所以说source learning这是我们现在医学信息学或者医疗人工智能方向最主要的发展领域。我们自己除了在产业上追求很多应用,在学术上也做大量的工作,包括精准医学信息学等等这一些新的概念、新的发展趋势也是我们最早在国内提出,并且去实践的。

有一个非常重要的趋势,在院内除了传统的临床数据的生产以及运用以外,大批量的组学数据的进入以及组学数据的处理和标准化流程开始部署到医院。这带来最大的可能性是我们终于在临床数据这一个维度之外有可能把其他组学的数据在院内引入进来。为什么强调院内?中国现在临床数据出医院是一个比较混乱的局面,我们只能把其他类型的数据引入到医院,在医院内部产生一些可供人工智能发展技术也好、做应用也好的一个生产环境。

因为中国医院体量都比较大,我们单一医院已经能够支撑中小型省份病人的体量,它的数据量在支撑研究和发展产业应用上是足够的。我们左边是大量临床数据的结构化、标准化,右边是在组学信息基础上添加新的组学技术,使得它能够成为一个可扩展性极强的支持研究大数据分析等各方面的一个辅助与支持人工智能技术发展的数据的平台。因为我自己是做医疗出身,在神州医疗出任高级副总裁,我主管医学部、市场部、知识产权等等一系列工作,我们认为医疗方面一直以为医疗是非常严肃的一个产业,所以一定需要在临床方面有最顶尖的国家机构来跟你做深入的合作和支持,才能保证你的技术发展方向和产品真正能够造福患者。

 神州医疗的布局

所以神州医疗三个战略伙伴一个是北京协和医院,也是我自己原来工作的地方,是我们国家的罕见疑难病诊治指导中心;第二个是医科医院肿瘤医院,是我们国家的癌症中心,第三个是复旦大学附属儿童医院。这三个里面都有非常深入的布局,三家医院都有联合实验室,有联合研发的项目等等。

神州医疗我们也承接了国家的大量在医学领域跟大数据、信息学以及人工智能相关的课题。比如说我们史总参与和承担了恶性肿瘤大数据平台的技术课题,我们首席科学家徐华教授是上周刚刚公布的由神州医疗牵头做的,基于人工智能的临床决策系统这个项目的首席科学家,我自己也在参与很多这些研究。值得一提的是我们在上海市与中山大学一起拿到了上海医学人工智能重点支持的50个专项里面的一个。神州医疗同时具备医学信息学、生物信息学、人工智能的研究等各方面的能力,所以我们在医学领域最热的,像医学与大数据的结合、医学与人工智能的结合以及精准医学这几个领域都有比较深入的布局。

 神州医疗的背景

神州医疗从建设之初可以说含着金汤匙出生的公司,我们是中国健康医疗大数据第二集团科技创新公司的主要发起方,同时布置在几个领域,包括大数据、精准医疗、人工智能等各个方面。国家健康大数据科技公司目前是我们健康医疗大数据产业里面唯一一个能够获取数据运营资质的三家公司,所以我们神州医疗作为第二公司主要发起方代表我们在这个领域主要的技术创新的团队以及未来数据运营的能力。

神州医疗的主体工作

(1)建立国家肿瘤大数据平台

我们主体工作之一,就是在国家发改委和卫计委两个部委之下建立国家肿瘤大数据平台,这个平台的建设是围绕着国家级癌症中心、30个省级肿瘤中心、100多家地市级的肿瘤医院以及全国1000多家综合医院肿瘤科做院内数据统一的汇集以及整合分析。这个工作在全世界范围内都是前所未有的,因为我们对数据的采集绝不是仅仅是病案首页或者简单的个人信息,而是这个患者在医院内发生的所有跟临床诊疗相关的被记录在电子系统里的信息。所以这样的一个数据平台现在已经能够为我们国家的肿瘤登记、肿瘤流行病监测、肿瘤临床诊疗质量分析以及众多大数据、人工智能技术研发提供非常强有力的支持。

我到今年年底会实现100家医院的接入、25个以上省份的覆盖、总病人的记录数会超过1200万患者。我们有大量的标准系统。所以目前来说这个已经是全球范围内最大的单体肿瘤患者专病的数据库,它已经为我们国家在肿瘤患者临床质量的改善以及构建一个全球范围领先的大数据平台方面做出非常重要的贡献。

(2)中国国家罕见病的注册系统

第二个工作是我自己主导的,也是由神州医疗做技术支持的,它的负责人是北京协和医院的副院长(张翔)教授,是我们中国国家罕见病的注册系统。罕见病是精准医学领域非常重要的疾病领域,我们全球有6000多种罕见病,中国虽然每一种疾病的病人都很少,但是这些所有的中国罕见病加起来患者超过3000万,所以它是一个庞大的人群。习大大提出了健康中国2030和全民健康等这样一些理念之后,要求我们不能把任何一个群体在整个全民健康计划中漏掉,罕见病就是非常重要且需要改善的一个目标群体。

所以从2016年开始由北京协和医院主导,阜外医院、北大医院、华西医院等等全国20多家单位参与,我们现在正在构建中国全国范围内的罕见病注册登记体系。这个体系非常重要的特点是除了传统的临床数据以外,也收集整理患者样本库的信息,以及精准测序的信息,就是在数据采集方面的一个部署。

(3)中文的罕见疾病知识库

另外一个工作是我们在构建中文的罕见疾病知识库,这也是我们国家一直非常欠缺的。在这个基础上,我们希望未来构建中国罕见病的大数据平台来支撑基于人工智能技术对罕见病的诊断、治疗等一系列技术的研发。这个工作推进得非常顺利。我自己是项目的负责人、执行负责人也是技术团队的负责人。我们2017年7月份系统上线,到现在积累三万多罕见病患者120多种疾病,有信心在未来两到三年内使它成为全世界最大的罕见病注册登记系统,这也是由神州医疗一直无偿支持的,是我们做的精准医学人工智能方面另外一个非常重要的部署。

我刚才提到在IRDIRC的任职经历,我们组织方向主要目标是在2020年以前开发200种新的治疗办法和200个新的检测办法。我们在2017年底已经实现了200种新的治疗办法的突破,现在正迈向200种新的诊断和检测的目标,这是全球范围内罕见病协作的联盟。我现在自己担任IRDIRC的诊断科学委员会的成员,我刚被提名副主席,正在走我们内部的一个竞选。所以IRDIRC我们在全球范围内非常重要罕见病的诊疗的一只力量。

 (4) 支持心脏病或者胸痛患者的大数据平台

再一个工作是我们神州医疗面向未来人工智能和大数据领域一个非常重要的工作,是和飞利浦一起支持中国心血管联盟建设的支持心脏病或者胸痛患者的大数据平台。现在由全国20多家顶尖的心脏病专科领域综合医院和专科医院在参与,希望构建我们对于中国胸痛患者、心血管集中患者的集中式的平台。

我今天讲了很多关于数据采集和整理以及在此基础上做人工智能研究的一些工作,最主要的原因是因为在医疗的人工智能领域,除了现在看到大量图像的工作因为在对于数据采集和标化利用方面难度相对来说比较低,我们很快可以实现突破以外。如果你想寻求在临床领域更深更广泛的应用的话,数据的来源是非常大的问题。

神州医疗独特的优势

神州医疗独特的优势在于说我们对于数据的来源方面有非常广泛的渠道,都是在承建国家级的项目,这使得我们在进行人工智能的研究和应用得到好的保障。比如说一个非常重要的应用是中文临床数据的高通量表型化,这里面有一些专业的术语,大概讲的内容是我们如何把原始的数据经过自己自然语言处理技术转化,转换成可供与其他组学数据进行深度分析挖掘的临床表型组的信息。这里面有几个关键的技术难点,第一个是数据来源,第二通用数据模型,第三是医学的自然语言处理,第四语义控制和术语标准,这块我们有非常独特的资源。

(1)通用数据模型

首先讲通用数据模型,在医学大数据和医学人工智能领域我们最主要的发展方向是全球的通用数据模型OHDSI,当然也有一些是研究领域通用的,但是OHDSI更多的是面向整个产业,除了研究领域也有包括药厂的数据分析、保险的数据分析等等,这是我们在国内主推的一个方向。

我们首席科学家徐华教授也是OHDSI中国的主席,我们在中国致力于OHDSI其他伙伴推动相应的工作,我们每年会有OHDSI的年会,今年在广州,所以2019年的时候非常欢迎产业界对这一类型信息和技术感兴趣的朋友一起参加。

(2)医学自然语言处理

关于医学自然语言处理,医学人工智能领域图像大家都已经做的差不多了,每个人都是一堆公司扎进去做,但是你真想把医生写在临床病历大量的信息提取出来的话,医学的自然语言处理是现在面临的最大技术难题。我们自己团队在英文的医学的自然语言处理方面一直排在全球最顶尖的位置,我们英文的自然语言处理的软件现在有3000多家研究机构在使用,中文方面也是最早进行这方面工作的机构,现在在国内有非常好的案例和非常靠前的技术的排名。我们首席科学家徐华之前是德州大学的终身教授,目前是神州医疗在这方面的首席科学家,是我们医学自然语言处理方面全球范围最顶尖的技术专家。

(3)中文的临床术语文体

另外一个工作关于中文的临床术语本体,这个工作是我们在国内整个技术是非常欠缺的。我自己在SNOMED CT担任全球管理委员会的董事,是六位董事之一。所以我们对于一些新的国际技术和标准的引入在国内具有一些非常独特的优势,我们在国内训练了大批临床术语的专家。中国第一家SNOMED CT license )当时给了协和医院,是在做我们国家的中国国家罕见病登记系统,现在神州医疗已经正式在国内分发SNOMED CT,帮助全国的医疗机构和大数据平台解决数据标准化的问题。SNOMEDCT本身也有从临床数据向组学数据的拓展,这块工作我们也在积极推进。

还有一个我们做人工智能和大数据不能忽视的就是关于伦理和隐私安全保护,神州医疗医院在这方面下了非常大的功夫。我可以非常自豪地说我的数据团队上,我们要求所有的员工必须经过HIPAA的考试认证才能在神州医疗数据部门上岗,这是在机制部门保障患者的隐私。同时我们也有基于中国大数据训练出来的医疗大数据再识别风险量化评估的目前国内唯一技术体系和评测办法。这块我们一直在做大量的工作。

最后我提几点,未来的大数据的时代多组学数据融合的过程中,基因组学数据在运算和应用中隐私保护是非常关键的技术难点。我们复旦大学儿科医院有一个非常重要的工作就是做基因组学数据的隐私、加密和运算过程中的个人患者隐私保护。所以每年神州医疗还承担着国家重点研发课题,我们有非常强的在全国范围内协调各家科研院所的能力,今年在中国的国家重点研发计划里面我们参与了5项申报,全国顶尖的医院都是我们比较重要的合作伙伴,我们自己牵头一项,参与一项,现在最重要的工作就是基于人工智能的临床学注册系统就要马上在全国范围内启动和开始做一些部署的工作。

2017年和2018年我们分别都在美国信息学会做关于中国的健康医疗大数据、人工智能和精准医学的专题论坛,今年最重要的消息是我们成立了中美医学信息与数据科学联合中心是由中国的卫生信息学会会长和美国医学信息会主席一起担任这个联合中心的负责人,我们自己也有相应的中方和美方的代表,希望通过中美双方的努力一起促进在医学人工智能、医学信息学方面的发展。虽然中美在政治领域、经济领域有很强的对撞的局势,但是在学术交流领域可以看到很多的新的进展。

所以非常非常感谢的邀请,再次感谢各位的时间。我们自己是一个非常开放的、面向全行业、面向各方面技术体系、面向各个方面合作伙伴的平台型的公司,也非常期待和各位领域的技术专家们合作,再次感谢各位对神州医疗的支持,谢谢。 

本文系投稿稿件,作者:弓孟春;转载请注明作者姓名和“来源:”;文章内容系作者个人观点,不代表对观点赞同或支持。