神州醫療弓孟春:醫療人工智能的進步需三個領域同時發力
11月30日,億歐科技頻道主辦 的“新技術·新動能”創新者論壇在北京·國貿大酒店舉辦。
以“AI驅動產業升級”為主題,旨在為行業人士提供一個如何引科技賦能產業的學習交流平臺,此次論壇邀請了平安科技、海爾U+、 神州醫療 、深醒科技、文安智能等在AI落地產業過程中領跑的企業共同參與。論壇現場,演講嘉賓與業內人士深入探討了新技術如何建立商業價值,并且最終賦能傳統產業等話題。
神州醫療副總裁弓孟春出席“新技術·新動能”創新者論壇。并帶來《 人工智能 時代的醫療能力突破》的主題演講。他的主要觀點如下:
以下為演講速記(有所刪減):
各位上午好,今天非常榮幸代表神州醫療,代表我們CEO介紹神州醫療做的工作。
我是臨床大夫出身,以前在協和醫院做醫生,一個很偶然的機會進到神州醫療做相應的管理工作。我同事在負責中國國家罕見病注冊系統,同時我也在SNOMED INTERNATIONAL \ IRDiRC兩個國際擔任一些職務,后面會有相應的介紹。
今天他們給我的題目和我最后列的題目有點不太一樣,但是精髓是一致的,這是我們醫療領域面臨獨特的一個點,其他領域數據來源也好,結構化也好,標準化程度也好都是非常有利于支撐整個人工智能產業的發展的。但是醫療領域現在面臨的問題非常嚴峻,我們需要大批量的數據來支持我們算法的優化、臨床的應用,但是偏偏當你去找數據的時候你會發現我們傳統的醫療產業對數據生產能力非常弱,它生產出來的數據要么是結構化太差,要不然互相之間不能互聯互通,所以沒有辦法支撐后面的產業應用。我把AI加入這里,是因為大批量的組學數據加入到庫里面來需要我們更新的技術和更強大的計算力量處理新的數據。
神州醫療的愿景是把這三個的技術都做一些融合, 醫學信息學、生物信息學及人工智能這三個領域同時發力才能使得我們可能在醫療人工智能方面做出一點點進步 ,這是我今天主要想講的一個內容。
這張圖反映的是醫療領域現在在數據的積累和成長方面的一個比較典型的趨勢,我們其實已經過了數據的拐點,現在大批量的組織數據的進入使得臨床單一維度的信息得到特別快速的擴充,像現在一個人身上可以同時綁定它的行為、、基因組、環境暴露、微生物組、蛋白質組等等各種各樣的組學信息,每一個組學之間都可以實現跨組學的檢測分析、相關性分析,因果關系分析等等,它其實為我們整個新的計算技術在這個領域應用提供了非常大的空間。神州醫療致力于把數據轉換成信息,信息轉換成知識,知識再轉換臨床的動作,造福于患者,后面我會逐一展開介紹。
醫療人工智能發展趨勢
我們醫學從一個傳統的evidence循證醫學時代到source learning時代就是以信息學為基礎框架的生產系統里,醫院的數據能夠積累形成醫院的一些科研和數據資產,然后更進一步形成新的證據和支持,然后通過人工智能數據下的臨床支持系統再干預患者的診療過程,再更進一步的產生這樣的循環。所以說source?learning這是我們現在醫學信息學或者醫療人工智能方向最主要的發展領域。我們自己除了在產業上追求很多應用,在學術上也做大量的工作,包括精準醫學信息學等等這一些新的概念、新的發展趨勢也是我們最早在國內提出,并且去實踐的。
有一個非常重要的趨勢,在院內除了傳統的臨床數據的生產以及運用以外,大批量的組學數據的進入以及組學數據的處理和標準化流程開始部署到醫院。這帶來最大的可能性是我們終于在臨床數據這一個維度之外有可能把其他組學的數據在院內引入進來。為什么強調院內?中國現在臨床數據出醫院是一個比較混亂的局面,我們只能把其他類型的數據引入到醫院,在醫院內部產生一些可供人工智能發展技術也好、做應用也好的一個生產環境。
因為中國醫院體量都比較大,我們單一醫院已經能夠支撐中小型省份病人的體量,它的數據量在支撐研究和發展產業應用上是足夠的。我們左邊是大量臨床數據的結構化、標準化,右邊是在組學信息基礎上添加新的組學技術,使得它能夠成為一個可擴展性極強的支持研究大數據分析等各方面的一個輔助與支持人工智能技術發展的數據的平臺。因為我自己是做醫療出身,在神州醫療出任高級副總裁,我主管醫學部、市場部、知識產權等等一系列工作,我們認為醫療方面一直以為醫療是非常嚴肅的一個產業,所以一定需要在臨床方面有最頂尖的國家機構來跟你做深入的合作和支持,才能保證你的技術發展方向和產品真正能夠造?;颊摺?/p>
?神州醫療的布局
所以神州醫療三個戰略伙伴一個是北京協和醫院,也是我自己原來工作的地方,是我們國家的罕見疑難病診治指導中心;第二個是醫科醫院腫瘤醫院,是我們國家的癌癥中心,第三個是復旦大學附屬兒童醫院。這三個里面都有非常深入的布局,三家醫院都有聯合實驗室,有聯合研發的項目等等。
神州醫療我們也承接了國家的大量在醫學領域跟大數據、信息學以及人工智能相關的課題。比如說我們史總參與和承擔了惡性 腫瘤大數據 平臺的技術課題,我們首席科學家徐華教授是上周剛剛公布的由神州醫療牽頭做的,基于人工智能的臨床決策系統這個項目的首席科學家,我自己也在參與很多這些研究。值得一提的是我們在上海市與中山大學一起拿到了上海醫學人工智能重點支持的50個專項里面的一個。神州醫療同時具備醫學信息學、生物信息學、人工智能的研究等各方面的能力,所以我們在醫學領域最熱的,像醫學與大數據的結合、醫學與人工智能的結合以及精準醫學這幾個領域都有比較深入的布局。
?神州醫療的背景
神州醫療從建設之初可以說含著金湯匙出生的公司,我們是中國健康醫療大數據第二集團科技創新公司的主要發起方,同時布置在幾個領域,包括大數據、 精準醫療 、人工智能等各個方面。國家健康大數據科技公司目前是我們健康醫療大數據產業里面唯一一個能夠獲取數據運營資質的三家公司,所以我們神州醫療作為第二公司主要發起方代表我們在這個領域主要的技術創新的團隊以及未來數據運營的能力。
神州醫療的主體工作
(1)建立國家腫瘤大數據平臺
我們主體工作之一,就是在國家發改委和衛計委兩個部委之下建立國家腫瘤大數據平臺,這個平臺的建設是圍繞著國家級癌癥中心、30個省級腫瘤中心、100多家地市級的腫瘤醫院以及全國1000多家綜合醫院腫瘤科做院內數據統一的匯集以及整合分析。這個工作在全世界范圍內都是前所未有的,因為我們對數據的采集絕不是僅僅是病案首頁或者簡單的個人信息,而是這個患者在醫院內發生的所有跟臨床診療相關的被記錄在電子系統里的信息。所以這樣的一個數據平臺現在已經能夠為我們國家的腫瘤登記、腫瘤流行病監測、腫瘤臨床診療質量分析以及眾多大數據、人工智能技術研發提供非常強有力的支持。
我到今年年底會實現100家醫院的接入、25個以上省份的覆蓋、總病人的記錄數會超過1200萬患者。我們有大量的標準系統。所以目前來說這個已經是全球范圍內最大的單體腫瘤患者專病的數據庫,它已經為我們國家在腫瘤患者臨床質量的改善以及構建一個全球范圍領先的大數據平臺方面做出非常重要的貢獻。
(2)中國國家罕見病的注冊系統
第二個工作是我自己主導的,也是由神州醫療做技術支持的,它的負責人是北京協和醫院的副院長(張翔)教授,是我們中國國家罕見病的注冊系統。罕見病是精準醫學領域非常重要的疾病領域,我們全球有6000多種罕見病,中國雖然每一種疾病的病人都很少,但是這些所有的 中國罕見病 加起來患者超過3000萬,所以它是一個龐大的人群。習大大提出了健康中國2030和全民健康等這樣一些理念之后,要求我們不能把任何一個群體在整個全民健康計劃中漏掉,罕見病就是非常重要且需要改善的一個目標群體。
所以從2016年開始由北京協和醫院主導,阜外醫院、北大醫院、華西醫院等等全國20多家單位參與,我們現在正在構建中國全國范圍內的罕見病注冊登記體系。這個體系非常重要的特點是除了傳統的臨床數據以外,也收集整理患者樣本庫的信息,以及精準測序的信息,就是在數據采集方面的一個部署。
(3)中文的罕見疾病知識庫
另外一個工作是我們在構建中文的罕見疾病知識庫,這也是我們國家一直非常欠缺的。在這個基礎上,我們希望未來構建中國罕見病的大數據平臺來支撐基于人工智能技術對罕見病的診斷、治療等一系列技術的研發。這個工作推進得非常順利。我自己是項目的負責人、執行負責人也是技術團隊的負責人。我們2017年7月份系統上線,到現在積累三萬多罕見病患者120多種疾病,有信心在未來兩到三年內使它成為全世界最大的罕見病注冊登記系統,這也是由神州醫療一直無償支持的,是我們做的精準醫學人工智能方面另外一個非常重要的部署。
我剛才提到在IRDIRC的任職經歷,我們組織方向主要目標是在2020年以前開發200種新的治療辦法和200個新的檢測辦法。我們在2017年底已經實現了200種新的治療辦法的突破,現在正邁向200種新的診斷和檢測的目標,這是全球范圍內罕見病協作的聯盟。我現在自己擔任IRDIRC的診斷科學委員會的成員,我剛被提名副主席,正在走我們內部的一個競選。所以IRDIRC我們在全球范圍內非常重要罕見病的診療的一只力量。
?(4) 支持心臟病或者胸痛患者的大數據平臺
再一個工作是我們神州醫療面向未來人工智能和大數據領域一個非常重要的工作,是和飛利浦一起支持中國心血管聯盟建設的支持心臟病或者胸痛患者的大數據平臺?,F在由全國20多家頂尖的心臟病專科領域綜合醫院和??漆t院在參與,希望構建我們對于中國胸痛患者、心血管集中患者的集中式的平臺。
我今天講了很多關于數據采集和整理以及在此基礎上做人工智能研究的一些工作,最主要的原因是因為在醫療的人工智能領域,除了現在看到大量圖像的工作因為在對于數據采集和標化利用方面難度相對來說比較低,我們很快可以實現突破以外。如果你想尋求在臨床領域更深更廣泛的應用的話,數據的來源是非常大的問題。
神州醫療獨特的優勢
神州醫療獨特的優勢在于說我們對于數據的來源方面有非常廣泛的渠道,都是在承建國家級的項目,這使得我們在進行人工智能的研究和應用得到好的保障。比如說一個非常重要的應用是中文臨床數據的高通量表型化,這里面有一些專業的術語,大概講的內容是我們如何把原始的數據經過自己自然語言處理技術轉化,轉換成可供與其他組學數據進行深度分析挖掘的臨床表型組的信息。這里面有幾個關鍵的技術難點,第一個是數據來源,第二通用數據模型,第三是醫學的自然語言處理,第四語義控制和術語標準,這塊我們有非常獨特的資源。
(1)通用數據模型
首先講通用數據模型,在醫學大數據和醫學人工智能領域我們最主要的發展方向是全球的通用數據模型OHDSI,當然也有一些是研究領域通用的,但是OHDSI更多的是面向整個產業,除了研究領域也有包括藥廠的數據分析、保險的數據分析等等,這是我們在國內主推的一個方向。
我們首席科學家徐華教授也是OHDSI中國的主席,我們在中國致力于OHDSI其他伙伴推動相應的工作,我們每年會有OHDSI的年會,今年在廣州,所以2019年的時候非常歡迎產業界對這一類型信息和技術感興趣的朋友一起參加。
(2)醫學自然語言處理
關于醫學自然語言處理,醫學人工智能領域圖像大家都已經做的差不多了,每個人都是一堆公司扎進去做,但是你真想把醫生寫在臨床病歷大量的信息提取出來的話,醫學的自然語言處理是現在面臨的最大技術難題。我們自己團隊在英文的醫學的自然語言處理方面一直排在全球最頂尖的位置,我們英文的自然語言處理的軟件現在有3000多家研究機構在使用,中文方面也是最早進行這方面工作的機構,現在在國內有非常好的案例和非??壳暗募夹g的排名。我們首席科學家徐華之前是德州大學的終身教授,目前是神州醫療在這方面的首席科學家,是我們醫學自然語言處理方面全球范圍最頂尖的技術專家。
(3)中文的臨床術語文體
另外一個工作關于中文的臨床術語本體,這個工作是我們在國內整個技術是非常欠缺的。我自己在SNOMED CT擔任全球管理委員會的董事,是六位董事之一。所以我們對于一些新的國際技術和標準的引入在國內具有一些非常獨特的優勢,我們在國內訓練了大批臨床術語的專家。中國第一家SNOMED CT license?)當時給了協和醫院,是在做我們國家的中國國家罕見病登記系統,現在神州醫療已經正式在國內分發SNOMED CT,幫助全國的醫療機構和大數據平臺解決數據標準化的問題。SNOMEDCT本身也有從臨床數據向組學數據的拓展,這塊工作我們也在積極推進。
還有一個我們做人工智能和大數據不能忽視的就是關于倫理和隱私安全保護,神州醫療醫院在這方面下了非常大的功夫。我可以非常自豪地說我的數據團隊上,我們要求所有的員工必須經過HIPAA的考試認證才能在神州醫療數據部門上崗,這是在機制部門保障患者的隱私。同時我們也有基于中國大數據訓練出來的醫療大數據再識別風險量化評估的目前國內唯一技術體系和評測辦法。這塊我們一直在做大量的工作。
最后我提幾點,未來的大數據的時代多組學數據融合的過程中,基因組學數據在運算和應用中隱私保護是非常關鍵的技術難點。我們復旦大學兒科醫院有一個非常重要的工作就是做基因組學數據的隱私、加密和運算過程中的個人患者隱私保護。所以每年神州醫療還承擔著國家重點研發課題,我們有非常強的在全國范圍內協調各家科研院所的能力,今年在中國的國家重點研發計劃里面我們參與了5項申報,全國頂尖的醫院都是我們比較重要的合作伙伴,我們自己牽頭一項,參與一項,現在最重要的工作就是基于人工智能的臨床學注冊系統就要馬上在全國范圍內啟動和開始做一些部署的工作。
2017年和2018年我們分別都在美國信息學會做關于中國的健康醫療大數據、人工智能和精準醫學的專題論壇,今年最重要的消息是我們成立了中美醫學信息與數據科學聯合中心是由中國的衛生信息學會會長和美國醫學信息會主席一起擔任這個聯合中心的負責人,我們自己也有相應的中方和美方的代表,希望通過中美雙方的努力一起促進在醫學人工智能、醫學信息學方面的發展。雖然中美在政治領域、經濟領域有很強的對撞的局勢,但是在學術交流領域可以看到很多的新的進展。
所以非常非常感謝億歐的邀請,再次感謝各位的時間。我們自己是一個非常開放的、面向全行業、面向各方面技術體系、面向各個方面合作伙伴的平臺型的公司,也非常期待和各位億歐領域的技術專家們合作,再次感謝各位對神州醫療的支持,謝謝。?
本文系投稿稿件,作者:弓孟春;轉載請注明作者姓名和“來源:億歐”;文章內容系作者個人觀點,不代表億歐對觀點贊同或支持。