Thursday, May 2, 2019

雲象科技: 疾病細胞AI辨識 (鼻咽癌/骨髓抹片/肺癌/腎臟病)


【醫療影像AI新創:雲象科技】鼻咽癌AI偵測模組準確率已達97%,接著要挑戰血癌辨識AI /王若樸 | 2019-04-19雲象科技共同創辦人暨執行長葉肇元4年前與好友共同創辦雲象科技,以數位病理起家,提供病理玻片掃描與資料庫服務,後來導入AI,以數位病理為基礎,打造出特定疾病的細胞辨識AI模型。(攝影/洪政偉)臺灣醫療影像AI生態圈中,不只醫院和學界在耕耘,還包括新創公司的投入。我們看到有一家業者表現特別出眾,他們選擇了高難度的數位病理領域,短短12年內,就掌握了國內大半的數位病理AI市場,更於去年國際醫療影像年會MICCAI上,擊敗了來自史丹佛大學、卡內基美隆大學和騰訊的團隊,在一場數位病理影像分析競賽中拿下第7。這家新創,就是4年前由3位對醫學充滿熱忱的年輕人所成立的雲象科技,以數位病理起家,提供玻片掃描、建立數位病理資料庫的服務,讓醫生不必再捧著一盒盒玻片到實驗室用顯微鏡觀察組織切片。本是要改造數位化程度落後的病理科,但見識到深度學習在ImageNet影像辨識大賽的潛力後,雲象科技決定轉型為醫療影像AI公司,以原有的病理影像為基礎,來打造可辨識特定細胞的AI模型。轉型至今才不過2年,雲象科技就獲得了匹茲堡大學醫學中心(University of Pittsburgh Medical Center)、美國錫安山醫學中心(Cedars-Sinai Medical Center)青睞,共同發展數位病理AI。在國內,則掌握了大半數位病理AI市場,合作對象包括臺大醫院、林口長庚醫院、臺北榮總、國泰醫院、北醫附醫等,現階段成果除了有與林口長庚醫院開發的鼻咽癌AI偵測模組,還有骨髓抹片細胞分類、肺癌、腎臟病理研究等10幾項AI專案在進行。
代表性成果:能偵測鼻咽癌風險的AI模型 與林口長庚醫院共同開發的鼻咽癌AI偵測模組,是雲象科技最具代表性的成果。該專案自去年2月開始,使用了260張病理玻片,由林口長庚指派6位醫生來標註影像,雲象科技則負責訓練卷積神經網路(Convolutional Neural NetworkCNN)模型。在模型建置的過程中,雲象科技面臨的挑戰是,病理玻片數位化後,影像解析度非常高,「每張的解析度高達幾十億畫素。」雲象科技共同創辦人暨執行長葉肇元解釋,高解析度數位病理影像的檔案大小,遠高於GPU內建記憶體。受限於既有硬體,雲象科技只能切割影像為數個小區塊,來訓練AI模型。葉肇元舉例,當醫生先標註完數位玻片中的癌症區域後,團隊便將該區域切割為每張256×256的小區塊,再由醫生進一步標註每個小區域的細胞,而非單純判斷影像類別,再分批將切割後的檔案提供給深度學習神經網路,來學習辨識癌症。經過10個月的努力,這套鼻咽癌AI偵測模組已能在鼻咽組織的數位病理切片上,自動標示出癌症高風險區域,葉肇元表示,準確率已達97%。目前,雲象科技正準備這套模組的相關文件,要送至美國食品藥物管理局(Food and Drug AdministrationFDA)進行醫材審查認證,以便日後上市。 雲象與林口長庚醫院病理科合作,共同開發出鼻咽癌癌AI偵測模組,可顯示癌症高風險區域,準確率達97%
新挑戰:要教AI來辨識近40種骨髓細胞 談起眼下最有挑戰度的案例,「骨髓細胞自動分類是最有野心的嘗試。」葉肇元說,骨髓抹片是判斷血癌(又稱白血病)的關鍵檢查,因為血癌是由骨髓內白血球系列細胞惡性增生而成。根據細胞增生種類和細胞成熟度,血癌又可分為好幾種,比如急性骨髓性白血病、急性淋巴球性白血病、慢性骨髓白血病和慢性淋巴球性白血病等。「這個題目難度非常高,全球幾乎沒有人做。」葉肇元表示,除了資料收集不易,還因為一張骨髓抹片,就包含多種細胞,依其種類和成熟度來分,就有將近40種。然而,要判斷這些細胞,還得仰賴經驗豐富的專科醫生和醫檢師,但這類專業人力光對醫院而言,已是相對稀少吃緊的資源。儘管如此,雲象科技和臺大醫院仍決定挑戰這個題目,由臺大醫院血液科提供影像,派出12名專業醫療人員來協助標註影像,雲象科技則負責開發影像標註介面、訓練AI模型。這個專案自去年5月開始收集資料、標註影像,不過,葉肇元預估,要打造出骨髓細胞自動分類的AI模型,至少需要幾萬張影像,還要標註10萬多顆細胞才能完成,是一項大工程。他也坦言,雖然目前還未達臨床可用階段,「還有很長一段路要走。」但他期待,這個AI系統一旦完成,未來病患進行白血病檢查時,就可免去數天的等待,不僅病人受益,也可造福專業人力吃緊的醫療界。 葉肇元指出,骨髓抹片細胞分類專案是與臺大醫院血液科共同開發,要打造世界僅有的骨髓抹片分類計數模型。該模型能在臨床血癌的診斷工作中,來計算、分類骨髓細胞。(圖片來源/雲象科技)
數位病理AI的高門檻 與其他醫療影像相比,數位病理在影像解析度上有著極大差異,光是一張影像就可高達1GB2GB。這是因為,數位病理觀察的是微米等級的細胞,而非公釐或公分等級的腫瘤,因此需要高解析度呈現,醫生才能清楚辨識。這一點,也影響了打造AI的難易度。葉肇元比喻,要AI看出3公尺外的人有無雙眼皮,或是否有2隻眼睛,後者不需要太多影像資料就能做到,「甚至影像有點模糊也沒關係。」但對前者來說,就「必須使用好的鏡頭與清晰的對焦。」由於數位病理的高解析度特性,對硬體的需求也隨之提高。葉肇元舉例,他們遇過最有挑戰性的狀況,是當一個100層的ResNet分析一張解析度為10,000×10,000的影像時,GPU甚至需要搭配600GB的系統記憶體才能運算,遠遠超過單張32GB內建記憶體的頂級GPU的能力。也因此,雲象科技採用影像切割的方式來訓練模型。這個做法,雖然能克服硬體的局限,但葉肇元認為,縮小影像仍會流失一些資訊,例如切割後無法宏觀來看整張影像。對此,雲象團隊正研究如何處理高解析度影像的AI模型訓練。
為加快數位病理AI開發時程,雲象要從人才下手「開發醫療影像AI的瓶頸,就是漫長的標註過程。」葉肇元指出,雖然醫療影像AI的目的,是要減輕醫生看診負擔,但要打造AI模型,還需要醫生花時間來標註影像。「他們已經很累了,要怎麼幫忙?」於是,在過去3個月,雲象科技開始將人才延攬對象擴展至醫生,要聘請醫生加入影像標註團隊,加速整體開發時間。葉肇元希望雲象的標註團隊成員背景,能涵蓋專業醫科、醫學檢驗,以及護理相關等領域,來負責不同程度的影像標註。「甚至,我們也要有自己的醫療團隊,」以便開發或推展高醫療專業度的題目。

No comments:

Post a Comment

alveice Team. Powered by Blogger.