Pages

Wednesday, April 22, 2015

國衛院 劉永安... 健保資料醫藥大資料分析協助藥物開發

國衛院打造TB級資料庫沿用19載,為臺灣健保大資料分析奠基 文/余至浩 | 2015-03-30發表 iThome19年前單顆硬碟容量只有16GB,當時的國衛院為了建置全國醫藥衛生系統,每年得面對TB級成長的健保資料爆量挑戰你知道全國超過2,300萬的健保人口中,每年花在儲存健保資料上得占用多少個硬碟空間嗎?根據國家衛生研究院(以下簡稱國衛院)從健保局提供去識別化的醫療資料來估算,光是每年花在儲存醫療資料上就得用掉將近1TB大小。雖然以現今技術標準來看,儲存這些資料只要裝上一顆TB級硬碟就綽綽有餘,不過距今19年前,國衛院只能靠著一顆顆可能連16GB大小都不到的硬碟,做為健保資料庫的儲存使用,同時,國衛院也是當時少數很早就得面臨TB級資料儲存爆量的機構,而這也成為了國衛院在進行IT建置時所要面對的一大挑戰。儲存1年份的全國健保資料就得需要將近1TB大小在國衛院任職超過18年之久,也是現任國衛院總辦事處資訊中心主任劉永安表示,國衛院從1997年開始建置健保資料庫,來儲存健保局每半年去識別化後釋出的醫療資料,做為醫藥研究分析的使用。國衛院不只是每年花在儲存健保庫資料就得占用上600GB~1TB容量,每次分析後的資料也得保存供後續研究使用,包括從健保局開始實施的試作期資料,迄今國衛院已經累積了將近20年醫療資料存放在健保資料庫中。而截至目前為止,該健保資料庫的儲存資料已經累積多達400TB,這還不包括了另外做為支援其他研究及行政使用約100TB的儲存空間。甚至,由於國衛院保存有歷年以來的健保庫資料,「到後來,連健保局也都回過頭向我們來要資料。」他說。也因此,早在大家還沒開始談論大資料前,劉永安說,國衛院就開始利用取得而來的健保資料進行醫藥大資料分析,甚至挖掘出更多的重要醫藥發現。他也舉其中一個研究發現當例子,以前的人感冒進醫院,醫生大多會開立抗生素的藥物,但後來,國衛院通過分析健保資料庫的資料,找出造成高用量抗生素的主因,用來改善了醫療診所抗生素的用藥量。除了健保資料庫的研究分析外,另外像是在進行基因定序解碼(DNA Sequencing)及分析時也需使用大量運算。因此,劉永安說,國衛院很早就展開布局採購64位元的作業系統做為DNA研究以及統計運算。也因為對於資料儲存的大量需求,國衛院在2005年新啟用的竹南資訊中心機房中就採購了更多的儲存設備來滿足資料儲存使用。所以,機房內分為兩區,一區供主機與儲存使用,另一區則用於網路設備,並額外提供預留區做為未來設備擴充與調度。從早期的全國資訊交換中心,轉而成為提供院內研究資源使用不過,劉永安指出,國衛院IT發展過程中,歷經了兩個重要階段轉換。早期國衛院扮演的角色是做為全國資訊交換中心,負責提供資源給全國醫藥衛生單位,也與國外研究機構合作共享資源,因此在建置機房時曾經最多與6家網路服務提供者(ISP)接軌提供資料交換。像是教育部、中研院、國網中心、政府網際服務網(GSN),以及第1類或第2類ISP業者都是曾經合作的對象。甚至,他說,當年網路尚未發達的年代,國衛院也透過機房內的大型主機,打造了醫藥衛生電子圖書提供全國醫藥單位使用。而隨著網路發展快速,頻寬越來越便宜,網路速度也大幅提升,各醫療機構也紛紛透過網路建立互通平臺,劉永安說,這也使得國衛院逐漸卸下過去賦予的國家資訊交換中心角色。反倒是後來隨著研究人員對於資料交換需求逐年增長,加上近幾年雲端與設備的快速發展下,使得國衛院從早期的全國醫藥資訊交換中心,轉而開始成為了提供院內研究單位與合作機構的研究資源使用。在研究資源的分配上,目前該機房主要提供全院980位研究人員來共同使用,不過劉永安也指出,當中特別需要使用大量儲存與運算部份,一個是健保資料庫的統計分析,另一個則是做為生物統計研究。因此,劉永安也說,在提供運算資源上,國衛院會與國網中心合作用於高運算分析平臺,網路部份則是仰賴原有機房提供高速頻寬網路,至於儲存資源則是依使用者需求再來分配資源。此外,資訊中心扮演的角色也從早期研究資源的整合者,退居為以滿足研究單位需求為主的協助者。這樣的改變也出現在IT管理上,劉永安說,不同於一般政府機構的IT管理,資訊中心除了初期協助IT系統建置、諮詢與維運外,在管理面上,靠的是研究人員的自我管理。因為他說,做為研究單位,第一個講求就是具備誠信原則,因此有時比起以單方面強制性的管理,反而有賴使用者的自覺和需求還來得更有效。劉永安也解釋說,會採用這樣的作法是為了確保不會因為管制而放棄了對研究的信任。但他也說,這並非代表完全不管制,而是得視情況或任務而定,像是針對安全管理,院內也提供有防火牆、IPS入侵預防系統做為預防機制,此外一旦有任務上的管制需要,也會採用嚴格管制的標準。他也舉研究院附設的疫苗廠房當說明。因為生產疫苗的過程中每一個環節都至關重要,像是必須符合疫苗製程的cGMP標準認證,因此資訊中心就得協助建置雙網路機制,將內部廠務資訊系統跟個人使用資訊系統與網路完全獨立分開,確保資訊的安全性。另外健保資料庫也遇到有類似的需求,為了避免蒐集健保資料涉及隱私引起社會不良觀感,所以在管理上,資訊中心也針對機房內建置的健保資料庫採用實體隔離的封閉式網路,僅提供處理內部流程跟資料方面的連網。目標成為服務提供者目前該資訊中心總共配置有14人,分別負責系統網路、應用系統開發以及資訊機房維運。不過劉永安表示,隨著資訊中心過去幾年的轉變,資訊人員的工作也變得更加多元化,像是寫程式的人也得要負責維運,而不是只做一種工作。劉永安也笑說,以前資訊中心剛成立時,資訊人員每天都在抱怨要四處協助使用者修電腦或復原硬碟資料,但隨著硬體技術成熟,他統計去年院內1,600臺電腦的維修件數還不到200件。隨著系統成熟度越來越高,他也認為,未來的資訊中心的角色也得跟著改變,將從早期研究資源的整合者與分配者,轉成為服務提供者與整合者。例如,他說,現在有很多臨時接到研究案的研究人員,可以在編列預算購買設備前,先通過資訊中心提供的技術、經驗與測試環境,進行評估,如果確認沒問題,再行購買。不過劉永安也坦承,在協助IT建置過程中,遭遇到的最大挑戰是,使用者不知該做什麼或達到何種目標,這也是在資訊化過程中最頭痛的部分。而解決的方式仍得花時間跟使用者溝通需求,共同瞭解該使用何種資訊工具才能達成目標。也因為資訊中心的主機對外服務逐年減少,再加上大型主機維護費用昂貴,以及面臨老舊主機設備的汰換期,國衛院也在2008~2009年開始決定導入虛擬化。劉永安表示,在他接掌資訊中心主任一職以後,也陸續將舊有的x86實體主機遷移至虛擬機器上,至於不足的部份則是靠著購入新機器來補足。他表示,目前機房內仍以主機虛擬化數量占大宗,未來2~3年也計畫將儲存區域網路設備(SAN)陸續淘汰,全面擁抱儲存虛擬化,提高儲存使用效能。此外,在網路方面也將引進10GbE網路,並將舊的SAN設備與新的10GbE介面結合。他也說,機房改革只要不是跟使用者有太多牽扯,反而比流程與程式改革好推行太多。不過在導入主機虛擬化後,劉永安也碰到了不少難題。像是有部份分析應用必須要耗掉大量的記憶體。例如一次DNA定序分析至少得需要配置128GB以上的記憶體,不然就無法完成運算,然而,一個虛擬機器提供的記憶體約只有32 GB,無法用於DNA定序。此外,部分大型資料庫,如健保資料庫或行政資料庫等,他說,未來若要朝向雲端化發展,光靠虛擬機器是否能滿足也是另一個大問題。不過,針對記憶體不足的問題,劉永安最後則是靠著擴充x86實體主機的記憶體到128GB以上才解決。劉永安表示,未來國衛院計畫將朝向系統整合、雲端化,以及開放系統的目標持續邁進。像是針對系統整合部份,除了要將財務、人力、資源跟計畫相關資料,整合成簡單易懂的資訊,加快決策進行外,另外在蒐集資料過程中,未來也會先將具時效性的紙本作業電子化,加快作業流程。此外,為減少人力和硬體成本,未來2~3年,劉永安也計畫重新規畫院區網路,透過雲端化部署來達到服務與硬體的整合。而在開放系統方面,他也說,目前國衛院的內部系統,除了財務系統與另一個僅支援IE瀏覽器的早期系統外,其他已採用開放系統建置。而將來的應用開發,也將使用如PHP或Java開發的開源軟體或採用Linux開源平臺,劉永安表示,最終的目的就是要讓使用者的介面完全開放,不管使用何種瀏覽器或平板及手機都可拿來使用。國衛院資訊中心主任劉永安說,IT扮演的角色已從早期研究資源整合者,轉變成為服務提供者。

CIO小檔案劉永安國衛院總辦事處資訊中心主任學經歷:電機工程背景出身的劉永安,曾先後於醫療機構、中央印製廠、批發百貨服務累積多年IT資訊實力,也參與過全國第一套POS系統開發,1996年加入國衛院後負責全國醫藥衛生系統的IT建置,2013年接任資訊中心主任後承接起推動全院系統整合、雲端及開放系統的重責大任。

公司檔案國家衛生研究院●地址:苗栗縣竹南鎮科研路35號●網址:www.nhri.org.tw●成立時間:1996年●主要業務:醫藥衛生、醫藥科技、生命科學●員工數:約1,380人●董事長:蔣丙煌●院長:龔行健

資訊部門檔案●資訊部門主管職稱:國家衛生研究院總辦事處資訊中心主任●資訊部門主管姓名:劉永安●資訊部門人數: 14人●IT預算: 約2,000萬元

IT部門大事紀:●1998年:協助建置健保資料庫、生醫資訊服務系統設備建置●2001年:導入電子表單系統●2001年~2003年:建置大型主機提供大型統計與資訊系統服務使用●2004年~2005年:竹南資訊機房建置及啟用、網路系統完成、取得

BS7799資安認證●2007年:取得ISO 27001資安認證、總辦事處資訊中心成立●2008年~2011年:將大型主機服務遷移至x86主機、開始逐步導入虛擬化●2014年:全面採行主機服務虛擬化●2015年:展開資訊系統整合

No comments:

Post a Comment