?????? 來源:HIT專家網 ? ?作者:南京都昌信息科技有限公司 袁永福
?????? 近期,醫療行業的大數據應用日益增多,影響日益深遠,此時相關的安全問題日益突出。特別是可靠的人員隱私數據的保護,或者說數據脫敏,成為大數據應用中的“卡脖子”問題。若不認真解決,遲早會爆雷。為解決這一問題,都昌團隊即將推出病歷文檔局部數據透明保護技術(TDP-Transparent Data Protection)。
現狀
?????? 在醫療數據中,病歷文檔數據是重點部分之一,而病歷文檔中夾雜著不少隱私數據,比如:患者姓名、聯系方式、醫護人員姓名等等。按照美國人的做法包括以下18項身份識別信息:姓名,小于省級的地址(包括街道、城市、地區和三位以后的郵編),除年份以外與個人相關的日期(包括生日、進院日、出院日、死亡日期、超過89歲的年齡)、電話號碼、車輛登記號碼、車牌號碼、醫療器械標識號和序列號、傳真號碼、電子郵件、URL、社保號碼、IP地址、病歷編號、指紋等生物標記信息、醫療保險號碼、正面全臉照片、銀行賬戶號碼、證件號碼(身份證、駕照等)。
?????? 此外,我認為還應該包括醫護人員的姓名和工號,可以讓第三方立場中立地處理病歷。
?????? 任何其他可用于識別的編碼或特征的病歷文檔數據價值比較高,有足夠的經濟利益來引起網絡黑色產業鏈的興趣。
?????? 另一方面,醫療大數據又需要以大量的真實病歷數據為基礎。真實病歷數據是大數據所需的燃料。沒有這種燃料,大數據之類的都是空中樓閣。
?????? 這就存在一個突出的矛盾:一方面,要大規模遠程傳輸、復制和分析病歷文檔;另外一方面,為了保護隱私數據而要限制這些行為。如何解決這個矛盾呢?
?????? 首先要明確,醫療大數據是大勢所趨,宜疏不宜堵,不能因噎廢食。為此一些常見的做法是提升網絡安全保護水平,加強事前防御和事后審計,不過這其中工作量巨大,而且肯定存在漏洞,不可能萬無一失。
?????? 為此,都昌團隊正在研發數據透明保護技術來幫助解決這個矛盾。從源頭來保護隱私數據,確保減少病歷數據泄露后的損失。而且能降低病歷數據對于網絡黑產的價值,從經濟利益方面保護數據。
原理
?????? 透明保護技術是基于都昌的電子病歷編輯器技術。其大致的原理就是醫院在制作結構化病歷文檔模板時,對于一些隱私數據文檔域,比如病人姓名、地址、聯系方式、操作醫護人員姓名等,做上一個特別標記。
?????? 電子病歷系統配上一個加密解密相關的密鑰,可以存儲在一個嚴格保護的K寶中,電子病歷系統啟動時加載這個密鑰,醫生寫完病歷后保存時,隱私字段內容就使用這個加密密鑰進行加密存儲,其他字段(比如主訴、現病史、檢查檢驗結果之類的)還是明文存儲。
?????? 這樣得到的病歷XML文檔中間就夾雜著加密數據。
?????? 當醫護人員使用醫院內部軟件打開文檔時,編輯器檢測到被加密的敏感數據域,就會根據內部密鑰動態地局部解密,然后以明文的形式呈現給用戶。
?????? 透明保護不會影響醫院業務系統的性能。病歷文檔中隱私字段數據量占比小,加密解密運算速度快,而且病歷XML文件大小增加不多,醫護人員不會感覺到透明保護的存在。
?????? 當文檔復制到醫院外部,病歷XML文檔仍然可以正常加載,大部分內容都可以獲取,但是隱私數據是加密的,不知道密鑰是無法破解的,只能以亂碼的形式呈現給用戶。而且按照病歷書寫規范和行業慣例,病歷中明文區域出現敏感數據的可能性很小。因此隱私數據得到很好的保護。
?????? 而正常的大數據處理是不應該需要這些隱私數據的,因此透明保護不會干擾正常的大數據業務。
?????? 從經濟角度看,透明數據保護也能發揮作用。網絡黑產獲取病歷文檔,很多看中的是其中的敏感數據,這些敏感數據是所謂精準營銷的基礎。但是當隱私數據加密了,這些病歷數據對于黑產來說就成了雞肋,也就沒有足夠的動力來突破重重安全措施來非法復制傳播了,于是數據就得到保護。經濟利益手段是最穩固可靠的保護手段。
?????? 透明保護技術同時支持了醫院業務系統和大數據系統的運行。成為實現醫療大數據的最佳底層技術,為醫療大數據應用提供了一根方便可靠的安全帶。
案例
?????? 下圖是一個病歷文檔:
?????? 若明文保存則XML內容大致如下:
<EMRDocumet>
<String>孕婦基本情況</String>
<Fieldid=”孕婦姓名”>張翠花</Field>
<Fieldid=”證件號碼”>360428000000000000</Field>
<Fieldid=”出生日期”>1994-1-1</Field>
<Fieldid=”年齡”>25</Field>
<Fieldid=”手機號”>13388888888</Field>
<Fieldid=”孕前身高”>170</Field>
<Fieldid=”孕前體重”>70</Field>
<Fieldid=”戶口地址”>南京雨花臺區軟件大道999號</Field>
<Fieldid=”產后休養地址”>南京雨花臺區軟件大道999號</Field>
<Fieldid=”丈夫姓名”>王小二</Field>
<Fieldid=”證件號碼”>360428999999999999</Field>
<Fieldid=”出生日期”>1991-1-1</Field>
<Fieldid=”手機號”>13300000000</Field>
<Fieldid=”工作單位”>南京綠地公司</Field>
<Fieldid=”戶口地址”>南京雨花臺區軟件大道999號</Field>
<Fieldid=”結婚年齡”>3</Field>
<Fieldid=”末次月經”>2019-1-1</Field>
<Fieldid=”初潮”>14</Field>
<Fieldid=”月經天數”>3</Field>
<Fieldid=”月經周期”>29</Field>
<Fieldid=”月經量”>50</Field>
<Fieldid=”痛經”>有</Field>
<Fieldid=”受孕方式”>自然受孕</Field>
<Fieldid=”胎數”>1</Field>
<Fieldid=”過敏史”>青霉素</Field>
</EMRDocumet>
?????? 這樣的文件在網絡黑產中單價10元都不嫌貴。
?????? 但是采用透明數據保護技術,保存的則保存的XML文件如下:
<EMRDocumet>
<String>孕婦基本情況</String>
<Fieldid=”孕婦姓名”TDP=”1″>FDAJSIF3$#@$#@</Field>
<Fieldid=”證件號碼”TDP=”1″>FDASJIFA$#q$#@$@#!%$@#%$#@#@$</Field>
<Fieldid=”出生日期”>1994-1-1</Field>
<Fieldid=”年齡”>25</Field>
<Fieldid=”手機號”TDP=”1″>^%#$%$#^$%^$@#$#@%#$%$#@$#@%#$%</Field>
<Fieldid=”孕前身高”>170</Field>
<Fieldid=”孕前體重”>70</Field>
<Fieldid=”戶口地址”TDP=”1″>%$#^%#$%$@#%#$@^%#^$%^@$#%$@#%$@#%#%34</Field>
<Fieldid=”產后休養地址”TDP=”1″>^%$^%@%$@#%$#@%$#%$#^%#$^54</Field>
<Fieldid=”丈夫姓名”TDP=”1″>#@$#!$#$#@^%#$^@%$%#$#@!#@!#!@</Field>
<Fieldid=”證件號碼”TDP=”1″>*^%@%$#@%@^%@%$@#%#^%#$%$@#</Field>
<Fieldid=”出生日期”>1991-1-1</Field>
<Fieldid=”手機號”TDP=”1″>$#@%$#@#$!#@$#!@$#@</Field>
<Fieldid=”工作單位”TDP=”1″>r$@%$@^@$##@!$@#%$#</Field>
<Fieldid=”戶口地址”TDP=”1″>%$@#^%#$^$@#%#@!$@#%#%$#@%#^%$#999號</Field>
<Fieldid=”結婚年齡”>3</Field>
<Fieldid=”末次月經”>2019-1-1</Field>
<Fieldid=”初潮”>14</Field>
<Fieldid=”月經天數”>3</Field>
<Fieldid=”月經周期”>29</Field>
<Fieldid=”月經量”>50</Field>
<Fieldid=”痛經”>有</Field>
<Fieldid=”受孕方式”>自然受孕</Field>
<Fieldid=”胎數”>1</Field>
<Fieldid=”過敏史”>青霉素</Field>
</EMRDocumet>
?????? 在醫院內部打開文檔沒有任何異常,但在醫院外部則顯示如下:
?????? 這份病歷文檔在網絡黑產中單價一毛錢也未必能賣出去。對于網絡黑產來說,病歷文檔的價值急劇降低,其破解復制病歷文檔的動力大為減弱。但這種文檔卻足夠正常的大數據系統使用。這下醫院放心了,也就能愉快地玩大數據了。
推廣
?????? 由于透明加密技術是通用的底層技術,其最佳實現地點就是病歷編輯器的內部。我們作為專業的編輯器研發團隊,自然要在這方面做好工作。
?????? 都昌團隊即將推出的透明保護技術會隨著編輯器軟件版本的升級,方便地賦能到兩百多家醫院軟件公司,進而讓數萬家醫療機構獲得這種關鍵性的技術工具,從而為全行業的大數據應用解決了隱私數據保護的大問題。
【小結】
?????? 相信經過我們及合作伙伴的努力,能解決很多醫院對于隱私數據泄露的顧慮,減少其分享病歷數據的障礙,緩解大數據行業的“巧婦難為無米之炊”的難題,促進大數據的推廣普及,從而讓數據的價值最大化,最終幫助醫療行業的價值最大化。
【作者簡介】
??????? 袁永福:男,微軟MVP,80后,南京都昌信息科技有限公司聯合創始人,中國醫院信息化領域知名軟件技術專家,長期從事電子病歷編輯器等行業核心技術的研發和推廣,并直接為多家三甲醫院提供軟件技術支持及咨詢服務。
想加入HIT專家網專業交流群嗎?請添加“HIT專家網”小助手微信好友后提交你的申請哦
(請注明姓名、單位名稱、職務、主管技術或產品領域,以便有針對性加群)
【責任編輯:譚嘯】
評論前必須登錄!
注冊