來源:HIT專家網 作者:陳曦整理
【編者按】
近日,在“HIT專家網-醫院信息中心交流群”“HIT專家網-醫信工程師交流群”等微信群內,針對數據中臺、大數據平臺、集成平臺等重點概念與應用,展開了數次精彩討論,并吸引了多位行業大咖的“圍觀”與傾囊相授?,F將討論的精華內容整理如下。
同時,也歡迎更多熱衷于技術交流的行業同仁加入我們。您有好問題,強大的群將為您呈現好答案。
carpe diem:各位,請問數據中臺和集成平臺的區別在哪里,除了名字不一樣?
游卓:個人理解,數據中臺只是匯聚數據,業務模塊還是各自的;集成平臺則是集成業務模塊到一個框架里。
carpe diem:這么說來,數據中臺與數據倉庫差不多?
筱瀾工作室:每個廠家的定義都不一樣?,F在流行概念,有數據湖、數據中臺、集成平臺。我認為集成平臺是定義一個標準,推動數據利用;而數據中臺就是在這個標準下利用數據。
最初不相識:個人理解,集成平臺是一個接口中轉器,數據中臺是數據能力提供者。
carpe diem:數據能力提供者怎么理解?
璞玉:個人感覺,集成平臺側重于提供接口的多樣性,數據中臺側重于提供服務,簡化上層應用。
游卓:集成平臺主要還是框架的集成,數據中臺在于數據的共享互用。
carpe diem:匯聚這些數據用來做科研分析?還是有其他用處?
筱瀾工作室:建立數據湖的步驟:第一步,“挖個大坑”,建立中央存儲庫;第二步,“持續灌水”,連接數據源,轉換和導入數據。數據湖就是個“坑”,反正有了大坑(中央存儲庫),又有了各種水管(ETL工具和連接器),什么樣的數據都可以囤起來。這種湖,浪太大,水太渾,數據量巨大,數據價值密度卻不高,更適合面向數據科學、機器學習等場景。但實際用得怎么樣不知道了,沒見過成功的場景。湖建好了,預算花了,價值卻并沒有發揮出來,數據湖就像垃圾桶,啥數據都往里倒,最終變成了“數據沼澤”。不知道對不對?
carpe diem:這么說的話,我感覺數據中臺和大數據平臺感覺差不多呢,感覺都是抽取利用分析呢?
薛萬國:看了各位的發言,說點個人認識:集成平臺的目的是實現異構系統的互聯互通,大數據平臺的目的是為開展數據的二次分析利用,數據中臺的目的是對數據進行加工、供業務信息系統使用(為業務賦能)。三者的目的、技術都不同。
筱瀾工作室:我又迷糊了,感覺大數據平臺和數據中臺好像沒有太多的區別了?
薛萬國:一個是隨機分析,一個是固化分析。
筱瀾工作室:@薛萬國? ,能不能舉例說明一下,我有點似懂非懂的感覺?
薛萬國:大數據平臺就是面向數據的挖掘分析。比如,臨床科室提出一個臨床假設“肺癌和吸煙不相關”,可以通過大數據平臺檢索病例、處理數據、建立分析模型,得出結論。這樣的數據挖掘分析隨問題而異,整個過程在大數據平臺上進行。
而數據中臺的本質是為業務賦能。比如,我們在業務中需要進行VTE(靜脈血栓栓塞癥)篩查,多個系統都要用到此功能,而這個功能又需要對數據進行分析處理后評分。這個功能就可以在數據中臺上實現,然后各系統共享。
大數據平臺上的數據分析通常是隨機問題,而數據中臺是“制式”問題。前者不一定要實時,而后者實時性較強。
天柱:有點明白了,是不是三個系統有交集(都能對接多個異構系統),但是三者都有各自的作用和目的,不是單純的包含關系?
薛萬國:大數據平臺和數據中臺在一定程度上會重合,但與集成平臺之間則是風馬牛不相及。集成平臺側重流程集成,因此重點是數據交換,但不做數據存儲。
天柱:難怪現在大數據平臺被公司用得好的場景主要是BI、報表、大屏,而不是書里說的數據最后能反作用于業務系統,提高業務系統能力。原來是這樣。
carpe diem:薛主任您好,聽完您的講解,受益頗深,同時也有個問題想請教一下:是否可以理解為大數據平臺是臨床業務需求驅動數據進行數據利用并分析?數據中臺這個例子是指中臺利用更趨向于行業內規范化的標準驅動業務?那么在剛剛的例子中,中臺實際應用場景實現共享后,廠商獲取到數據后會去做數據的實際應用,還是說中臺只是驅動業務的規范化?
薛萬國:一般來說,數據中臺應該是信息系統的一部分,是一種信息系統的架構模式。而大數據平臺是信息系統之外的另一個設施。數據中臺和信息系統屬于異構的情況還比較少。
筱瀾工作室:@薛萬國? ,大數據平臺和數據倉庫有什么區別?現在概念太多了,薛主任能不能講講?
薛萬國:那就試著再說一下。數據倉庫是圍繞主題對數據的再組織,比如圍繞收入,把數據按照科室、月份、項目等維度組織成多維立方體,便于數據的聯機分析(On-Line Analytical Processing,OLAP)。而大數據平臺,包括前面也有網友提到的數據湖,一般是一個數據模型,來組織數據,不面向特定主題的數據組織,也不一定支持OLAP。
筱瀾工作室:@朱小兵@HIT專家網? 朱總這個平臺好,有大神,授業解惑。
朱小兵@HIT專家網:爬樓學習,保存經典。
(上述內容來源于“HIT專家網-醫信工程師交流群”討論,HIT專家網整理,未經發言者本人審核確認)
【責任編輯:陳曦】
可以這樣理解,中臺是為系統數據的實時交換和共享服務的,而平臺重點是為大數據分析服務的!這樣的理解其實就是把平臺中的系統集成提取岀了。這可能更多的是商務需要吧??