国产aV无码片毛片一级韩国,午夜草草视频在线播放,中国人妻少妇精品一区二区,在线视频播放一区二区三区,一区二区三区久久av,日韩人妻系列中文字幕,国产av综合av亚洲av,欧美多人啊啊啊啊污污视频,国产大鸡巴插女生b视频

教育裝備采購網(wǎng)
第八屆圖書館論壇 校體購2

瑞金病理大模型是怎樣練成的

教育裝備采購網(wǎng) 2025-04-08 16:35 圍觀1306次

  華為DCS AI解決方案,將助推AI在不同的醫(yī)院加速落地。

  2025年2月18日,上海交通大學(xué)醫(yī)學(xué)院附屬瑞金醫(yī)院(以下簡稱:瑞金醫(yī)院)正式發(fā)布瑞智病理大模型RuiPath,一時吸引醫(yī)學(xué)界目光。RuiPath覆蓋了中國每年全癌種發(fā)病人數(shù)90%的常見癌種,不僅需要融合多模態(tài)數(shù)據(jù),還要結(jié)合人群的疾病特征,從而為病理醫(yī)生提供更精準(zhǔn)、更高效的輔助診斷支持。

  “對一家醫(yī)院來講,真正的堰塞湖、真正的堵點是圖像分析?!?span style="font-weight: 600;">瑞金醫(yī)院院長寧光院士說。

  在病理診斷領(lǐng)域,AI應(yīng)用將有效緩解我國病理醫(yī)生短缺的現(xiàn)狀,顯著提升病理切片檢查效率和診斷準(zhǔn)確率,為臨床治療提供更精準(zhǔn)的決策支持。然而,要訓(xùn)練專業(yè)權(quán)威的醫(yī)學(xué)大模型,并非一日之功。

瑞金病理大模型是怎樣練成的

病理大模型為何僅用兩個月訓(xùn)練上線?

  2024年11月底,華為數(shù)據(jù)存儲產(chǎn)品線AI解決方案首席專家王帥所在團(tuán)隊接到任務(wù)——與瑞金醫(yī)院共同打造下一代病理多模態(tài)大模型。王帥帶上華為DCS AI解決方案來到現(xiàn)場,與醫(yī)院一起研發(fā),僅兩個月就完成大模型訓(xùn)練并上線。

  然而,病理大模型在建立過程中,需要克服四大痛點:

  第一,要提高病理數(shù)字化程度,數(shù)字切片的積累是構(gòu)建病理大模型的基石。

  第二,數(shù)據(jù)質(zhì)量與共享難題。傳統(tǒng)病理的物理切片質(zhì)量本身就存在一定的差異,而在切片數(shù)字化過程當(dāng)中,由于國內(nèi)外掃描儀種類繁多,加之WSI(Whole Slide Images,全視野數(shù)字切片)圖像格式標(biāo)準(zhǔn)目前也不統(tǒng)一,從而形成數(shù)據(jù)孤島。

  第三,病理數(shù)據(jù)通?!昂艽蟆?。一張WSI病理圖像大小已經(jīng)接近一部高清電影,醫(yī)院每年新增病理數(shù)據(jù)達(dá)到PB級,面臨快速訪問和存儲成本壓力。

  第四,病理模型訓(xùn)練所需算力高。由于GPU的GB級顯存和病理數(shù)據(jù)PB級訓(xùn)練數(shù)據(jù)集之間的矛盾,醫(yī)院往往算力不足,難以高效開展海量數(shù)據(jù)集的訓(xùn)練。

  關(guān)于前兩個難點,瑞金醫(yī)院通過數(shù)年來建設(shè)“數(shù)字化智慧病理科”,矛盾已經(jīng)逐步化解。一方面,2021年,瑞金醫(yī)院“數(shù)字化智慧病理科”建設(shè)立項,開啟病理的數(shù)字化、智能化之路,累積了數(shù)字病理切片數(shù)據(jù)庫。另一方面,為解決不同格式病理數(shù)字切片導(dǎo)致的數(shù)據(jù)孤島,瑞金醫(yī)院從2023年開始,啟動研制針對病理專用的CSP格式,目前已經(jīng)納入上海市地方標(biāo)準(zhǔn)以及國家級團(tuán)體標(biāo)準(zhǔn)相關(guān)項目立項。

  針對后兩個新挑戰(zhàn),瑞金醫(yī)院聯(lián)合華為,創(chuàng)新性實施數(shù)字化病理存儲方案,實現(xiàn)了全院毫秒級無卡頓病理閱片。通過存算協(xié)同模式,借助端到端的AI工具鏈(Model Engine),縮短大模型上線時間。

  因此,上述痛點的克服,一方面得益于瑞金醫(yī)院4年來持續(xù)推進(jìn)“數(shù)字化智慧病理科”建設(shè),另一方面則與支撐大模型訓(xùn)練的華為DCS AI解決方案密不可分。

華為DCS AI解決方案如何掃清障礙?

  “病理,對我來說是一個非常陌生的領(lǐng)域。但是,它所面臨的行業(yè)痛點,卻又是十分熟悉的。”王帥坦言。

  第一,數(shù)據(jù)工程的問題。病理科醫(yī)生所見的每一張病理切片都是GB級,當(dāng)處理上百萬張切片時,也即總共PB級的數(shù)據(jù),同時還有數(shù)十萬份的病理報告需要進(jìn)行時空對齊?!叭绻褂脗鹘y(tǒng)的數(shù)據(jù)工程手段,使用一個個Python腳本、工具和人工標(biāo)注方式處理,效率非常低下,必須革新數(shù)據(jù)工程的手段?!?/p>

  第二,圖像訓(xùn)練、推理成本問題。在做圖像訓(xùn)練時,如果不做任何優(yōu)化,訓(xùn)練一輪就要上萬的GPU hours,而到了推理階段,分析一張完整的40倍鏡下的WSI切片,需要計算上千萬的Token?!斑@樣的AI注定只是一個奢侈品,沒有辦法普惠大眾?!?/p>

  第三,應(yīng)用上線問題。訓(xùn)練出來好的模型,并不代表有了好的應(yīng)用。病理學(xué)診斷應(yīng)當(dāng)結(jié)合患者病史、基因組組學(xué)、分子學(xué)等多模態(tài)數(shù)據(jù),這就要求AI系統(tǒng)能夠開放地對接醫(yī)院內(nèi)部不同科室的不同業(yè)務(wù)信息系統(tǒng),同時能夠靈活地承載不同的業(yè)務(wù)數(shù)據(jù),靈活響應(yīng)用戶需求。

  能有效應(yīng)對上述難題,正是DCS AI解決方案的核心價值所在。華為在數(shù)據(jù)工程上做了大量的革新,降低了80%的數(shù)據(jù)準(zhǔn)備周期。在模型訓(xùn)推上,通過長期存儲、調(diào)度引擎的創(chuàng)新,將資源利用率達(dá)到極致,模型的訓(xùn)練周期也降低了30%,系統(tǒng)的吞吐提升了一倍,同時還打造了一站式的應(yīng)用開發(fā)平臺,讓用戶可以實現(xiàn)低代碼開發(fā)、零代碼運維。

瑞金病理大模型是怎樣練成的

  這些革新具體是怎么實現(xiàn)的?王帥如數(shù)家珍:

  首先,在存儲層面,通過Omni-Dataverse快速建立統(tǒng)一的數(shù)據(jù)視圖,通過簡單配置實現(xiàn)高效的數(shù)據(jù)歸集,以及在不同系統(tǒng)之間的數(shù)據(jù)流轉(zhuǎn)。同時,瑞金醫(yī)院病理圖像采用了統(tǒng)一的CSP格式,壓縮率更高、讀取速度更快,從而避免了圖像多種格式在圖像處理時協(xié)議轉(zhuǎn)換帶來的開銷。

  在數(shù)據(jù)治理階段,華為積累了一批專項行業(yè)數(shù)據(jù)算子,無論是數(shù)據(jù)的去重、特征提取,還是分級工作,都能夠快速找到對應(yīng)的算子進(jìn)行處理,并且基于數(shù)據(jù)平臺可以靈活編排組裝這些算子,進(jìn)一步提升數(shù)據(jù)處理效率。

  華為對病理學(xué)的圖像處理還做了深度優(yōu)化。考慮到病理圖像一般在GB級,如果不經(jīng)過優(yōu)化就去處理百萬級的圖像,需要耗費數(shù)月,甚至超過花費在模型訓(xùn)練上的時間。為此,華為研制了專用的神經(jīng)網(wǎng)絡(luò),實現(xiàn)病理學(xué)圖像的免切分算法,將整個病理學(xué)圖像處理時間從月級壓縮到了天級,極大提升了數(shù)據(jù)的處理效率。

  類似的工作,不一而足。華為DCS AI解決方案,堪比“清道夫”,幫助醫(yī)院掃清大模型落地過程中面臨的數(shù)據(jù)工程處理慢、模型/應(yīng)用對接難、AI系統(tǒng)可用度低等障礙。

落地醫(yī)療AI應(yīng)用為何要重視“數(shù)據(jù)工程”? 

  華為公司副總裁、數(shù)據(jù)存儲產(chǎn)品線總裁周躍峰認(rèn)為,在人工智能的三大要素——“數(shù)據(jù)、算法、算力”中,數(shù)據(jù)的作用越來越重要。

瑞金病理大模型是怎樣練成的

華為公司副總裁、數(shù)據(jù)存儲產(chǎn)品線總裁周躍峰

  事實上,在AI落地過程中,并不是有了算力、算法模型,就能夠一帆風(fēng)順,還要克服很多障礙。

  一是數(shù)據(jù)工程。訓(xùn)練大模型的數(shù)據(jù),一般不是原始數(shù)據(jù),而是要做很多加工處理。這好比要讓學(xué)生能夠獲得知識、獲得成長,教材質(zhì)量非常重要。而打磨教材和課程需要很長的過程。

  二是模型的訓(xùn)練和應(yīng)用的落地。模型在訓(xùn)練過程當(dāng)中,怎樣能夠讓它更好地理解知識,并且能夠更好地讓這些結(jié)果反映到應(yīng)用中去,需要有提示工程等,這個過程同樣漫長而復(fù)雜。

  三是算力基礎(chǔ)設(shè)施成本高。不可能讓每一家醫(yī)院都買一堆算力來實現(xiàn)AI應(yīng)用。今天大部分AI集群系統(tǒng)的利用率不到50%,意味著一半以上的時間都是徒然在消耗電力。

瑞金病理大模型是怎樣練成的

  如何突破這些極限?華為DCS AI解決方案,恰恰為各行各業(yè)落地AI應(yīng)用提供了經(jīng)濟(jì)、高效的部署和訓(xùn)練環(huán)境。在與瑞金醫(yī)院合作的過程中,華為DCS AI解決方案的關(guān)鍵組件Model Engine——AI全數(shù)據(jù)流程、應(yīng)用對接以及模型對接的工具鏈,較好地解決了上述障礙。

  作為歐拉社區(qū)開源的工具鏈,Model Engine能夠大幅提升訓(xùn)推及精調(diào)過程效率,有效降低AI部署和訓(xùn)練成本,加速AI落地。

  周躍峰表示,華為和瑞金醫(yī)院在訓(xùn)練RuiPath大模型的過程中,DCS AI解決方案變得更加成熟。它不僅是硬件,更是一整套開放性的工具鏈,可供更多醫(yī)療行業(yè)集成商使用,助推AI在不同的醫(yī)院加速落地。

  “數(shù)智世界 一觸即達(dá)” 選擇華為,讓您的企業(yè)輕松數(shù)智化。

來源:搜狐 責(zé)任編輯:陽光 我要投稿
校體購終極頁

相關(guān)閱讀

版權(quán)與免責(zé)聲明:

① 凡本網(wǎng)注明"來源:教育裝備采購網(wǎng)"的所有作品,版權(quán)均屬于教育裝備采購網(wǎng),未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用。已獲本網(wǎng)授權(quán)的作品,應(yīng)在授權(quán)范圍內(nèi)使用,并注明"來源:教育裝備采購網(wǎng)"。違者本網(wǎng)將追究相關(guān)法律責(zé)任。

② 本網(wǎng)凡注明"來源:XXX(非本網(wǎng))"的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé),且不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如其他媒體、網(wǎng)站或個人從本網(wǎng)下載使用,必須保留本網(wǎng)注明的"稿件來源",并自負(fù)版權(quán)等法律責(zé)任。

③ 如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起兩周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

校體購產(chǎn)品