中新網(wǎng)上海新聞7月8日電(鄭瑩瑩)7月5日,在2024世界人工智能大會(huì)期間,商湯醫(yī)療聯(lián)合中華醫(yī)學(xué)會(huì)病理學(xué)分會(huì)王哲副主委團(tuán)隊(duì)、清華大學(xué)何永紅教授團(tuán)隊(duì)共同發(fā)布病理大模型PathOrchestra。
病理診斷被稱(chēng)為疾病診斷的“金標(biāo)準(zhǔn)”,但該領(lǐng)域長(zhǎng)期以來(lái)面臨病理醫(yī)生培養(yǎng)周期長(zhǎng)、優(yōu)質(zhì)病理診斷資源分布不均勻等問(wèn)題。人工智能技術(shù)的應(yīng)用讓國(guó)內(nèi)外病理科迎來(lái)“數(shù)智化”轉(zhuǎn)型浪潮,不過(guò)由于數(shù)字病理切片分辨率高、涉及病種多,在“大數(shù)據(jù)+精標(biāo)注”的傳統(tǒng)AI模型訓(xùn)練范式下,想要對(duì)每一種疾病進(jìn)行精標(biāo)注訓(xùn)練難上加難。
“病理圖像具有非常大的多樣性,要借助人工智能技術(shù)開(kāi)展診斷難度極大,因此病理圖像處理也被稱(chēng)為圖像處理中的‘皇冠上的明珠’。病理大模型正是突破數(shù)字病理瓶頸的關(guān)鍵!蓖跽茉诎l(fā)布儀式上表示。
此次發(fā)布的病理大模型PathOrchestra,將視覺(jué)模型和大語(yǔ)言模型結(jié)合,利用近30萬(wàn)張全切片數(shù)字病理圖像(近300TB數(shù)據(jù))數(shù)據(jù)集訓(xùn)練,并融合了文本、視頻等多模態(tài)訓(xùn)練數(shù)據(jù)。通過(guò)對(duì)海量數(shù)據(jù)的自監(jiān)督學(xué)習(xí),無(wú)需大量精標(biāo)注數(shù)據(jù),即可讓模型“觸類(lèi)旁通”學(xué)會(huì)分析各類(lèi)器官病理圖像,該大模型已覆蓋肺、乳腺、肝臟、食管等20余種器官,賦能包括泛癌分類(lèi)、病灶識(shí)別和檢測(cè)、多癌種亞型分類(lèi)、生物標(biāo)志物評(píng)估等在內(nèi)的百余項(xiàng)臨床任務(wù)。
在訓(xùn)練過(guò)程中,研發(fā)團(tuán)隊(duì)還針對(duì)性地增加了食管癌、乳腺癌等中國(guó)發(fā)病率較高的癌癥的數(shù)據(jù),使模型能力更符合中國(guó)臨床實(shí)際需求。(完)
注:請(qǐng)?jiān)谵D(zhuǎn)載文章內(nèi)容時(shí)務(wù)必注明出處!
編輯:鄭瑩瑩