記者30日獲悉,,“諦聽”地震波大模型日前在國家超級計(jì)算成都中心發(fā)布,,將于2024年底公測,。據(jù)介紹,這是全球首個(gè)億級參數(shù)量的專業(yè)地震數(shù)據(jù)處理大模型,。
2023年9月,,由成都產(chǎn)業(yè)集團(tuán)、成都天投集團(tuán)聯(lián)合運(yùn)營的國家超級計(jì)算成都中心,,與中國地震局地球物理研究所共建“地震大模型創(chuàng)新應(yīng)用聯(lián)合實(shí)驗(yàn)室”,。隨后,中心與清華大學(xué),、中國科學(xué)院地質(zhì)與地球物理研究所的研究團(tuán)隊(duì)一同合作,,啟動“諦聽”地震波大模型的訓(xùn)練。同時(shí),,大模型依托的“諦聽”地震學(xué)數(shù)據(jù)集也落戶該實(shí)驗(yàn)室,。此數(shù)據(jù)集是國內(nèi)首個(gè),同時(shí)也是目前全球最大規(guī)模,、最多樣本類型,、標(biāo)注最為全面的地震學(xué)專業(yè)AI訓(xùn)練數(shù)據(jù)集之一。
成都數(shù)據(jù)集團(tuán)黨委副書記,、超算運(yùn)營公司董事長郭黎表示,,“諦聽”系列地震波大模型已有階段性成果,目前已成為全球第一個(gè)億級參數(shù)量的地震波大模型并具備投入使用的條件,。同時(shí),,十億參數(shù)量級的版本預(yù)計(jì)2024年8月完成預(yù)訓(xùn)練,將進(jìn)一步為新時(shí)代防震減災(zāi)事業(yè)現(xiàn)代化提供科技支撐,。
“諦聽”如何為防震減災(zāi)事業(yè)現(xiàn)代化提供科技支撐,?
“‘諦聽’大模型依托中國地震觀測網(wǎng)的海量數(shù)據(jù),,通過人工智能技術(shù),已顯著提升地震信號識別的準(zhǔn)確率和速度,?!敝袊卣鹁值厍蛭锢硌芯克彼L陳石認(rèn)為,長期來看,,地震學(xué)是一門觀測科學(xué),,重大的突破往往來自對觀測數(shù)據(jù)的深刻理解。目前,,傳統(tǒng)方法和中小模型均無法充分利用千,、萬TB(百萬兆字節(jié))級別的地震觀測數(shù)據(jù),而這些數(shù)據(jù)蘊(yùn)含許多重要的地震學(xué)問題,,只有大模型才能深入挖掘這些“寶藏”,。短期來看,“諦聽”地震波大模型將應(yīng)用于地震信號識別,、地震活動監(jiān)測,、大地震快速響應(yīng)等領(lǐng)域。
“‘諦聽’地震波大模型的發(fā)布對于突破中小地震波模型性能瓶頸,、提高地震大數(shù)據(jù)智能處理能力和信息挖掘水平具有重要意義,。”國家超級計(jì)算成都中心常務(wù)副主任王建波表示,,中心的算力支持是“諦聽”地震波大模型得以開發(fā)的基礎(chǔ),,相比過去的地震波小模型,“諦聽”大模型的訓(xùn)練數(shù)據(jù)量和參數(shù)量都增加了兩個(gè)量級以上,,因此對算力的需求也呈現(xiàn)大幅增長,。為此,中心采用國內(nèi)先進(jìn)技術(shù)為大模型開發(fā)提供支撐,,同時(shí)在研發(fā)過程中為科研團(tuán)隊(duì)的代碼運(yùn)行效率優(yōu)化提供了關(guān)鍵技術(shù)支持,,使得“諦聽”的研發(fā)過程更加順暢高效。未來,,該模型的應(yīng)用場景還有望延伸到礦震監(jiān)測,、頁巖氣開采、城市地下空間結(jié)構(gòu)探測,、海底地震監(jiān)測等多個(gè)領(lǐng)域,。(劉俠 記者滕繼濮 實(shí)習(xí)生吳曉靜)
責(zé)任編輯:王彥赟