国产aV无码片毛片一级韩国,午夜草草视频在线播放,中国人妻少妇精品一区二区,在线视频播放一区二区三区,一区二区三区久久av,日韩人妻系列中文字幕,国产av综合av亚洲av,欧美多人啊啊啊啊污污视频,国产大鸡巴插女生b视频

教育裝備采購(gòu)網(wǎng)
第八屆圖書(shū)館論壇 校體購(gòu)2

HPC融合AI,為什么這家上海高校做到了?

教育裝備采購(gòu)網(wǎng) 2019-07-16 14:07 圍觀1011次

  ? 近年來(lái),圍繞 AI 技術(shù)的國(guó)際競(jìng)爭(zhēng)正愈演愈烈。為了搶占先機(jī),設(shè)立 AI 專業(yè)成了各大高校順應(yīng)科技發(fā)展趨勢(shì)的重大舉措。為幫助高校推進(jìn) AI 技術(shù)領(lǐng)域的人才培養(yǎng)、研究開(kāi)發(fā)和成果轉(zhuǎn)化,才云科技打造定制化 HPC 集群平臺(tái)管理系統(tǒng),支持國(guó)家科技建設(shè)。

  某高校是由上海市人民政府和中國(guó)科學(xué)院共同舉辦的一所“小規(guī)模、高水平、國(guó)際化的研究型、創(chuàng)新型”大學(xué)。它借鑒了世界一流理工科大學(xué)的發(fā)展經(jīng)驗(yàn),從理工科入手培養(yǎng)各科專業(yè)人才,推進(jìn)研究成果在各行業(yè)落地。

  作為人工智能高校聯(lián)盟的倡導(dǎo)者之一,為更好地進(jìn)行 AI 學(xué)科建設(shè),進(jìn)一步鞏固學(xué)校在計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、深度學(xué)習(xí)、圖形學(xué)等領(lǐng)域的優(yōu)勢(shì),該高校聯(lián)手才云科技,為高性能計(jì)算(HPC)集群打造了一套平臺(tái)管理系統(tǒng),為提升集群計(jì)算效率、提高資源利用率、降低成本提供了極大支持。

   AI 學(xué)科建設(shè)需從 HPC 起步

  高校 HPC 集群是一種為學(xué)校密集型科研任務(wù)提供高性能計(jì)算支持的計(jì)算硬件,通常計(jì)算速度要達(dá)到每秒萬(wàn)億次級(jí)。作為科學(xué)研究不可或缺的計(jì)算工具,它在研究領(lǐng)域有著廣泛的應(yīng)用和巨大的影響力,也是衡量一所學(xué)??蒲袑?shí)力的重要指標(biāo)之一。

  自建校以來(lái),該高校依托高性能 HPC 集群,已在物理、化學(xué)、生命科學(xué)等領(lǐng)域?qū)崿F(xiàn)巨大科研進(jìn)展。而隨著 AI 研究的逐步展開(kāi),考慮到 AI 研究離不開(kāi)龐大的數(shù)據(jù)、精確的數(shù)據(jù)標(biāo)記和數(shù)十倍于一般科研項(xiàng)目的計(jì)算量,學(xué)校對(duì)用 HPC 集群支撐深度學(xué)習(xí)任務(wù),促進(jìn) AI 與 HPC 的融合提出了更高的要求。

  同時(shí),為了承擔(dān)更多國(guó)家級(jí)、地級(jí)科研課題,加快進(jìn)行學(xué)科建設(shè)和人才培養(yǎng),一些可預(yù)見(jiàn)的長(zhǎng)期問(wèn)題,如計(jì)算資源部署、使用現(xiàn)狀與日益增長(zhǎng)的科研任務(wù)需求之間的矛盾也亟需得到重視:

  物理資源管理零散。該高校在浦東浦西建有兩個(gè)數(shù)據(jù)中心,各數(shù)據(jù)中心內(nèi)的機(jī)器配置不一,共有 8 個(gè)集群、124 臺(tái)服務(wù)器、近 300 塊 GPU、大量 CPU 及內(nèi)存資源。雖然規(guī)模龐大,但這些資源缺乏有效的統(tǒng)一管理工具,存在計(jì)算資源過(guò)于分散、缺乏高效統(tǒng)籌機(jī)制的問(wèn)題;

  資源申請(qǐng)不規(guī)范。為滿足各學(xué)科科研需求,學(xué)校一般都有針對(duì) HPC 集群使用的完善申請(qǐng)、使用手冊(cè)。但該高校的資源申請(qǐng)流程仍過(guò)于繁瑣,缺乏自動(dòng)化的資源申請(qǐng)、分配工具。當(dāng)申請(qǐng)人提交申請(qǐng)后,計(jì)算資源需要依靠人工手動(dòng)分配,無(wú)法實(shí)現(xiàn)即租即用,整個(gè)過(guò)程耗時(shí)耗力;

  資源利用率低。該高校的服務(wù)器資源只能以整機(jī)的方式分配給各教研室,例如一臺(tái)服務(wù)器有 6 塊 GPU,當(dāng)某個(gè) AI 任務(wù)只需使用 5 塊 GPU 時(shí),申請(qǐng)人會(huì)被分到一整臺(tái)服務(wù)器,如此分配方式往往導(dǎo)致資源使用不飽和,造成浪費(fèi);

  資源回收困難。任務(wù)結(jié)束后,由于需要人工手動(dòng)清理機(jī)器遺留數(shù)據(jù),該高校的 HPC 集群也存在資源回收不及時(shí)、機(jī)器時(shí)常處于閑置狀態(tài)的問(wèn)題。

   才云:構(gòu)建 HPC 集群平臺(tái)管理系統(tǒng)

  針對(duì)該高校 HPC 集群的使用現(xiàn)狀,才云科技基于自研智能容器云平臺(tái) Caicloud Compass 和人工智能云平臺(tái) Caicloud Clever,打造了一套定制化的 HPC 集群平臺(tái)管理系統(tǒng)。

  新系統(tǒng)實(shí)現(xiàn)了計(jì)算資源的池化管理和機(jī)器資源的邏輯化分配,并依靠對(duì)底層高性能計(jì)算資源的科學(xué)管理,大幅提升了深度學(xué)習(xí)項(xiàng)目的分布式訓(xùn)練能力。

   助力學(xué)科建設(shè),創(chuàng)建深度學(xué)習(xí)平臺(tái)方案

  為了讓高校 HPC 更好地承擔(dān) AI 科研項(xiàng)目,才云科技在 HPC 集群平臺(tái)管理系統(tǒng)中集成了深度學(xué)習(xí)平臺(tái)方案,能為高校數(shù)據(jù)管理、模型構(gòu)建、模型上線提供一站式便捷服務(wù)。

  具備深度學(xué)習(xí)全流程工程化管理能力。HPC 集群平臺(tái)管理系統(tǒng)集數(shù)據(jù)導(dǎo)入、數(shù)據(jù)處理、模型開(kāi)發(fā)、模型訓(xùn)練、服務(wù)上線、模型管理等功能于一體,可有效支持語(yǔ)義分析、仿真模擬、圖形渲染等深度學(xué)習(xí)科研項(xiàng)目,幫助高校簡(jiǎn)化項(xiàng)目流程、加速項(xiàng)目開(kāi)展進(jìn)度。

  集成 infinib網(wǎng)絡(luò)。infinib網(wǎng)絡(luò)是用于 HPC 的計(jì)算機(jī)網(wǎng)絡(luò)通信標(biāo)準(zhǔn),具有極高吞吐量和極低延遲的特點(diǎn),既可用作服務(wù)器與存儲(chǔ)系統(tǒng)之間的直接或交換互連,也可用于存儲(chǔ)系統(tǒng)之間的互連??紤]到深度學(xué)習(xí)對(duì)計(jì)算速度的苛刻要求,HPC 集群平臺(tái)管理系統(tǒng)集成 infinib網(wǎng)絡(luò),為 AI 項(xiàng)目運(yùn)算速度提供保障。

  集成并行存儲(chǔ)系統(tǒng)。在 HPC 中,傳統(tǒng) NFS 存儲(chǔ)在集群不斷增加時(shí)易出現(xiàn)存儲(chǔ)瓶頸,而才云科技集成的并行存儲(chǔ)則可以把后端的多套存儲(chǔ)陣列統(tǒng)一成一個(gè)大的存儲(chǔ),不僅保證了可靠性,讀寫(xiě)性能和帶寬也更出色,幫助高校顯著提高運(yùn)算效率。

  構(gòu)建資源池,統(tǒng)一管理物理資源

  為了破解該高校物理資源分散兩地的難題,才云科技的 HPC 集群平臺(tái)管理系統(tǒng)將兩個(gè)中心的 124 臺(tái)服務(wù)器資源統(tǒng)一納管至系統(tǒng)環(huán)境內(nèi),實(shí)現(xiàn)了計(jì)算資源的平臺(tái)級(jí)統(tǒng)籌管理。

  系統(tǒng)可以依據(jù)主機(jī)生命周期、狀態(tài)、性能對(duì)計(jì)算資源做細(xì)粒度劃分,提供 CPU、GPU、內(nèi)存、網(wǎng)絡(luò)負(fù)載、任務(wù)運(yùn)行數(shù)量等指標(biāo)的可視化監(jiān)控及靈活高效的服務(wù)器上下線功能,幫助高校大幅提升資源利用率,確保所有資源的安全可用。

  細(xì)化申請(qǐng)流程,自動(dòng)回收資源

  才云科技的 HPC 集群平臺(tái)管理系統(tǒng)具備用戶權(quán)限管理體系,實(shí)現(xiàn)了資源按系統(tǒng)管理員、教研室管理員、學(xué)生(教師)三級(jí)用戶劃分。

  全量集群資源由系統(tǒng)管理員統(tǒng)一管理,各教研室管理員先向系統(tǒng)管理員申請(qǐng)教研室所需資源,再按需分配給學(xué)生、教師。任務(wù)結(jié)束后,系統(tǒng)管理員只需在 HPC 資源管理可視化界面調(diào)低額度或關(guān)閉教研室賬號(hào),即可完成資源回收,資源申請(qǐng)回收效率大幅提升。

  提供自動(dòng)化運(yùn)維能力,提高資源利用率

  為了提升 HPC 集群管理的自動(dòng)化水平,才云科技 HPC 集群平臺(tái)管理系統(tǒng)提供應(yīng)用、AI 模型任務(wù)開(kāi)發(fā)運(yùn)維過(guò)程中的一些常見(jiàn)管理能力,如用戶環(huán)境隔離管理、任務(wù)生命周期管理、容器生命周期管理、代碼開(kāi)發(fā)管理、存儲(chǔ)管理、鏡像管理、監(jiān)控管理、日志管理、配置管理等,大大減輕工作人員的工作負(fù)擔(dān)。

   展望未來(lái)

  自上線后,才云科技的 HPC 集群平臺(tái)管理系統(tǒng)為該高校降低人力成本、減少浪費(fèi)、提高 HPC 集群資源利用率提供著巨大支持。在該系統(tǒng)的助力下,該高校的 AI 科研成果也在國(guó)際上高光頻現(xiàn),推動(dòng)上海成為全國(guó)的 AI 科研高地。

  更可喜的是,和才云科技的合作還讓該高??吹搅死米越ㄔ崎_(kāi)拓教育行業(yè)公有云的前景。為了更好地發(fā)揮數(shù)據(jù)中心的價(jià)值,該高??蓪⑹罴倨陂g閑置的計(jì)算資源以公有云的形式對(duì)外提供 ,打造人工智能云,幫助更多高校和企業(yè)加速 AI 研發(fā)和成果落地。

  根據(jù)國(guó)務(wù)院 2017 年發(fā)布的人工智能發(fā)展規(guī)劃,到 2020 年,中國(guó)人工智能總體技術(shù)和應(yīng)用與世界先進(jìn)水平同步,人工智能核心產(chǎn)業(yè)規(guī)模超過(guò) 1500 億元,帶動(dòng)相關(guān)產(chǎn)業(yè)規(guī)模超過(guò) 1 萬(wàn)億元。在當(dāng)前這個(gè)實(shí)現(xiàn) AI 加速發(fā)展的絕佳時(shí)刻,才云科技希望能幫助更多高校抓住機(jī)遇,艱苦奮斗,只爭(zhēng)朝夕,助力中國(guó) AI 贏在起跑線。

來(lái)源:才云科技 責(zé)任編輯:陽(yáng)光 我要投稿
AI
校體購(gòu)終極頁(yè)

相關(guān)閱讀

版權(quán)與免責(zé)聲明:

① 凡本網(wǎng)注明"來(lái)源:教育裝備采購(gòu)網(wǎng)"的所有作品,版權(quán)均屬于教育裝備采購(gòu)網(wǎng),未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用。已獲本網(wǎng)授權(quán)的作品,應(yīng)在授權(quán)范圍內(nèi)使用,并注明"來(lái)源:教育裝備采購(gòu)網(wǎng)"。違者本網(wǎng)將追究相關(guān)法律責(zé)任。

② 本網(wǎng)凡注明"來(lái)源:XXX(非本網(wǎng))"的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),且不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)下載使用,必須保留本網(wǎng)注明的"稿件來(lái)源",并自負(fù)版權(quán)等法律責(zé)任。

③ 如涉及作品內(nèi)容、版權(quán)等問(wèn)題,請(qǐng)?jiān)谧髌钒l(fā)表之日起兩周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

校體購(gòu)產(chǎn)品