日韩欧美视频一区二区在线观看-日韩欧美视频在线-日韩欧美视频在线播放-日韩欧美视频在线一区二区-日韩欧美手机在线-日韩欧美天堂

電話咨詢 在線咨詢 產(chǎn)品定制
電話咨詢 在線咨詢 產(chǎn)品定制
010-68321050

《智能計算中心創(chuàng)新發(fā)展指南》發(fā)布:提升算力利用率要做“加法”,優(yōu)化算力調(diào)度要做“減法”!

五度易鏈 2023-08-01 3621 0

專屬客服號

微信訂閱號

大數(shù)據(jù)治理

全面提升數(shù)據(jù)價值

賦能業(yè)務提質(zhì)增效

 “實際上,算力之困已經(jīng)爆發(fā)了。”張云泉坦言,國內(nèi)目前大模型存在技術(shù)水平不高、同質(zhì)化等問題,主要是算力層面和國外差距比較大,沒有算力基礎,后面算法等都無法進一步發(fā)展。這些大模型企業(yè)不是不愿意盡快更新迭代,而是算力不夠用,只能精打細算。

  伴隨國內(nèi)“百模大戰(zhàn)”愈演愈烈,AI產(chǎn)業(yè)化前夜似乎已在不知不覺中來臨。海量數(shù)據(jù)爆發(fā),計算量指數(shù)級增長,傳統(tǒng)基礎設施架構(gòu)下的算力早已無法滿足模型時代的算力需求。據(jù)OpenAI測算,全球AI訓練所用的計算量呈現(xiàn)指數(shù)級增長,平均每3.43個月便會增長一倍,目前計算量已擴大30萬倍,遠超算力增長速度。國家信息中心聯(lián)合浪潮信息發(fā)布的《智能計算中心創(chuàng)新發(fā)展指南》顯示,當前我國超過30個城市正在建設或提出建設智算中心,但仍然無法滿足相關(guān)的需求。智能算力的供需矛盾日益凸顯,由AI大模型引發(fā)系列連鎖反應正在讓科技圈從“狂熱”走向“冷靜”。

  算力之困已經(jīng)爆發(fā)了?

  打造一個大模型究竟需要多少算力?公開數(shù)據(jù)顯示,ChatGPT初始所需的算力就是1萬塊英偉達A100(一種AI芯片),價格大約是1億美元。后續(xù)的調(diào)優(yōu)訓練每天算力消耗大概是3640PFLOPS,需要7至8個算力達到500PFLOPS的數(shù)據(jù)中心支持,建設成本約為三四十億元。

  “大模型的用戶量、訪問速度、網(wǎng)絡帶寬、訓練模式等都會影響到其算力需求的大小。”中國科學院計算技術(shù)研究所研究員張云泉在接受《中國電子報》記者采訪時表示,“要訓練一個中國版的ChatGPT,首先要部署價值至少1億美元的硬件設施,還要準備大筆訓練調(diào)優(yōu)的費用。”

  騰訊云異構(gòu)計算產(chǎn)品負責人宋丹丹對《中國電子報》記者介紹稱,大模型對算力的要求分為訓練和推理兩個階段。訓練需要短時間內(nèi)的并行算力,而且要在短時間內(nèi)能夠做到交付,對算力的量、算力的穩(wěn)定性和性能、彈性擴縮容能力有高要求。進入推理階段,對于單位算力的性價比、成本、算力所處的位置、端應用服務是否能夠快速連接等要求比較高。這就要求企業(yè)具備海量的可擴縮容的高性能算力,并且這些算力能夠穩(wěn)定交付。

騰訊云自研的星星海服務器在云上支持AI企業(yè)的大模型訓練需求

  近日,廣發(fā)證券分析師對國內(nèi)AI大模型的訓練和推理階段算力需求,以及相應的成本進行了測算。結(jié)果顯示,在暫不考慮軟件層面算法優(yōu)化帶來的模型消耗算力成本下降的前提下,國內(nèi)大模型在訓練與推理階段或?qū)a(chǎn)生相當于1.1萬臺或3.8萬臺(樂觀假設下)高端AI服務器的算力需求,以單片A100售價10萬元、AI加速卡價值量占服務器整機約70%計算,則對應約126億元或434億元增量AI服務器市場規(guī)模。

  “實際上,算力之困已經(jīng)爆發(fā)了。”張云泉坦言,國內(nèi)目前大模型存在技術(shù)水平不高、同質(zhì)化等問題,主要是算力層面和國外差距比較大,沒有算力基礎,后面算法等都無法進一步發(fā)展。這些大模型企業(yè)不是不愿意盡快更新迭代,而是算力不夠用,只能精打細算。

  浪潮云首席技術(shù)官孫思清在接受《中國電子報》記者采訪時表示,從通用算力到智能算力,算力需求的變化其實與場景需求密切相關(guān)。伴隨模型參數(shù)規(guī)模越來越大,智能化程度越來越高,對并行計算能力以及包括存儲、網(wǎng)絡等在內(nèi)的底層基礎硬件能力,以及擴展性、靈活性的要求也越高。此外,算力還要與大模型本身進行更好的適配。在這樣的形勢下,智能算力需求激增。

  記者了解到,近幾個月騰訊云智算商機相比去年同期增長10倍以上。另據(jù)一些服務器廠商透露,目前智算服務器出貨量超過通用CPU了。不過,孫思清表示,未來,隨著軟硬件升級和大模型核心技術(shù)的提升,同等規(guī)模的大模型所需算力也許會逐漸減少。

  提升算力利用率要做“加法”

  隨著AI大模型同雨后春筍一般層出不窮,人工智能應用加速向各行各業(yè)滲透,新一輪算力革命加速啟動。工信部最新數(shù)據(jù)顯示,中國算力總規(guī)模居全球第二,保持30%左右的年增長率。新增算力設施中,智能算力占比已超過50%。在多個權(quán)威市場分析機構(gòu)的排名中,美國和中國都屬于算力的領(lǐng)跑者,主要差距在于計算效率和應用水平。

  “我國算力的利用率只有30%。”中國工程院院士鄔賀銓坦言。他認為,算力利用率低一方面是因為雖然算力有了,但是存儲沒有跟上,算力不能得到很好發(fā)揮,建議進行數(shù)據(jù)優(yōu)化;另一方面是因為算力使用門檻相對較高,只有極少數(shù)企業(yè)能做,建議降低門檻,讓算力使用更簡單便捷。

  提升算力供給能力是重中之重。孫思清表示,硬件層面,CPU、GPU等核心硬件的性能越來越高,將有效提升算力供給能力;軟件層面,模型算法和計算框架的優(yōu)化,也能緩解一定的算力壓力,減少對算力的依賴。

浪潮云基于運維安全大模型建立新型OpsCenter服務交付體

  “不同于超算需要的64位雙精度浮點運算,智能算力多為32及以下的低精度運算,它是分階段的,可以通過硬件加速來實現(xiàn)算力提升。”張云泉表示。比如,隨著數(shù)據(jù)量的增長和計算任務的復雜化,CPU、GPU需要具備更高的計算和處理能力,存儲器需要具備更大的容量和更快的讀寫速度。同時,算力提升還需要更大的網(wǎng)絡帶寬、速度更快的網(wǎng)絡設備,從而更快地完成大規(guī)模數(shù)據(jù)傳輸和處理。

  “智算即異構(gòu)計算。相對于只用CPU的通用計算,在服務器里CPU+GPU就是異構(gòu)計算。背后的邏輯,是讓最適合的專用硬件去做最適合的事。”宋丹丹表示,“對于整個算力的優(yōu)化是分層級解決的。除了計算資源自身的架構(gòu)和性能提升,也就是卡的迭代外,我們會在虛擬化層,通過GPU虛擬化或者計算池化等等一系列的技術(shù),會把算力做更多的多機多卡互聯(lián),然后把它以云服務、容器、Serverless或者實例的模式更靈活地對外使用。在平臺層,通過任務流的模式,以深入上層服務的方式進一步優(yōu)化計算效率。”

  優(yōu)化算力調(diào)度要做“減法”

  如果能讓復雜的算力資源匹配與調(diào)度過程變得簡單化,無疑會實現(xiàn)事半功倍的效果。有觀點認為,公有云可以更大程度的調(diào)度多元算力,讓算力資源的調(diào)配變得更快速、更簡單、更便捷。

  日前,復旦大學率先選擇將智能計算平臺CFFF部署在公有云上。據(jù)復旦大學浩清教授、人工智能創(chuàng)新與產(chǎn)業(yè)研究院院長漆遠透露,有賴于公共云模式,跑在CFFF平臺上的項目可享受到超千卡并行的智能算力,千卡并行的有效算力達到行業(yè)領(lǐng)先的92%,可拓展性達到萬卡,萬卡并行有效算力也可達90%。

  中國工程院院士、阿里云創(chuàng)始人王堅指出,從計算到智算,公共云提供的是像電一樣的計算服務,把算力基礎設施部署在公共云上將加速推動產(chǎn)業(yè)步入開放發(fā)展的新階段。在他看來,AI大模型的訓練和運營需要集約化、在線的算力基礎設施。集約化的算力基礎設施是基礎支撐,要求更高的計算并行性、更高的計算效率、更低的計算成本,并且要求適配各類專用計算芯片。在線化對算力提出更高要求,從模型訓練和應用看,需要形成“用戶膨脹、使用反饋、模型進化”的飛輪效應,海量用戶在線使用和大規(guī)模API調(diào)用集成等都需要在線化的算力資源。這種集約化、在線化的需求,與公共云集中建設運維、彈性伸縮、按需服務的商業(yè)模式不謀而合。

  “云是大模型最好的承載方式,也是訓練和應用大模型的最佳平臺。”宋丹丹指出,一方面,云上具備領(lǐng)先的軟硬件架構(gòu)、面向未來的技術(shù)架構(gòu)和研發(fā)體系。對AI企業(yè)而言,從本地搭建服務器架構(gòu)可能不是一個合適的選擇。借助云上豐富的能力和產(chǎn)品,如云上的算力、網(wǎng)絡、向量數(shù)據(jù)庫,企業(yè)可以聚焦于大模型研發(fā)本身,業(yè)務開發(fā)的敏捷度也能進一步提升。另一方面,打造大模型需要的算力規(guī)模,對企業(yè)現(xiàn)金流的挑戰(zhàn)很大。云上的算力形式,可以根據(jù)用戶需求靈活分配計算資源,同時也提升了大模型的訓練和推理效率。

  孫思清認為,公有云集約化的特點有助于算力共享模式的實現(xiàn)。大模型的訓練并不是一直滿負荷進行的,空閑的時候,可以利用云的模式將算力池化,與其他有算力需求的企業(yè)共享。但同時他也指出,現(xiàn)實操作起來存在困難,數(shù)據(jù)歸屬、隱私保護、合規(guī)性等問題都需要考慮。

  他表示,算力可以當作“水電”來用,但數(shù)據(jù)不可以。“水電”能動,但“水廠”“電廠”不能動,分布式算力并不能適用所有場景。此外,算力互聯(lián)還需建立標準化的運營體系,算力如何計量、如何付費、如何結(jié)算都需要探討。

  張云泉表示,具體問題要具體分析,不能一概而論。幾十億參數(shù)規(guī)模的大模型放在云上可以,幾百億、上千億規(guī)模的大模型肯定不行。中等規(guī)模以下的智算中心可以部署在公有云上,但大規(guī)模的智算中心如果部署在公有云上,網(wǎng)絡延遲會很大,難以支撐高端計算。另外,運營商也會考慮到用云成本以及上云后是否會被云廠商“鎖定”等問題。

  他認為,優(yōu)化算力調(diào)度不能光靠算力網(wǎng)絡的互聯(lián)互通來解決問題。首先要盡快推進接口協(xié)議,定義標準、建立標準;其次要優(yōu)化算力調(diào)度管理軟件,同時建設安全體系;此外,要選擇成熟芯片和生態(tài)完善的技術(shù)路線,這樣智算中心用起來效率才能達到比較高的水平。建議組建生態(tài)聯(lián)合體,共同打造1~2個大規(guī)模的智算中心,協(xié)同訓練少數(shù)幾個通用大模型,共享算力資源。”

  “未來,大模型將走向相對開放的生態(tài),開源是一個重要趨勢。”孫思清說道。他建議,政府層面應做好算力資源的統(tǒng)籌,重點聚焦合規(guī)性管控和集約化建設,把握好節(jié)奏,避免“一窩蜂”導致大量算力的浪費。企業(yè)層面應持續(xù)加打技術(shù)創(chuàng)新與場景實踐力度,分工合作,協(xié)同發(fā)展。

  作者:宋婧  來源:中國電子報、電子信息產(chǎn)業(yè)網(wǎng)

本文為本網(wǎng)轉(zhuǎn)載,出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其內(nèi)容的真實性,如涉及侵權(quán),請權(quán)利人與本站聯(lián)系,本站經(jīng)核實后予以修改或刪除。

產(chǎn)業(yè)專題

申請產(chǎn)品定制

請完善以下信息,我們的顧問會在1個工作日內(nèi)與您聯(lián)系,為您安排產(chǎn)品定制服務

  • *姓名

  • *手機號

  • *驗證碼

    獲取驗證碼
    獲取驗證碼
  • *您的郵箱

  • *政府/園區(qū)/機構(gòu)/企業(yè)名稱

  • 您的職務

  • 備注

主站蜘蛛池模板: 日夜操在线视频 | 在线视频一区二区三区 | 四虎国产成人永久精品免费 | 午夜在线观看免费影院 | 亚洲国产精品一区二区首页 | 欧美视频手机在线 | 色视频免费版高清在线观看 | 亚洲精品国产第1页 | 日本强日本不卡一 | 亚洲不卡视频在线观看 | 久久99精品久久久久久噜噜 | 亚洲欧美成aⅴ人在线观看 亚洲欧美国产精品 | 日本成人久久 | 手机看片日韩高清国产欧美 | 国产一区二区三区四区免费观看 | 国产成人高清亚洲一区久久 | 日韩精品免费一级视频 | 欧美黄色一级在线 | 国产成人精品久久 | 免费在线观看日本 | 人人插人人干 | 日韩成人精品视频 | 国产日韩在线 | 日本高清不卡一区久久精品 | 国产成人精品日本亚洲网址 | 午夜精品九九九九99蜜桃 | 中文字幕色视频 | 亚洲伊人色综合网站小说 | 日本在线视频网 | 色老头免费视频精品三区 | 国产日韩欧美中文字幕 | 国产精品一区二区三区免费 | 亚洲免费视频网址 | 日韩三级久久 | 精品欧美一区二区三区在线 | 亚洲精品九色在线网站 | 国产夜色| 国产午夜精品不卡观看 | 99精品视频看国产啪视频 | 国产成人综合精品 | 成人免费va视频 |