國產(chǎn) GPU 應(yīng)用與實踐培訓(xùn)課程
課程名稱:國產(chǎn) GPU 異構(gòu)計算應(yīng)用開發(fā)與實踐
培訓(xùn)對象
AI 應(yīng)用開發(fā)人員、圖形渲染工程師、信創(chuàng)生態(tài)適配人員及高校師生。
培訓(xùn)目標(biāo)
-
理解國產(chǎn) GPU(如沐曦、天數(shù)、摩爾線程、景嘉微)的架構(gòu)特點。
-
掌握國產(chǎn) GPU 編程模型(如 MXMACA)與 CUDA 的異同。
-
能夠進行國產(chǎn) GPU 平臺的 AI 模型遷移與性能優(yōu)化。
培訓(xùn)內(nèi)容介紹
-
國產(chǎn) GPU 發(fā)展現(xiàn)狀:國產(chǎn) GPU 的市場格局與產(chǎn)品定位;圖形 GPU 與通用計算 GPU(GPGPU)的區(qū)別;主流國產(chǎn) GPU 廠商(沐曦、天數(shù)、摩爾線程、景嘉微)的產(chǎn)品特點。
-
國產(chǎn) GPU 架構(gòu)分析:沐曦 MXMACA 架構(gòu)的核心理念;天數(shù)智芯的通用計算架構(gòu);國產(chǎn) GPU 的內(nèi)存層次與計算核心設(shè)計。
-
國產(chǎn) GPU 編程模型:MXMACA C/C++ 編程接口簡介;國產(chǎn) GPU 的線程層次與內(nèi)存模型;與 CUDA 編程模型的對比。
-
開發(fā)環(huán)境搭建:國產(chǎn) GPU 驅(qū)動與運行時環(huán)境的安裝;編譯工具鏈的配置;模擬器與硬件調(diào)試環(huán)境。
-
內(nèi)核函數(shù)編寫:國產(chǎn) GPU 上的向量加法實現(xiàn);矩陣乘法的移植;原子操作與同步機制。
-
內(nèi)存管理與優(yōu)化:主機與設(shè)備間的數(shù)據(jù)傳輸;共享內(nèi)存的使用;合并訪問優(yōu)化。
-
性能分析工具:國產(chǎn) GPU 的性能分析套件;熱點識別與瓶頸分析;內(nèi)存帶寬與計算吞吐量的監(jiān)測。
-
AI 框架適配:PyTorch 在國產(chǎn) GPU 上的后端適配;TensorFlow 的國產(chǎn) GPU 支持;算子庫(如 cuDNN 對應(yīng)產(chǎn)品)的使用。
-
大模型推理優(yōu)化:國產(chǎn) GPU 上的大模型部署;算子融合與量化支持;模型并行與多卡通信。
-
圖形渲染開發(fā):國產(chǎn) GPU 的 OpenGL/Vulkan 驅(qū)動支持;圖形應(yīng)用的移植與優(yōu)化;國產(chǎn) GPU 在信創(chuàng)終端中的應(yīng)用。
-
生態(tài)建設(shè)與社區(qū):國產(chǎn) GPU 開發(fā)者社區(qū)資源;常見問題的解決方案;國產(chǎn) GPU 與 CUDA 應(yīng)用的二進制遷移工具。
-
綜合實戰(zhàn)項目:在國產(chǎn) GPU 平臺上完成一個圖像分類或目標(biāo)檢測模型的推理部署,并進行性能分析與優(yōu)化。
如果您想學(xué)習(xí)本課程,請
預(yù)約報名
如果沒找到合適的課程或有特殊培訓(xùn)需求,請
訂制培訓(xùn)
除培訓(xùn)外,同時提供相關(guān)技術(shù)咨詢與技術(shù)支持服務(wù),有需求請發(fā)需求表到郵箱soft@info-soft.cn,或致電4007991916
技術(shù)服務(wù)需求表下載請點擊
服務(wù)優(yōu)勢:
豐富專家資源,精準(zhǔn)匹配相關(guān)行業(yè),相關(guān)項目技術(shù)精英,面向用戶實際需求,針對性培訓(xùn)或咨詢,互動式交流,案例教學(xué),精品小班,實際工程項目經(jīng)驗分享,快捷高效,節(jié)省時間與金錢,少走彎路與錯路。
專家力量:
中國科學(xué)院相關(guān)研究所高級研究人員
西門子,TI,vmware,MSC,Ansys,MDI,Mentor, candence,Altium,Atmel 、Freescale,達索,華為等
大型公司高級工程師,項目經(jīng)理,技術(shù)支持專家
中科信軟培訓(xùn)中心,資深專家或講師
大多名牌大學(xué),碩士以上學(xué)歷,相關(guān)學(xué)歷背景專業(yè),理論素養(yǎng)高
多年實際項目實踐,大型復(fù)雜項目實戰(zhàn)案例分享,熱情,樂于技術(shù)分享
針對客戶實際需要,真實案例演示,互動式溝通,學(xué)有所值