工程師
其他
大模型
推薦課程
average > 0 ? $model->average . '分' : '10.0分' ?>

DeepSeek大模型落地技術(shù)及實踐(實操課)

課程費用

6800.00 /人

課程時長

2

成為教練

課程簡介

聚焦DeepSeek大模型技術(shù)體系的全面解析。從模型架構(gòu)、訓(xùn)練范式到部署實踐,系統(tǒng)性地介紹DeepSeek從V1到R1的技術(shù)演進歷程,并結(jié)合實際案例講解大模型在工業(yè)場景中的落地應(yīng)用。

目標(biāo)收益

掌握DeepSeek大模型的核心技術(shù)原理和創(chuàng)新點
學(xué)習(xí)大模型訓(xùn)練、微調(diào)和部署的實踐技能
了解MoE架構(gòu)和分布式訓(xùn)練的關(guān)鍵技術(shù)
掌握模型應(yīng)用落地的最佳實踐經(jīng)驗

培訓(xùn)對象

AI算法工程師
機器學(xué)習(xí)研究員
深度學(xué)習(xí)開發(fā)工程師
大模型應(yīng)用開發(fā)人員
對大模型技術(shù)感興趣的技術(shù)管理者

課程大綱

第一天
上午 9:00-12:00
DeepSeek演進路線及核心技術(shù)
- DeepSeek發(fā)展里程碑:從Coder到R1的完整演進路線
- MoE架構(gòu)創(chuàng)新:從Dense到MoE的技術(shù)突破
- 核心訓(xùn)練范式:SFT、RL原理與應(yīng)用
- 推理增強技術(shù):CoT和搜索算法的實踐應(yīng)用
- 并行計算技術(shù):DP、EP、PP、TP的協(xié)同機制
下午14:00-16:00
DeepSeek高效推理部署
- 全參數(shù)模型部署方案與硬件規(guī)劃
- 分布式推理性能優(yōu)化技巧
- Ollama蒸餾模型部署流程
- VLLM推理加速框架實踐
- NPU部署方案與性能調(diào)優(yōu)
第二天
上午 9:00-12:00
DeepSeek訓(xùn)練微調(diào)與蒸餾
- R1-Zero純強化學(xué)習(xí)訓(xùn)練原理
- 多階段增強訓(xùn)練策略
- 模型蒸餾技術(shù)實踐
- Unsloth訓(xùn)練推理模型實踐
- GRPO算法與獎勵模型訓(xùn)練實戰(zhàn)
下午14:00-16:00
DeepSeek應(yīng)用實踐
- deepseek Prompt工程最佳實踐
- 思維鏈應(yīng)用案例分析
- 垂直領(lǐng)域RAG應(yīng)用方案
- 分布式推理訓(xùn)練集群趨勢
- 技術(shù)發(fā)展趨勢與未來展望
第一天
上午 9:00-12:00
DeepSeek演進路線及核心技術(shù)
- DeepSeek發(fā)展里程碑:從Coder到R1的完整演進路線
- MoE架構(gòu)創(chuàng)新:從Dense到MoE的技術(shù)突破
- 核心訓(xùn)練范式:SFT、RL原理與應(yīng)用
- 推理增強技術(shù):CoT和搜索算法的實踐應(yīng)用
- 并行計算技術(shù):DP、EP、PP、TP的協(xié)同機制
下午14:00-16:00
DeepSeek高效推理部署
- 全參數(shù)模型部署方案與硬件規(guī)劃
- 分布式推理性能優(yōu)化技巧
- Ollama蒸餾模型部署流程
- VLLM推理加速框架實踐
- NPU部署方案與性能調(diào)優(yōu)
第二天
上午 9:00-12:00
DeepSeek訓(xùn)練微調(diào)與蒸餾

- R1-Zero純強化學(xué)習(xí)訓(xùn)練原理
- 多階段增強訓(xùn)練策略
- 模型蒸餾技術(shù)實踐
- Unsloth訓(xùn)練推理模型實踐
- GRPO算法與獎勵模型訓(xùn)練實戰(zhàn)
下午14:00-16:00
DeepSeek應(yīng)用實踐
- deepseek Prompt工程最佳實踐
- 思維鏈應(yīng)用案例分析
- 垂直領(lǐng)域RAG應(yīng)用方案
- 分布式推理訓(xùn)練集群趨勢
- 技術(shù)發(fā)展趨勢與未來展望

課程費用

6800.00 /人

課程時長

2

預(yù)約體驗票 我要分享

近期公開課推薦

近期公開課推薦

活動詳情

提交需求