在全球 AI 产业生态体系日趋成熟的背景下,加速计算迎来了前所未有的发展空间,在众多不同应用以及各行各业得到了广泛应用,相关技术也飞速发展不断迭代。
10 月 22 日,在 NVIDIA AI 研发技术开放日上,共邀请了 10 位来自 NVIDIA 加速计算专家团队的讲师,深入互联网核心应用场景,聚焦五大技术热点,与大家分享了加速计算的优化经验。
演讲视频已正式上线
欢迎扫描下方二维码,观看精彩内容:
演讲一
– 最佳实践分享
演讲嘉宾:NVIDIA 加速计算专家 刘冰 & 郑鹏
演讲简介:
演讲二
在NVIDIA NeMo 中实现
大语言模型全周期开发
– 以 LLaMa2 为例
演讲嘉宾:NVIDIA 加速计算专家 姚鑫 & 颜子杰
演讲简介:
-
NeMo Framework 介绍
-
使用 Nemo Framework 进行预训练,包括优化策略和性能
-
微调:包括 SFT 和 PEFT
-
RLHF:包括 RLHF 的训练与性能优化算法
-
介绍如何将模型导出到 TensorRT-LLM
演讲三
TensorRT Hackathon 2023
总结AIGC 及大语言模型推理
的典型案例深入解析
演讲嘉宾:NVIDIA 加速计算专家 季光 & 陈庾
演讲简介:
-
TensorRT Hackathon 2023 总结:TensorRT Hackathon 是 NVIDIA 组织的年度编程赛事。我们回顾今年的赛事情况,包括赛题、比赛的组织与结果,并欢迎更多开发者参加比赛。
-
通过 TensorRT-LLM 中的量化技术加速 LLM 推理
演讲四
向量数据库的加速策略和实战
演讲嘉宾:NVIDIA 加速计算专家 王雍 & 张静蓉
演讲简介:
-
介绍 Vector DB 的核心引擎近似最近邻(ANN)搜索
-
RAPIDS-RAFT 库中基于 GPU 的 ANN 并行算法和工具,包括:IVF-Flat、IVF-PQ、基于图的方法等
-
ANN 算法中使用的关键优化技术,特别是并行 Top-K 算法
演讲五
和实践– 以 HPS 为例
演讲嘉宾:NVIDIA 加速计算专家 魏英灿 & 王泽寰
演讲简介:
-
用于推荐系统推理加速的分级参数服务器(HPS)框架介绍
-
高性能 GPU 推理缓存的设计思路与实现细节
-
HPS 与 GPU 推理缓存的性能评估
GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。点击“阅读原文”或扫描下方海报二维码,立即注册 GTC 大会。
原文标题:精彩回顾| “NVIDIA AI 研发技术开放日” 演讲视频全集!
文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。
-
英伟达
+关注
关注
22文章
3770浏览量
90978
原文标题:精彩回顾| “NVIDIA AI 研发技术开放日” 演讲视频全集!
文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论