0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心
发布

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI模型是如何训练的?训练一个模型花费多大?

lPCU_elecfans 来源:未知 2022-10-23 00:20 次阅读

电子发烧友网报道(文/李弯弯)在深度学习中,经常听到一个词“模型训练”,但是模型是什么?又是怎么训练的?在人工智能中,面对大量的数据,要在杂乱无章的内容中,准确、容易地识别,输出需要的图像/语音,并不容易。因此算法显得尤为重要。算法也就是模型。

算法的内容,除了核心识别引擎,也包括各种配置参数,如:语音智能识别的比特率、采样率、音色、音调、音高、音频、抑扬顿挫、方言、噪音等。成熟的识别引擎,核心内容一般不会经常变化。为实现“识别成功”这一目标,就只能对配置参数做调整。

对不同输入,我们会配置不同参数值,最后在结果统计取一个各方比较均衡、识别率较高的一组参数值,这组参数值,就是训练后得到的结果,这就是训练的过程,也叫模型训练。

如何训练一个AI模型?

训练模型需要用到AI框架,比如MindSpore。具体如何训练一个AI模型呢? 昇思MindSpore 此前发布一个详细的案例,训练的模型是用来对手写数字图片进行分类的LeNet5模型。MindSpore是华为推出全场景AI计算框架,2020年3月28日宣布MindSpore 正式开源 首先是安装MindSpore,MindSpore提供给用户使用的是Python接口。安装的时候,选择合适的版本、硬件平台、操作系统编程语言、安装方式。其次是定义模型,安装好之后,就可以导入MindSpore提供的算子(卷积、全连接、池化等函数)来构建模型了。构建一个AI模型就像建一个房子,MindSpore提供的算子就像是砖块、窗户、地板等基本组件。 接下来是导入训练数据集,什么是训练数据集呢,刚刚定义好的模型是不能对图片进行正确分类的,要通过训练过程来调整模型的参数矩阵的值。训练过程就需要用到训练样本,也就是打上了正确标签的图片。这就好比教小孩儿认识动物,需要拿几张图片给他们看,告诉他们这是什么,教了几遍之后,小孩儿就能认识了。 那么这里训练LeNet5模型就需要用到MNIST数据集。这个数据集由两部分组成:训练集(6万张图片)和测试集(1万张图片),都是0~9的黑白手写数字图片。训练集是用来训练AI模型的,测试集是用来测试训练后的模型分类准确率的。 再接下来就是训练模型,训练数据集和模型定义完成后,就可以开始训练模型了。在训练之前,还需要从MindSpore导入两个函数:损失函数,就是衡量预测结果和真实标签之间的差距的函数;优化器,用来求解损失函数关于模型参数的更新梯度的。准备好之后,开始训练,把前面定义好的模型、损失函数、优化器封装成一个Model,使用model.train接口就可以训练LeNet5模型了。最后就是测试训练后的模型准确率。

训练AI模型花费大 当然,模型训练需要强大的算力支撑,尤其是参数量大的模型,花费极大。 比如OpenAI的语言模型GPT-3,这是一个大型的、数学vwin 神经网络,从网络上抓取大量文本进行训练后,GPT-3可以以惊人的连贯性预测哪些词应该填在其他词前后,生成流畅的文本。据估计,训练GPT-3的成本接近500万美元。 一些小企业想要训练一个参数较大的算法,往往比较苦难。健康IT公司Optum的一位领导此前表示,他们团队使用语言模型来分析通话记录,识别哪些患者风险较高,哪些应该及早推荐转诊。只是训练一个GPT-3大小千分之一的语言模型,也会很快耗尽团队的预算。 另外一家从事搜索业务的创业公司Glean,一直很想使用最新的AI算法来改进公司的产品 Glean提供Gmail、Slack和Salesforce等应用程序进行搜索的工具,用于解析语言的新AI技术,可以帮助公司的客户更快地发掘正确的文件或对话。 但是训练这样一个尖端的人工智能算法需要花费数百万美元。Glean只好使用更小、能力更弱的AI模型,然而这些模型无法从文本中提取出尽可能多的含义。

小结 过去十几年,AI取得了一些列举世瞩目的成绩,包括在游戏中击败人类,让汽车可以行驶在城市的街道上,AI自己编写连贯的文字,做出可以媲美画家的画作。这都得益于数据量的不断积累,算法的不断优化,以及可以支撑算法训练的算力的不断强化。 然而,在发展的过程中同样还存在一些问题。比如对于小企业来说,训练高级AI算法成本高,这就会使得AI的全面应用受到阻碍等问题。当然AI整体呈现出快速发展的趋势,业界也在不断探索有利于AI发展的方式,比如大模型的出现,本身也是为了解决通用性的问题,比如说模型简化,减少模型训练所需要算力等。 8de4b586-5224-11ed-a3b6-dac502259ad0.png

8e265072-5224-11ed-a3b6-dac502259ad0.png

声明:本文由德赢Vwin官网原创 ,转载请注明以上来源。如需入群交流,请添加微信elecfans999, 投稿爆料采访需求,请发邮箱huangjingjing@elecfans.com。 更多热点文章阅读


原文标题:AI模型是如何训练的?训练一个模型花费多大?

文章出处:【微信公众号:德赢Vwin官网 网】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    28462

    浏览量

    265734
  • 人工智能
    +关注

    关注

    1787

    文章

    45805

    浏览量

    234091

原文标题:AI模型是如何训练的?训练一个模型花费多大?

文章出处:【微信号:elecfans,微信公众号:德赢Vwin官网 网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    ai模型训练方法有哪些?

    AI模型 训练方法是 复杂且不断发展的领域。以下是 ai
    的头像 发表于07-16 10:11 536次阅读

    ai模型ai框架的关系是什么

    AI模型AI框架是人工智能领域中两 重要的概念,它们之间的关系密切且复杂。 AI模型的定义
    的头像 发表于07-16 10:07 3.7w次阅读

    如何使用经过训练的神经网络模型

    使用经过 训练的神经网络 模型 涉及多个步骤的过程,包括数据准备、 模型加载、预测执行以及后续优化等。
    的头像 发表于07-12 11:43 389次阅读

    python训练出的模型怎么调用

    在Python中, 训练出的 模型可以通过多种方式进行调用。 1. 模型保存与加载 在Python中, 训练好的 模型需要被保存,以便在其他程序或会
    的头像 发表于07-11 10:15 511次阅读

    大语言模型的预训练

    随着人工智能技术的飞速发展,自然语言处理(NLP)作为人工智能领域的 重要分支,取得了显著的进步。其中,大语言 模型(Large Language Model, LLM)凭借其强大的语言理解和生成
    的头像 发表于07-11 10:11 207次阅读

    人脸识别模型训练流程

    人脸识别 模型 训练流程是计算机视觉领域中的 项重要技术。本文将详细介绍人脸识别 模型训练流程,包括数据准备、
    的头像 发表于07-04 09:19 373次阅读

    人脸识别模型训练失败原因有哪些

    人脸识别 模型 训练失败的原因有很多,以下是 些常见的原因及其解决方案: 数据集质量问题 数据集是 训练人脸识别 模型的基础。如果数据集存在质量问题
    的头像 发表于07-04 09:17 288次阅读

    人脸识别模型训练是什么意思

    人脸识别 模型 训练是指通过大量的人脸数据,使用机器学习或深度学习算法, 训练 能够识别和分类人脸的 模型
    的头像 发表于07-04 09:16 287次阅读

    训练模型的基本原理和应用

    训练 模型(Pre-trained Model)是深度学习和机器学习领域中的 重要概念,尤其是在自然语言处理(NLP)和计算机视觉(CV)等领域中得到了广泛应用。预
    的头像 发表于07-03 18:20 1106次阅读

    深度学习模型训练过程详解

    深度学习 模型 训练 复杂且关键的过程,它涉及大量的数据、计算资源和精心设计的算法。 训练
    的头像 发表于07-01 16:13 348次阅读

    【大语言模型:原理与工程实践】大语言模型的预训练

    训练数据时,数量、质量和多样性三者缺 不可。 数据的多样性对于大语言 模型至关重要,这主要体现在数据的类别和来源两 方面。丰富的数据类别能够提供多样的语言表达特征,如官方知识型数据、口
    发表于05-07 17:10

    谷歌模型训练软件有哪些?谷歌模型训练软件哪个好?

    谷歌在 模型 训练方面提供了 些强大的软件工具和平台。以下是几个常用的谷歌 模型 训练软件及其特点。
    的头像 发表于03-01 16:24 608次阅读

    谷歌模型训练软件有哪些功能和作用

    谷歌 模型 训练软件主要是指ELECTRA,这是 种新的预 训练方法,源自谷歌 AI。ELECTRA不仅拥有BERT的优势,而且在效率上更胜
    的头像 发表于02-29 17:37 590次阅读

    AI模型构建的五过程详解

    AI 模型构建的过程 模型构建主要包括 5 阶段,分别为 模型设计、特征工程、 模型
    发表于11-17 10:31 6961次阅读
    <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>构建的五<b class='flag-5'>个</b>过程详解

    训练大语言模型带来的硬件挑战

    生成式 AI和大语言 模型(LLM)正在以难以置信的方式吸引全世界的目光,本文简要介绍了大语言 模型训练这些 模型带来的硬件挑战,以及GPU和网络
    的头像 发表于09-01 17:14 1336次阅读
    <b class='flag-5'>训练</b>大语言<b class='flag-5'>模型</b>带来的硬件挑战