自然语言处理范式正在变迁-德赢Vwin官网网

最近几天被OpenAI推出的ChatGPT[1]刷屏了，其影响已经不仅局限于自然语言处理（NLP）圈，就连投资圈也开始蠢蠢欲动了，短短几天ChatGPT的用户数就超过了一百万。通过众多网友以及我个人对其测试的结果看，ChatGPT的效果可以用惊艳来形容，具体结果我在此就不赘述了。不同于GPT-3刚推出时人们的反应，对ChatGPT大家发出更多的是赞叹之词。聊天、问答、写作、编程等等，样样精通。因此也有人惊呼，“通用人工智能（AGI）即将到来”、“Google等传统搜索引擎即将被取代”，所以也对传说中即将发布的GPT-4更加期待。

从技术角度讲，ChatGPT还是基于大规模预训练语言模型（GPT-3.5）强大的语言理解和生成的能力，并通过在人工标注和反馈的大规模数据上进行学习，从而让预训练语言模型能够更好地理解人类的问题并给出更好的回复。这一点上和OpenAI于今年3月份推出的InstructGPT[2]是一致的，即通过引入人工标注和反馈，解决了自然语言生成结果不易评价的问题，从而就可以像玩儿游戏一样，利用强化学习技术，通过尝试生成不同的结果并对结果进行评分，然后鼓励评分高的策略、惩罚评分低的策略，最终获得更好的模型。

不过说实话，我当时并不看好这一技术路线，因为这仍然需要大量的人工劳动，本质上还是一种“人工”智能。不过ChatGPT通过持续投入大量的人力，把这条路走通了，从而更进一步验证了那句话，“有多少人工，就有多少智能”。

不过，需要注意的是，ChatGPT以及一系列超大规模预训练语言模型的成功将为自然语言处理带来 新的范式变迁 ，即从以BERT为代表的 预训练+精调 （Fine-tuning）范式，转换为以GPT-3为代表的 预训练+提示 （Prompting）的范式[3]。所谓提示，指的是通过构造自然语言提示符（Prompt），将下游任务转化为预训练阶段的语言模型任务。例如，若想识别句子“我喜欢这部电影。”的情感倾向性，可以在其后拼接提示符“它很 ”。如果预训练模型预测空格处为“精彩”，则句子大概率为褒义。这样做的好处是无需精调整个预训练模型，就可以调动模型内部的知识，完成“任意”的自然语言处理任务。当然，在ChatGPT出现之前，这种范式转变的趋势并不明显，主要有两个原因：

第一，GPT-3级别的大模型基本都掌握在大公司手里，因此学术界在进行预训练+提示的研究时基本都使用规模相对比较小的预训练模型。由于规模规模不够大，因此预训练+提示的效果并不比预训练+精调的效果好。而只有当模型的规模足够大后，才会涌现（Emerge）出“智能”[4]。最终，导致之前很多在小规模模型上得出的结论，在大规模模型下都未必适用了。

第二，如果仅利用预训练+提示的方法，由于预训练的语言模型任务和下游任务之间差异较大，导致这种方法除了擅长续写文本这种预训练任务外，对其他任务完成得并不好。因此，为了应对更多的任务，需要在下游任务上继续预训练（也可以叫预精调），而且现在的趋势是在众多的下游任务上预精调大模型，以应对多种、甚至未曾见过的新任务[5]。所以更准确地说，预训练+预精调+提示将成为自然语言处理的新范式。

不同于传统预训练+精调范式，预训练+预精调+提示范式将过去一个自然语言处理模型擅长处理一个具体任务的方式，转换为了用一个模型处理多个任务，甚至未曾见过的通用任务的方式。所以从这个角度来讲，通用人工智能也许真的即将到来了。这似乎也和我几年前的预测相吻合，我当时曾预测，“结合自然语言处理历次范式变迁的规律（图1），2018年预训练+精调的范式出现之后5年，即2023年自然语言处理也许将迎来新的范式变迁”。

那么，接下来如何进一步提升预训练+预精调+提示新范式的能力，并在实际应用中将其落地呢？

首先，显式地利用人工标注和反馈仍然费时费力，我们应该设法更自然地获取并利用人类的反馈。也就是在实际应用场景中，获取真实用户的自然反馈，如其回复的语句、所做的行为等，并利用这些反馈信息提升系统的性能，我们将这种方式称为 交互式自然语言处理 。不过用户的交互式反馈相对稀疏，并且有些用户会做出恶意的反馈，如何克服稀疏性以及避免恶意性反馈都将是亟待解决的问题。

其次，目前该范式生成的自然语言文本具有非常好的流畅性，但是经常会出现事实性错误，也就是会一本正经地胡说八道。当然，使用上面的交互式自然语言处理方法可以一定程度上解决此类问题，不过对于用户都不知道答案的问题，他们是无法对结果进行反馈的。此时又回到了可解释性差，这一深度学习模型的老问题上。如果能够像写论文时插入参考文献一样，在生成的结果中插入相关信息的出处，则会大大提高结果的可解释性。

最后，该范式依赖超大规模预训练语言模型，然而这些模型目前只掌握在少数的大公司手中，即便有个别开源的大模型，由于其过于庞大，小型公司或研究组也无法下载并使用它们。所以，在线调用是目前使用这些模型最主要的模式。在该模式下，如何针对不同用户面对的不同任务，使用用户私有的数据对模型进行进一步预精调，并且不对公有的大模型造成影响，成为该范式实际应用落地所迫切需要解决的问题。此外，为了提高系统的运行速度，如何通过在线的大模型获得离线的小模型，并且让离线小模型保持大模型在某些任务上的能力，也成为模型能实际应用的一种解决方案。

未来已来，让我们共同期待！

注：有幸在车老师的朋友圈学习到了他对于最近ChatGPT的一些见解，征得老师同意后分享给大家，转载请注明作者。

参考文献：

[1] https://chat.openai.com/

[2] Long Ouyang, Jeff Wu, Xu Jiang, Diogo Almeida, Carroll L. Wainwright, Pamela Mishkin, Chong Zhang, Sandhini Agarwal, Katarina Slama, Alex Ray, John Schulman, Jacob Hilton, Fraser Kelton, Luke Miller, Maddie Simens, Amanda Askell, Peter Welinder, Paul Christiano, Jan Leike, Ryan Lowe. Training language models to follow instructions with human feedback. https://arxiv.org/abs/2203.02155

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

nlp

nlp

+关注

关注
1

文章
488

浏览量
22033
OpenAI

OpenAI

+关注

关注
9

文章
1079

浏览量
6480
ChatGPT

ChatGPT

+关注

关注
29

文章
1558

浏览量
7591

python自然语言

最近，python自然语言是越来越火了，那么什么是自然语言。自然语言（Natural Language ）广纳了众多技术，对自然或人类语言进

发表于 05-02 13:50

自然语言处理怎么最快入门？

`本文整理自知乎上的一个问答，分享给正在学习自然然语言处理的朋友们！一、自然语言处理是什么？

发表于 11-28 10:02

【推荐体验】腾讯云自然语言处理

`相信大家对NLP自然语言处理的技术都不陌生，它是计算机科学领域和AI领域中的一个分支，它与计算机和人类之间使用自然语言进行交互密切相关，而NLP的最终目标是使计算机能够像人类一样理解语言

发表于 10-09 15:28

自然语言处理的分词方法

自然语言处理——75 自动分词基本算法

发表于 03-19 11:46

自然语言处理的语言模型

自然语言处理——53 语言模型（数据平滑）

发表于 04-16 11:11

自然语言处理的词性标注方法

自然语言处理——78 词性标注方法

发表于 04-21 11:38

求自然语言处理笔记

自然语言处理笔记9-哈工大关毅

发表于 06-04 16:34

自然语言处理——总结、习题

自然语言处理——79 总结、习题

发表于 06-19 11:22

什么是自然语言处理？

会识别出我们正确说的话。我们使用免费服务将在线遇到的外语短语翻译成英语，有时它们可以为我们提供准确的翻译。尽管自然语言处理取得了长足的进步，但仍有很大的改进空间。[理...

发表于 07-23 10:22

什么是自然语言处理

什么是自然语言处理？自然语言处理任务有哪些？自然语言处理的方法是什么？

发表于 09-08 06:51

什么是自然语言处理_自然语言处理常用方法举例说明

自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是

发表于 12-28 16:56 •1.8w次阅读

自然语言处理怎么最快入门_自然语言处理知识了解

自然语言处理就是实现人机间自然语言通信，实现自然语言理解和自然语言生成是十分困难的，造成困难的根本原因是

发表于 12-28 17:10 •5308次阅读

自然语言处理的概念和应用 自然语言处理属于人工智能吗

　　自然语言处理(Natural Language Processing)是一种人工智能技术，它是研究自然语言与计算机之间的交互和通信的一门学科。自然语言

发表于 08-23 17:31 •1544次阅读

自然语言处理和人工智能的概念及发展史 自然语言处理和人工智能的区别

自然语言处理(Natural Language Processing, NLP)的定义是通过电脑软件程序实现人们日常语言的机器自动处理。为了帮助计算机理解，掌握

发表于 08-23 18:22 •955次阅读

自然语言处理包括哪些内容

自然语言处理（Natural Language Processing，简称NLP）是人工智能领域的一个重要分支，它涉及到计算机与人类语言之间的交互。NLP的目标是让计算机能够理解、生成和处理

发表于 07-03 14:15 •815次阅读

搜索历史

自然语言处理范式正在变迁

评论

python自然语言

自然语言处理怎么最快入门？

【推荐体验】腾讯云自然语言处理

自然语言处理的分词方法

自然语言处理的语言模型

自然语言处理的词性标注方法

求自然语言处理笔记

自然语言处理——总结、习题

什么是自然语言处理？

什么是自然语言处理

什么是自然语言处理_自然语言处理常用方法举例说明

自然语言处理怎么最快入门_自然语言处理知识了解

自然语言处理的概念和应用自然语言处理属于人工智能吗

自然语言处理和人工智能的概念及发展史自然语言处理和人工智能的区别

自然语言处理包括哪些内容