0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Richard Socher:NLP领域的发展要过三座大山

mK5P_AItists 来源:未知 作者:胡薇 2018-09-06 11:40 次阅读

“我的飞机什么时候到?”把这个问题抛给智能机器人助手。几乎可以肯定,机器立马就懵逼了。“我”是谁?“飞机”是航班还是淘宝上订的模型玩具呢?“到”又是到哪呢?如果是人类来回答这个问题,即使在情景不明确的情况下也能在快速澄清后给出回答,但对机器来说,除非依赖大量人为制定的规则,回答这样的问题难度堪比“哥德巴赫猜想”。

面对自然语言处理发展(NLP)存在的诸多难题,该领域的大牛、Salesforce的首席科学家Richard Socher在近日指出:NLP领域的发展要过三座大山。

困扰NLP领域的这三座大山究竟是什么?一起来听大佬说。

一直以来,语言都被认为是人类的独特能力,是智慧的表现。但最近,自然语言处理技术的发展似乎也将语言能力赋予给了机器。

帮你打电话订餐,给你讲故事,解决各种刁钻的冷知识问答…机器的语言能力已经无限接近人类水平。

现在你可以走进昏暗的客厅,让Alexa把智能灯的亮度提高到75%。你也可以询问他世界另一边的天气情况。在Google最近的Duplexde,AI助理已经能够给理发店打电话,为你预约剪发。

曾经被视为科幻的场景现在变为了现实,但为了维持真正的人机关系,机器必须能够与人进行更直观、理解上下文和自然的对话--这仍然是一个挑战。我致力于研究NLP,但是就像AI一样,我们还在这个旅程的开始阶段。

语言是分享信息和与周围连接的一种机制,但是机器需要理解语言的复杂性以及作为人类是如何使用语言进行交流的。情感分析、问题回答和联合多任务学习方面的进步使AI能够真正理解人类以及我们的交流方式。

情感分析

语言本身就是复杂的。它不断发展,而且细致入微,一般人需要数年才能掌握。通过情绪分析,我们可以使用AI来理解特定内容,比如品牌或电影评价是正面的、负面的还是中性的。

我们也能弄清楚演讲者的态度和意图(她是生气,高兴,惊讶还是准备好要买东西了?)。从客户服务到在线社区调节再到算法交易,能够即时分析数千条推特和数百条产品评论来理解公众对一个品牌的看法,这对于企业来说是非常有价值的。

情感分析技术已经存在了一段时间,但并不总是非常精准。随着NLP的进展,这种情况正在发生变化。在我担任首席科学家的Salesforce,我们的AI(叫做Einstein)允许品牌能够通过电子邮件,社交媒体,和聊天短信得到实时的情感分析,为客户提供更好的体验。

准确的情感分析,例如,服务代理可帮助了解应优先服务哪些不满意的客户,或者应向谁提供优惠。也可识别产品缺陷,衡量产品满意度,通过社交平台改变人们对品牌的认知。其他科技公司也提供类似服务。

对于情感分析来说,理解上下文也是很重要的。假设你有一家肥皂公司,有人在推特上说:“这种肥皂对婴儿来说真的很棒。”这可以是对儿童肥皂的积极支持,也可能是暗讽这对孩子来说很可怕。

这句陈述可能包含很多上下文,但又很简单!使用AI分析某一句子结构的所有可能性,并理解一个人在特定语境下的用意,是NLP研究的重大挑战。它既需要标记数据来改进模型培训,也需要新的模型在学习上下文的同时在许多不同类型的任务之间共享知识。

问 答

随着NLP更好地解析文本的含义,帮助管理我们生活的数字助理智能将会提高。Siri和Google Assistant等应用程序可为常见问题提供优质答案,并执行简单的命令。理想情况下,我们应该能够问电脑任意问题,并且得到好的答案。

提供更好答案的一种方式是确保计算机理解问题。如果你问“我的飞机什么时候到达?”计算机怎么知道是在谈论你的航班还是从亚马逊订购的木工工具呢?

通过对语义的更深入理解,再加上对上下文数据的更好使用,计算机在判断语义这方面正变得越来越好。我们正在研究如何使用NLP学习每一层上下文,这样AI就可以同时处理所有内容,而不会错过重要的信息。

例如,动态共聚焦网络(dynamic coattentionnetworks可以根据不同的问题对单个文档进行不同的解释,比如,面对一篇体育报道,在回答“哪位运动员获得了冠军?”和“最年轻的参赛者是几岁?”这两个问题是,机器就能对这篇报道作出不同的理解,从而反复假设多个答案,最终得到最好、最准确的结果。

联合多任务学习

科学界善于构建能很好地执行单个任务的人工智能模型。但是,更直观、会话式的并联系上下文的界面则需要一个不断学习的AI模型,它能够将新任务与旧任务集成起来,并在这个过程中学习执行更加复杂的任务。总体上来说,这对所有AI都是适用的,但在语言方面尤其如此,因为语言需要灵活性。

“谁是我的客户?”这是一个十分简单的任务:创建客户列表。但是,“谁是太平洋西北地区对某一特定产品的最佳潜在客户呢”?这样的问题增加了一层复杂性,需要大量的集成任务来提供答案,例如:如何定义“最佳”?客户定位在哪里?是什么因素导致客户对产品感兴趣的?每增加一个因素,问题的复杂性都会急剧增加。

Salesforce研究公司最近进行了一项名为“自然语言十项全能”的研究,该研究将多个任务转化为问答的形式,从而在一个单模型中解决了NLP最困[1]难的10项任务:问题回答,机器翻译,摘要,自然语言推理,情感分析,语义角色标注,关系提取,目标导向对话,数据库查询生成,代词消解。

使用多任务问答模型,将每个任务作为一种问答形式,单个模型在没有任何特定参数或模块的情况下共同学习和处理不同的任务。这不仅意味着数据科学家不再需要为每项任务建立、训练和优化单个模型,而且还意味着该模型具有零射击(zero-shot)学习能力---换句话说就是该模型可以处理以前从未见过或专门训练过的任务。

随着研究人员继续改进这样的模型,我们会看到AI界面在承担更复杂任务时变得更聪明。

虽然我们已经研究NLP很长时间了,但我们要走的路还长着呢。希望随着NLP技术的提升,人类与机器的交互形式最终能够迎来质的飞跃。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自然语言
    +关注

    关注

    1

    文章

    279

    浏览量

    13275
  • nlp
    nlp
    +关注

    关注

    1

    文章

    481

    浏览量

    21916

原文标题:语言处理想突破,三座大山必须过

文章出处:【微信号:AItists,微信公众号:人工智能学家】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于望获实时Linux和飞腾E2000Q CPU的全国产工控解决方案

    随着智能制造和工业4.0浪潮的席卷,工业生产对控制系统提出了前所未有的挑战——高精度、高实时性和高可靠性的需求如同 三座大山,横亘在行业 发展之路上。然而,环顾当前市场,高性能的国产化工业控制解决方案仍
    的头像 发表于08-08 13:48 225次阅读

    nlp自然语言处理框架有哪些

    自然语言处理(Natural Language Processing,简称 NLP)是计算机科学和人工智能 领域的一个重要分支,它致力于使计算机能够理解和处理人类语言。随着技术的 发展NLP
    的头像 发表于07-09 10:28 214次阅读

    nlp自然语言处理模型怎么做

    自然语言处理(Natural Language Processing,简称 NLP)是人工智能 领域的一个重要分支,它涉及到计算机对人类语言的理解和生成。随着深度学习技术的 发展NLP
    的头像 发表于07-05 09:59 297次阅读

    nlp自然语言处理的应用有哪些

    自然语言处理(Natural Language Processing,简称 NLP)是人工智能 领域的一个分支,它致力于使计算机能够理解和生成自然语言。随着技术的 发展NLP已经在许多
    的头像 发表于07-05 09:55 1375次阅读

    NLP技术在人工智能领域的重要性

    智能的桥梁,其重要性日益凸显。本文将从 NLP的定义、 发展历程、核心技术、应用 领域以及对人工智能 领域的深远影响等多个维度,深入探讨 NLP技术在
    的头像 发表于07-04 16:03 201次阅读

    什么是自然语言处理 (NLP)

    自然语言处理(Natural Language Processing, NLP)是人工智能 领域中的一个重要分支,它专注于构建能够理解和生成人类语言的计算机系统。 NLP的目标是使计算机能够像人类一样
    的头像 发表于07-02 18:16 482次阅读

    台积电高雄P3厂用地变更获批,迈向第三座2nm厂建设

    近日,台积电在高雄市的P3厂项目取得了重要进展。据可靠消息,6月24日,台积电高雄P3厂通过了高雄市都市计划委员会的用地变更申请,该地块将被正式变更为甲种工业区。这一里程碑式的进展意味着,台积电距离其第 三座2nm厂的建设动工又近了一步。
    的头像 发表于06-26 10:21 978次阅读

    天合光能供货的巴西三座光伏电站(Solar Park)成功并网运行

    近日,由天合光能供货的巴西 三座光伏电站(Solar Park)成功并网运行。这 三座电站均位于巴西南部的巴拉那州,全部采用天合光能至尊N型720W系列组件和至尊670W组件,总装机量达21MW,为这座热情之都输入更多绿色能量。
    的头像 发表于05-14 10:32 286次阅读

    台积电将在美国凤凰城建设第三座芯片工厂

    立第 三座芯片工厂,将其在亚利桑那州的总投资增加至 650 亿美元。 第 三座晶圆厂将使用 2nm 或更先进的工艺生产芯片,并于本世纪末开始生产。 美国总统拜登表示,这些设施将生产世界上最先进的芯片,促使美国有望在2030 年生产出全球 20% 的尖端半导体。 他表示,
    的头像 发表于04-10 16:19 238次阅读

    台积电将建第3晶圆厂 台积电5/3nm涨定

    近日,全球半导体制造巨头台积电宣布将进一步扩大在美国的投资版图,计划在亚利桑那州增设第 三座工厂。
    的头像 发表于04-09 15:03 551次阅读

    MLCC龙头村田三座工厂继续停工

    据报道,作为MLCC(多层陶瓷电容器)行业的领军企业,村田制作所于17日发布了关于旗下工厂受日本能登半岛地震影响的最新公告。在这次地震中,共有13 工厂受到了不同程度的影响。
    的头像 发表于01-19 14:39 668次阅读

    NLP领域的语言偏置问题分析

    摘要进行全面的统计分析,发现不同语言背景的作者在写作中的词汇、形态、句法和连贯性方面有明显的差异,这表明 NLP 领域存在语言偏置的可能性。因此,我们提出了一系列建议,以帮助学术期刊和会议的出版社改进他们对论文作者的指南和资源,以增强学术研究的包容性和公平性。
    的头像 发表于01-03 11:00 336次阅读
    <b class='flag-5'>NLP</b><b class='flag-5'>领域</b>的语言偏置问题分析

    台积电考虑在日本建第三座工厂

    目前尚不清楚台积电何时开始在日本建设第 三座工厂。3纳米芯片制程是目前商用的最先进芯片制造技术,不过当新工厂开始批量生产时,3纳米芯片可能已经落后1-2代最新技术。
    的头像 发表于11-21 17:05 699次阅读

    翻过电商独立网站“三座大山”,华为云助力企业勇攀高峰

    。而这就是在目前环境下,传统中小型企业做电子商务所必须面对的“ 三座大山”。只有将其逐个翻越,才能最后到达胜利的彼岸。 在实现企业信息化的道路上,只有勇作攀山者,用智慧和“逻辑”轻松翻越,才能尝到最后胜利的果实
    的头像 发表于11-21 09:50 172次阅读
    翻过电商独立网站“<b class='flag-5'>三座大山</b>”,华为云助力企业勇攀高峰

    推翻企业 ERP 管理“三座大山”,华为云耀云服务器 L 实例言出必行

    在数字化大行其道下,国内许多中小企业管理也开始接触到 ERP 管理,但国内许多企业则“又爱又怕”态度,“爱”的是 ERP 代表着一种先进的工具,能为企业的 发展提供新动力。而与此同时,企业不得不面临
    的头像 发表于11-15 21:56 197次阅读
    推翻企业 ERP 管理“<b class='flag-5'>三座大山</b>”,华为云耀云服务器 L 实例言出必行