1 使用深度学习,制作“图片+文字”型的表情包-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用深度学习,制作“图片+文字”型的表情包

DPVg_AI_era 来源:未知 作者:李倩 2018-07-03 10:14 次阅读

深度学习生成表情包,笑不笑由你。

自从有了表情包,跟人聊天时的第一反应,就是去找找看有什么适合的表情。

有一类表情包,形式是文字+图,尤其能够精妙地抒发和传递感情。

在这一点上,可能全世界的网友都一样。

好用的表情永远不嫌多,而且似乎总是不够用。

怎么办?

好在我们有深度学习。

表情包,一个天然的图说生成问题

斯坦福大学的Abel L. Peirson V和E. Meltem Tolunayl,在这一期斯坦福深度学习自然语言处理课程CS224n的期末作业中,提交了一个表情包生成器,使用深度学习,制作“图片+文字”型的表情包。

下面这些都是他们的系统自动生成的结果。不得不说,深得表情包制作精髓。

这个表情包生成器的基本的框架是一个编码器-解码器图说生成系统,先进行CNN图像嵌入,然后用一个LSTM RNN进行文字生成。

其中,编码器的目标是要给出一个有意义的状态,让解码器开始进行文字生成。他们使用在ImageNet上预训练的Inception-v3做为编码器模型,并将最后一层隐藏CNN作为编码器的输出。当表情包模板进入Inception模型后,输出是一组长度固定的向量,也即图像嵌入,能够反映图像的内容。这个图像嵌入之后会被投射到词嵌入空间里,方便后续文字生成。

他们一共尝试了3种不同的编码器模型,最简单的一种只输入图像,另一种输入图像和标签,最后一种的输入也是图像和标签,但使用了注意力机制。至于解码器,都是一个单向LSTM。这样搭配组合成了3种编码器-解码器方案。下图展示了第二种方案的模型。

学习40万个表情,幽默程度媲美人类

数据集是这个表情包生成器的精髓。他们的数据集由大约40万张带标签和图说的图片组成。其中有2600个独特的图像-标签对,是他们写Python脚本从Memegenerator.net中获取的。一张图片对应一个标签,标签是对这幅图的简单描述,而每张图都与很多不同的图说(大约160个)相关联。

下图展示了数据的样本:

在训练前,他们还针对图说中的标点、格式和某些词出现的频率等进行了预处理。

训练的结果,深度学习生成了各种表情:

系统看过的图像(左边4张)的输入标签是来自训练集的标签,而对于没见过的图像(右边4张),我们使用的句子是“AI是新的电力”。

从语法、搞笑程度和可区分性(分辨是人制作的还是深度学习生成的)几个维度判断,深度学习表情包生成器取得了不错的效果。尤其是搞笑程度,因为这一点是制作表情包的初衷,普通表情包的搞笑程度7分(满分10分),深度学习生成的表情包最高达到了6.8。

两位作者指出,幽默是很难评判的事情,本身就是一个很深的研究领域。他们的这项工作十分基础,接下来如果能构建出能够自动断句的表情包生成器(就是自动判断图片上方和下方两行文字从哪里断开),将会是一个很大的进步。(因为使用的都是网络热图,因此数据含有性别歧视和不文明的成分。)此外,探索视觉注意力机制在表情包生成中的作用,也是一个不错的研究方向。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编码器
    +关注

    关注

    45

    文章

    3638

    浏览量

    134415
  • 深度学习
    +关注

    关注

    73

    文章

    5500

    浏览量

    121109
  • cnn
    cnn
    +关注

    关注

    3

    文章

    352

    浏览量

    22203

原文标题:深度学习了40万个表情,一大波AI 表情包来了

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    表情识别-深度学习探索情感

    来源:易百纳技术社区 随着人工智能技术的不断进步,深度学习成为计算机视觉领域的重要技术。微表情识别作为人类情感分析的一种重要手段,受到了越来越多的关注。本文将介绍基于深度
    的头像 发表于 08-14 17:27 2127次阅读
    微<b class='flag-5'>表情</b>识别-<b class='flag-5'>深度</b><b class='flag-5'>学习</b>探索情感

    表情一起玩(表情动画制作软件)

    即可缓存到本地,随时可以快速查找使用; <br/>5.快速编辑制作表情,添加任意文字,只需数秒就可以做出你想要的表情,可保存和使用编辑方案模版,</p&
    发表于 04-27 17:31

    如何制作QQ表情的安装?如何制作eip文件?

    如何制作QQ表情的安装?如何制作eip文件?[hide]第一步:制作BMP, JPG, GIF格式的QQ
    发表于 05-07 08:39

    利用深度无盘快速制作通用的方法

    利用深度无盘快速制作通用的方法相信论坛里有不少的网管朋友都想想节约时间快速的完成一家网吧的无盘施工吧,特别是那些维护比较多的网吧,经常为了安装操作系统、上传系统感到麻烦。这个时候有人就会想到通用
    发表于 07-18 16:38

    深度学习脱掉图片人物的裤子之python教程

    深度学习脱掉图片人物的裤子【python教程】
    发表于 05-22 13:19

    深度学习中的图片如何增强

    深度学习中的图片增强
    发表于 05-28 07:03

    深度学习模型是如何创建的?

    嵌入式系统已被证明可以降低成本并增加各个行业的收入,包括制造工厂,供应链管理,医疗保健等等。本文将介绍有关深度学习嵌入式系统的信息。深度学习模型是如何创建的?创建
    发表于 10-27 06:34

    C#教程之图片上绘制文字

    C#教程之图片上绘制文字,很好的C#资料,快来学习吧。
    发表于 04-20 11:13 5次下载

    AI为表情生成搞笑文字说明

    制作表情还能获得研究生学分?如果使用深度学习技术来实现的话,是有可能的。
    的头像 发表于 07-31 17:38 7725次阅读

    用Python做几个表情

    今天制作表情用到的技术还是之前提到的Turtle库,可以从之前的文章除了画佩奇我们还要玩点更高级的,去学习Turtle的常用语法,然后就是PIL库,之前通过这篇文章:Python骚操
    的头像 发表于 02-11 11:13 5187次阅读

    【大大表情】数字化转型好伙伴!钢铁大大表情全新升级!

    【大大表情】数字化转型好伙伴!钢铁大大表情全新升级!
    的头像 发表于 06-27 19:39 3946次阅读

    曝腾讯QQ发生崩溃 部分群聊无法发送文字图片

    3月10日午间,腾讯QQ突然出现崩溃现象,部分群聊无法发送文字图片内容,只能发送表情、文档。
    的头像 发表于 03-10 14:27 3467次阅读

    如何用约43000张图片的数据集,来计算得出表情的火爆程度排名

    电视节目的火爆程度可以根据尼尔森收视率排名(Neilsen ratings)来衡量,但是表情呢?目前仍然没有什么独立指标能用以评估表情(memes)的浏览人数,所以笔者自己摸索出了
    的头像 发表于 10-11 10:06 4046次阅读
    如何用约43000张<b class='flag-5'>图片</b>的数据集,来计算得出<b class='flag-5'>表情</b><b class='flag-5'>包</b>的火爆程度排名

    可通过面部表情来发送表情的耳机

    无需打字、无需搜索表情,只需对着手机微笑,就能发出微笑表情。 同样的,对着手机皱眉,就能发出皱眉表情。 以上功能来自一款名为 C-Fac
    的头像 发表于 10-30 10:13 2278次阅读
    可通过面部<b class='flag-5'>表情</b>来发送<b class='flag-5'>表情</b><b class='flag-5'>包</b>的耳机

    面部表情识别技术的最新研究进展

    面部表情识别技术是人工智能领域的研究热点之一,对于揭示情感状态和心理状况具有重要意义。本文将介绍面部表情识别技术的最新研究进展,包括深度学习、多模态融合、微
    的头像 发表于 08-21 17:58 1110次阅读