像在word里一样便捷地编辑图像中的文字-德赢Vwin官网网

你想像编辑word文本一样便捷地编辑照片中的文字吗？像这样:

和这样:

让别人感觉不到任何人为编辑的迹象：

近日来自印度的研究人员们近日提出了一种基于自编码模型的字符替换方法，通过字符生成、颜色调节和重置完成对图像中目标文字的修改，并且能生成十分自然的图像，图像中被编辑过的文字毫无违和感。图片上的文字信息对于我们理解图片十分重要。字符的缺失和改变有的时候会严重的影响我们对于图像内涵的理解。除了会造成忍俊不禁的错别字，有时候还会让人们误解造成严重的损失！

另一方面，对于不同视角、环境下得到字符缺失的图片，如何进行有效的编辑和修复也是视觉领域一个重要的问题,甚至对于古文献修复和案件侦破都有着重要意义。

像编辑文本一样编辑图像中的文字

如果我们能够像文本编辑器一样编辑图像中的文字就好了。先前的人员提出过基于字符几何特征的合成方法，但却缺乏泛化性。但随着深度学习的发展，研究人员提出了利用GAN来进行字符生成，但基于GAN生成字符进行编辑的方法也需要面临一系列问题。首先基于GAN的生成需要对目标字符进行精确的识别，但字符识别本身就是一个复杂的问题，任何误差都会在整个过程积累十分有可能造成字符编辑的错误；其次，字符在同一张图像内具有多种字体类型，GAN模型需要对字体进行多次观察，并在生成前对字符进行较为严格的字体去失真过程，这对于不同情况下的字符编辑来说十分复杂。

所以研究人员聚焦字符级别的生成模型，来代替单词级别的生成模型最大化模型的灵活性和适应性。那么为了编辑图像中的文字，怎样才能又快又好呢？你需要四个步骤：定位到你要修改的字符、生成目标字符、调整目标字符的颜色、将字符融合回图像中去。这一工作的核心在于解决如何生成具有相同字体的目标字符，并为它赋予原字符相同的颜色风格。为此，研究人员提出了下图所示的FANet和ColorNet联合完成。

首先选取需要修改的字符，并利用算法将原字符转变为二值图像输入网络。FANet首先通过一个三层卷积和两次全连接将输入字符编码到512长度的向量上，其中包含了字体的风格信息。此外，目标字符的编码通过26个字符的独热编码转换到512维的编码上与先前得到的输入字符图像编码拼接得到1024维的隐空间编码。随后利用两个全连接和三次上采样最终得到与原字符相同风格的目标字符。但这时候的字符还没有颜色。那么就把原字符的颜色信息拿过来，继续进行处理。通过编码器解码器的结构，将原字符上的颜色信息迁移到了新字符上。最后对原图的对应区域进行背景去除，区域连续性处理，将得到的新字符放到合适的位置就可以得到修改后的图片了！来看看效果~~

这本jave书有点厉害！

看到这些图，你可能会觉得这些路标好像和上次看到的不一样了！

为了训练这个网络，研究人员们利用了谷歌字符库中的1000中字体，其中训练集中包含了67.6万个数据，验证集则有20.2万个数据。

最终的网络不仅可以编辑字符，同时还能由输入的单一字符生成出全部26个字母的新字体，下图中的的字体都是由一个输入字符生成出来的。

同样颜色也可以迁移，下图中的第二行表示输入字符的颜色，第三行就是将第二行的颜色迁移到第一行字符的结果。

中文字符

那么按道理，我们也可以开心的编辑照片中的汉字了。华中科技大学和旷视去年就提出了一篇可以生成各种风格汉字书法的工作，利用生成器和判别器实现了中文书法字符的合成。

这是文章中的网络结构：

和最后得到的结果：

我们可以基于同样的思路将图像中的中文字符也进行转换，把照片中的汉字都变成优秀的书法作品啦。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

word

word

+关注

关注
1

文章
78

浏览量
21933
图像

图像

+关注

关注
2

文章
1083

浏览量
40449
编码

编码

+关注

关注
6

文章
940

浏览量
54814

原文标题：如何如文本般顺滑来编辑照片中的文字？

文章出处：【微信号：thejiangmen，微信公众号：将门创投】欢迎添加关注！文章转载请注明出处。

Word篇文字录入技巧

Word篇文字录入技巧1.1.1 叠字轻松输入在汉字中经常遇到重叠字，比如“爸爸”、“妈妈”“欢欢喜喜”等，在Word中输入时除了利用输入法自带的功能快速输入外，还有没有其

发表于 03-10 17:51

word按空格自动删除后面的文字

养成碰到问题及时解决的习惯。原因分析：可能是不小心碰到Insert键了，按了这个键就会把平常WORD里输入文字时的插入状态变成改写状态了，在改写状态下，你每输入一个字符，就会自动把插入

发表于 01-05 23:27

pdf文件中的文字怎么进行编辑

文件中的文字怎么编辑，发现百度出来的步骤好多，觉着好麻烦。所以又去百度有什么pdf编辑器可以简单操作修改pdf文件今天小编就把我知道的一款好

发表于 07-10 10:29

在Labview Communication Design System Suite中如何创建属性节点，就像在labview中右键创建属性节点一样？

发表于 02-03 14:40

请问怎么将WORD中的文字复制到虚拟机中Linux中的VI编辑器中？

如何将WORD中的文字复制到虚拟机中Linux中的VI编辑器

发表于 03-27 07:45

如何实现图片转Word文档

脱轨了，现在有一个图片转word便捷方法，可以轻松帮你提取图片中的文字信息，快来试试吧！使用工具：迅捷OCR文字识别工具；操作方法：第二步：

发表于 04-19 15:05

CAD图纸中的CAD文字复制到Word文档变成了黑色框怎么办？

我们在使用浩辰CAD制图软件绘制完成图纸后，有些时候将CAD图形复制到Word文档中后部分CAD文字出现了问题，这个时候该怎么解决呢？接下来给大家介绍一下问题产生的原因以及解决方法吧！

发表于 01-20 11:00

有哪几种办法可实现单片机像在pc终端一样打印log呢

有哪几种办法可实现单片机像在pc终端一样打印log呢？stm32实现printf打印log的办法有哪些呢？

发表于 12-01 06:39

请问在emwin TEXT控件里的文字可以更改吗？

请问在 emwin里TEXT控件里的文字可以更改吗？如果字体不一样，修改了字体，能不能改？谢谢

发表于 11-06 08:22

如何在Word中怎么样画电路图？

如何在Word中怎么样画电路图？编制物理试卷时，很多人认为用Word画图困难，喜欢用windows自带的画图程序画图，或

发表于 12-26 10:24 •1.2w次阅读

一年成为Emacs高手，像神一样使用编辑器

一年成为Emacs高手，像神一样使用编辑器

发表于 10-29 11:03 •8次下载

微软计划研究盲人VR导航系统，让盲人可以像在真实世界一样行走

VR主要还是一种针对视觉上“欺骗”的技术，相对而言视障人士来说就有点难以领略VR的魅力。微软一个最新的研究项目能让盲人以现实世界的导航方式在VR世界中进行导航，盲人可以在VR环境中像在

发表于 08-02 14:18 •2525次阅读

怎样简单识别图片文字转换到Word

　　工作中我们经常会处理到各种各样的图片文件，有时候还需要将图片文件上的信息整理到Word一类的文档中，这样编辑起来就很方便，那怎样简单识别

发表于 03-27 13:50 •878次阅读

如何解决MathType中公式与文字错位的详细资料说明

按钮、在word 文档中设置。本文将详解这三种方法的具体运用，帮您彻底解决MathType 中公式与文字错位的问题。

发表于 05-30 17:26 •4次下载

Office Word新功能“微软编辑器”：检查并修正语法错误

）和机器学习技术，当用户使用Word或者Outlook等微软产品时，它能够实时发现拼写和语法错误。在升级Word之后，你就可以在微软Word中打开你的文档，免费的

发表于 12-24 17:26 •2834次阅读

搜索历史

像在word里一样便捷地编辑图像中的文字

评论

Word篇文字录入技巧

word按空格自动删除后面的文字

pdf文件中的文字怎么进行编辑

在Labview Communication Design System Suite中如何创建属性节点，就像在labview中右键创建属性节点一样？

请问怎么将WORD中的文字复制到虚拟机中Linux中的VI编辑器中？

如何实现图片转Word文档

CAD图纸中的CAD文字复制到Word文档变成了黑色框怎么办？

有哪几种办法可实现单片机像在pc终端一样打印log呢

请问在emwin TEXT控件里的文字可以更改吗？

如何在Word中怎么样画电路图？

一年成为Emacs高手，像神一样使用编辑器

微软计划研究盲人VR导航系统，让盲人可以像在真实世界一样行走

怎样简单识别图片文字转换到Word

如何解决MathType中公式与文字错位的详细资料说明

Office Word新功能“微软编辑器”：检查并修正语法错误