浅析HarmonyOS基于AI的通用文字识别技术

DRXU_gh_019562b 2021-08-20 3121

电子说

1.3w人已加入

描述

在资讯大爆炸的时代，我们经常面临文件、图片找不到的情况，HarmonyOS基于AI的通用文字识别技术，可以有效帮助我们解决这些难题。

基于AI的通用文字识别，将OCR技术和AI分词技术集成，可以对图像信息进行文字检测、识别和关键信息提取，并根据分析结果提供翻译、搜索等相关服务。

通用文字识别的核心技术是OCR【Optical Character Recognition，光学字符识别】，OCR是一种通过拍照、扫描等光学输入方式，把各种票据、卡证、表格、报刊、书籍等印刷品文字转化为图像信息，再利用文字识别技术将图像信息转化为计算机等设备可以使用的字符信息的技术。

AI分词是对于一段输入文本，自动进行分词，同时提供不同的分词粒度。

接下来我们将通过一个“AI文字识别”Demo，为你展示如何三步完成AI应用的开发，心动不如行动，复制下方链接，抢先体验吧~HarmonyOS应用开发在线体验：https://playground.harmonyos.com/#/cn/onlineDemo

AI文字识别Demo

如下视频所示，点击在线体验链，进入 “AI文字识别”Demo后，会看到图片列表中已经收录不同图片，接着在输入框中输入关键词，点击识别搜索后，会弹出一个提示框，点击提示框的“下一步”，搜索结果列表就会展示与关键词相关的图片。

只需输入关键词，就可以匹配得到我们想要的图片，再也不用惧怕茫茫图海中找不到图的窘境了。如此方便高效的AI应用，只需三步就能完成，接下来我们将我大家揭秘是此AI应用如何通过三步完成的。

第一步，图片文字识别

如图1所示，通过调用API：ITextDetector.detect（），对图片上的文字进行识别。具体实现是在代码21行的textDetector，此处传入了需要识别的Image（ “有奖征文”图）和一个 text组件，text组件将保存Image识别的结果，然后通过22行的sendResult将文字识别结果发送到主线程。更多API详情请点击下方官网链接。

ITextDetector.detect（）官网介绍：

https://developer.harmonyos.com/cn/docs/documentation/doc-references/itextdetector-0000001054200044

第二步，智能分词

如图2所示，通过调用API：NluClient.getWordSegment（），将输入的内容根据不同的词语粒度，自动分割为数个关键词。如：在搜索框中输入“有奖征文”，系统会将关键词分成“有奖”和“征文”。具体实现是在代码13行getWordSegment，参数requestData为输入的关键词，然后通过14行的sendResult发送分词结果。更多API详情请点击下方官网链接。

NluClient.getWordSegment（）官网介绍：

https://developer.harmonyos.com/cn/docs/documentation/doc-references/nluclient-0000001054518788

第三步，匹配图片

如图3所示，最后一步很简单，就是将分词后的“有奖征文”和图片识别的文字匹配，具体实现是将代码第4行的list（关键词集合）与第5行的imageInfos（图片文字识别结果集合）进行匹配，如果满足匹配条件，就会获取匹配的图片并展示在搜索结果中。至此，就通过了简单的三步完成一个使用AI能力进行图片搜索的应用。

AI能力概述

了解完通用文字识别和分词的AI能力，是不是感觉AI原来离我们这么近，使用起来也这么简单呢？其实除了这两项AI能力以外（如图4所示），HarmonyOS还支持文档检测校正、文字图像超分、IM类意图识别、语音识别、语音播报等13类AI能力，开箱即用，开发者可以灵活、便捷地选择AI能力，使应用变得更加智能。

编辑：jq

打开APP阅读更多精彩内容