Tesseract-OCR中如何实现结构化的文档分析

引言

之前一篇介绍了Tesseract-OCR安装与测试，已经对中文字符的识别支持。大家反馈比较多，所以决定在写一篇，主要是介绍用它做项目时候需要注意的问题与一些比较重要的函数使用。主要介绍一下Tesseract-OCR中如何实现结构化的文档分析以及相关区域的定位识别。

术语名词

OEM - OCR Engine Mode

Tesseract-OCR从4.x版本开始支持LSTM，可以通过OEM参数熟悉设置，oem参数选项的值与表示分别如下：

0：3.x以前的识别引擎
1：神经网络LSTM的识别引擎
2：混合模式，传统+LSTM
3：默认，那种支持就用那种

PSM-Page Segmentation Mode

Tesseract-OCR支持对每页文档进行结构化分析，并输出结构化分析的结果，PSM文档结构化分析可以获取很多有用的文档信息。总计支持13种模式，默认的PSM的选项参数位PSM_AUTO=3，该选项支持对文档的结构化输出信息包括：

dict_keys(['level', 'page_num', 'block_num', 'par_num', 'line_num', 'word_num', 'left', 'top', 'width', 'height', 'conf', 'text'])，其中比较重要的包括：

'left', 'top', 'width', 'height' 表示位置信息
'text' 表示每个的外接矩形左上角与右下角坐标
'conf' 表示置信度，值在0~100之间，小于0的应该自动排除

其它有用的选项包括：

0   角度与语言检测，不识别不分析文档结构
1   角度 + PSM模式

更多模型，懒得翻译，请直接看下面：

0    Orientation and script detection (OSD) only.
1    Automatic page segmentation with OSD.
2    Automatic page segmentation, but no OSD, or OCR.
3    Fully automatic page segmentation, but no OSD. (Default)
4    Assume a single column of text of variable sizes.
5    Assume a single uniform block of vertically aligned text.
6    Assume a single uniform block of text.
7    Treat the image as a single text line.
8    Treat the image as a single word.
9    Treat the image as a single word in a circle.
10    Treat the image as a single character.
11    Sparse text. Find as much text as possible in no particular order.
12    Sparse text with OSD.
13    Raw line. Treat the image as a single text line, bypassing hacks that are Tesseract-specific.

函数说明

PSD分析函数

def image_to_data(
    image,
    lang=None,
    config='',
    nice=0,
    output_type=Output.STRING,
    timeout=0,
    pandas_config=None,
)

3.5以上版本支持，分析返回文档结构，完成PSD分析与输出。

文档角度与语言检测

def image_to_osd(
    image,
    lang='osd',
    config='',
    nice=0,
    output_type=Output.STRING,
    timeout=0,
):

OSD检测，返回文档的旋转角度与语言检测信息

代码演示部分

使用PSD实现文档结构分析

image = cv.imread("D:/images/text_xt.png")
h, w, c = image.shape

# 文档结构分析
config = ('-l chi_sim --oem 1 --psm 6')
dict = tess.image_to_data(image, config=config, output_type=tess.Output.DICT)
print(dict.keys())
print(dict['conf'])
n_boxes = len(dict['text'])

绘制所有BOX框

# 全部文档结构
text_img = np.copy(image)
for i in range(n_boxes):
    (x, y, w, h) = (dict['left'][i], dict['top'][i], dict['width'][i], dict['height'][i])
    cv.rectangle(text_img, (x, y), (x + w, y + h), (0, 255, 0), 2)
cv.imwrite('D:/layout-text1.png', text_img)

显示如下：

使用conf属性过滤小于0的BOX框

# 根据conf>0过滤之后
for i in range(n_boxes):
    if int(dict['conf'][i]) > 0:
        (x, y, w, h) = (dict['left'][i], dict['top'][i], dict['width'][i], dict['height'][i])
        cv.rectangle(image, (x, y), (x + w, y + h), (0, 255, 0), 2)
cv.imwrite('D:/layout-text2.png', image)

OSD检测文档偏斜与语言类别

# 检测倾斜角度
image = cv.imread("D:/images/text_90.png")
cv.imshow("text_90", image)
osd = tess.image_to_osd(image)
print(osd)
osd_array = osd.split("
")
angle = int(osd_array[2].split(":")[1])
conf = float(osd_array[3].split(":")[1])
print("angle: ", angle)
print("conf: ", conf)
dst = cv.rotate(image, cv.ROTATE_90_CLOCKWISE)
cv.imshow("text_90_rotate", dst)
cv.imwrite('D:/layout-text3.png', dst)

检测配置与白名单机制过滤

# 只检测数字
custom_config = r'--oem 1 --psm 6 outputbase digits'
ocr_result = tess.image_to_string(dst, config=custom_config)
print(ocr_result)

# 采用白名单方式只检测数字
custom_config = r'-c tessedit_char_whitelist=0123456789 --psm 6'
ocr_result = tess.image_to_string(dst, config=custom_config)
print("白名单方式数字检测
",ocr_result)

# 检测中文
ocr_result = tess.image_to_string(dst, lang="chi_sim")
print("
中文检测与输出:
", ocr_result.replace("f", "").split("
"))

# 检测中文情况下，只输出数字
ocr_result = tess.image_to_string(dst, lang="chi_sim", config=custom_config)
print("
中文检测+数字输出:
",ocr_result.replace("f", "").split("
"))

cv.waitKey(0)
cv.destroyAllWindows()

运行结果：

最后一个，可以看出把O检测成0了，其它OK！这个是OCR的死穴，永远分不清0跟O。最后还有一句话，Tesseract-OCR如果输入是二值图像，背景永远是白色才是正确之选！

编辑：黄飞

阅读全文

二值图像(8682) 二值图像(8682)
结构化(10262) 结构化(10262)
OCR(16103) OCR(16103)

汇编语言的结构化设计及其在俄罗斯方块中的应用

为了简化汇编语言的编写过程，本文提出了一种结构化的汇编编程思路，并以基于AT89C51芯片（以下对汇编语言的讨论针对51单片机系统）的俄罗斯方块游戏为例，来展现在51单片机中汇编语言结构化编写的优势。##俄罗斯方块的软件实现方法##实验测试与结果

2014-06-23 10:27:47

2713

Tesseract的进阶用法和最佳实践

于各个领域，如图像处理、自动化识别、人工智能等。 Tesseract 是一款开源的 OCR 引擎，最初由 HP 实验室开发，后被 Google 收购并开源。Tesseract 以其高精度和高速度而闻名，支持

2023-09-20 11:00:08

518

***结构化消息是什么？

大家好，我已阅读任何与TrustZone相关的内容，但我无法弄清楚这两个世界是如何相互沟通的。我所能找到的只是TrustZone API规范中的内容：客户端和服务可以通过两种机制进行通信：结构化

2019-03-20 08:58:16

OCR SDK开发者平台推荐：OCR图像智能字符识别技术

为了促进业内生态环境良好发展，帮助开发者更好的专注于自己的产品。想让产品实现OCR图像智能字符识别技术，看此帖!楼主吐血为大家找到一个集身份证识别，驾驶证识别，行驶证识别，银行卡识别，文档识别

2015-09-25 13:48:03

OCR微信公众号实现一号识别

微信公众账号试水商业化的消息近日引爆自媒体圈。厦门云脉公司把多年对OCR各种产品的研究成果集成于云脉OCR微信公众号中。云脉OCR公众号是首个OCR技术识别类微信公众服务号，集成了名片、文档

2014-09-09 18:11:32

结构化布线系统有哪些难题

具有不同的形式，其中一些也被定义为结构化布线的范畴，但它们不能被称为集成的结构化布线。在临时的布线系统中可以使用不同类型的布线部件来实现系统的功能，但可能需要更高的成本，并可能经常导致通信故障的发生

2016-05-19 13:46:23

结构化布线系统浸水难题解决方案

　　一年中又到夏季。这意味着降雨、雷暴、台风和洪水即将来临！在这多雨季节里，常有人向和联电子官网咨询，结构化布线系统是最容易受到水的影响而遭受损害的部分。本文着眼于浸水对数据线缆的影响和水灾中线

2016-05-15 10:55:10

结构化汇编语言的监控程序设计

技术指标,微型计算机技术答案第5章常用应用程序设计本章以51单片机为基础，主要介绍结构化汇编语言的监控程序设计思想和实时测控系统中最常用的数字滤波技术、标度变换、插值算法以及报警程序设计等。程序与程序设计...

2021-09-01 06:27:34

结构化汇编语言的监控程序设计思想

微型计算机控制技术_第五章第5章常用应用程序设计本章以51单片机为基础，主要介绍结构化汇编语言的监控程序设计思想和实时测控系统中最常用的数字滤波技术、标度变换、插值算法以及报警程序设计等。程序

2021-09-10 06:50:34

结构化程序设计和面向对象程序设计

结构化程序设计和面向对象程序设计，在接下来很长的一段时间里，我将陆续分享项目实战经验。从电源、单片机、晶体管、驱动电路、显示电路、有线通讯、无线通信、传感器、原理图设计、PCB设计、软件设计、上位机等，给新手综合学习的平台，给老司机交流的平台。所有文章来源于项目实战，属于原创。

2021-07-14 06:35:13

结构化设计分为哪几部分？结构化设计的要求有哪些

结构化设计分为哪几部分？结构化设计的要求有哪些？结构化设计主要包括哪些部分？

2021-12-23 06:15:51

CODESYS结构化文本简介与基本概念

化等操作实现工程。因此，可以在同一个设备上运行多个应用，也可以对应用进行拷贝，或者可以在一个工程中混合配置

2021-07-02 06:54:58

Codesys之结构化文本概述相关资料分享

一张简单的方法，系统的编辑器和调试器的功能是建立在高级编程语言的基础上（如Visual C++）具体来说CoDeSys就是一个编程工具，支持IEC61131-3标准协议，用于工业PLC控制。CodeSys有六种编程语言（IL,ST,FBD,LD,CFC,SFC）,而其中ST为结构化文本。...

2021-07-02 07:34:28

Deeplearningai结构化机器学习项目

Deeplearningai 结构化机器学习项目 Week2 6-10

2020-05-18 15:12:43

KGB知识图谱基于传统知识工程的突破分析

格式文件，保留文件中表格与文字格式等重要信息。对于图片信息，OCR可自动识别并抽取图片中的文字信息。2. 知识抽取：KGB知识图谱引擎，可从结构化表格与非结构化文本中自适应识别并抽取关键知识（主体

2019-10-22 15:25:56

Labview调用OCR Training.exe实现字符识别

加上/fontpath，同理图像路径之前要加上/imagespath 来进行命令的格式编辑，下方蓝色框中为已拥有*.abc训练文件的OCR Training.exe应用程序调用格式举例，橙色框为调用

2020-08-16 17:36:58

MaxCompute(ODPS)上处理非结构化数据的Best Practice

，我们收到用户许多关于优化和怎样最好的使用非结构化功能的问题。这里通过分析非结构化框架底层的一些实现原理以及我们看到的一些使用场景，提供一些关于Best Practice的总结，方便大家更有效的在

2018-05-15 12:21:06

MaxCompute与OSS非结构化数据读写互通（及图像处理实例）

MaxCompute的SQL逻辑运算，这一部分计算是基于MaxCompute内置的强大结构化SQL运算引擎，并可能产生新的Record3.运算过后的Record中再传递给用户自定义的Output逻辑，用户

2018-03-30 11:51:18

MaxCompute读取分析OSS非结构化数据的实践经验总结

字节数，向前或向后寻找换行符，来保证最终的切分点落在一整条记录的尾部。具体的实现细节相对来讲比较复杂，可以参考在《访问 OSS 非结构化数据》文档中提到的代码示例来进行分析。注意点在计算字节数的过程中

2018-06-20 15:01:09

NLPIR在文本信息提取方面的优势介绍

可自动识别并抽取图片中的文字信息。2、对结构化表格数据知识抽取KGB能够自适应解读并抽取结构化表格数据，实现知识的快速生成。3、对非结构化文档知识抽取KGB知识规则引擎，能够快速定位非结构化文档中

2019-09-12 15:33:03

NLPIR大数据知识图谱完美展现文本数据内容

)是基于自然语言理解、汉语词法分析，采用KGB语法从结构化数据与非结构化文档中抽取各类知识，大数据语义智能分析与知识推理，深度挖掘知识关联，实时高效构建知识图谱。　　KGB知识图谱引擎功能介绍　　一、文档

2019-07-01 11:40:17

OpenHarmony集成OCR三方库实现文字提取

具体的实现；Native层使用了三方库Tesseract提供具体的实现功能。5. 源码分析本样例源码的分析主要涉及到两个方面，一方面是N-API接口的实现，另一方面是应用层的页面布局和业务逻辑

2022-11-15 12:09:50

Python爬虫初学者需要准备什么？

解析网页，便于抽取数据。2.了解非结构化数据的存储爬虫抓取的数据结构复杂传统的结构化数据库可能并不是特别适合我们使用。我们前期推荐使用MongoDB 就可以。3. 掌握一些常用的反爬虫技巧使用代理IP池

2018-06-20 17:14:15

SDRAM文件结构存储控制的FPGA实现

帧结构，缓存系统的设计需要保存原始采样数据并能够实现数据的重组帧，以满足不同处理需求。针对以上问题，本文提出了一种基于文件结构存储方式的数据缓存系统，该系统利用FPGA设计结构化状态机实现对SDRAM的控制，完成了对数据的缓存与重组帧，具有速度快、可靠性高、灵活性强和功能可扩展等优点。

2012-08-13 10:40:40

c程序的结构化组织是什么

，提高软件的稳定性。通常情况下,软件项目采用层次化结构和模块化开发的方法,例如,一个嵌入式软件项目可能有驱动层,操作系统层,功能层,应用程序层,每一个层使用它的下层提供的接口,并为它的上层提供调用接口

2020-06-16 04:35:07

linux的tesseract-ocr安装

1. 在ubuntu下可以自动安装sudo apt-get install tesseract-ocr

2019-07-15 06:40:06

【KV260视觉入门套件试用体验】七、VITis AI字符和文本检测（OCR&Textmountain）

视觉领域的重要问题，主要是识别和理解图像或视频中的文字信息。字符检测和识别（OCR）技术最早在1929年由德国科学家Tausheck提出，定义为将印刷体的字符从纸质文档中识别出来。随着OCR技术的日益

2023-09-26 16:31:59

一种结构化道路环境中的视觉导航系统详解

根据结构化道路环境的特点提出了一种将边沿检测和道路环境知识相结合的机器视觉算法 , 并结合基于行为响应的路径规划方法和智能预瞄控制方法 , 实现了一套基本的机器人视觉导航系统 . 在自主机器人实验

2023-09-25 07:23:39

基于结构化平均感知机的分词器Java实现

1.6以上版本开源，文档位于项目wiki中，欢迎使用！【hanlp1.7新版本已经发布，可以去新版本查到看使用】结构化预测关于结构化预测和非结构化预测的区别一张讲义说明如下：更多知识请参考Neubig

2019-01-14 11:15:41

基于Feder的IVF_FLAT可视化设计实现

1、向量数据库是如何检索的？　　Embedding是分析非结构化数据的重要方式，当我们将图片、声音编码为向量后，这些数据依旧能够保留原始数据（图片、声音等）的详细信息。然而，我们很难直接对这些编码后

2022-10-12 14:25:43

如何使用arm汇编指令去实现一种结构化编程呢？

如何使用arm汇编指令去实现一种结构化编程呢？有哪位大神可以解答一下吗

2022-11-09 15:18:11

对与性能比较低的51单片机，结构化编程性能提升多少？

对与性能比较低的51单片机，结构化编程性能提升多少

2023-10-26 06:21:44

怎么实现基于结构化方法的无线传感器网络设计？

怎么实现基于结构化方法的无线传感器网络设计？

2021-05-31 06:34:16

教你如何走捷径，OCR SDK开发者平台开放API接口

、文档、名片等，所有的这些识别功能为社会多个行业进行无纸化办公、移动办公等新的办公模式提供了可能、提高了效率。上述所提到的所有的OCR技术，OCR SDK开发者平台都能为大家提供成熟的OCR SDK接入

2015-09-22 17:21:16

用C语言的结构体实现字节、位操作

用C语言的结构体实现字节、位操作结构化程序设计是编写清晰、正确和易于修改的程序。而对于大多数编程人员来说，结构化程序设计是十分重要的，当然结构化程序设计的清晰、正确和易于维护也是每一个编程人员所希望

2009-09-21 09:25:25

白光LED结构化涂层制备及其应用研究

不同工艺参数研究其对聚合物最终成形形貌的影响，实现对成形结构的有效调节。在结构电极诱导中探究结构化电场中聚合物的成形规律及电极电压、聚合物初始膜厚、电极间距等工艺参数对成形结构形貌轮廓的影响规律

2022-03-29 15:44:41

研发干货丨基于OK3399-C平台android系统下实现图像识别

/rk3399/RK3399_SSD_Android&Linux_V1.0_20180522.pdfhttps://github.com/tesseract-ocr/tesseract.githttps://github.com/tensorflow/tensorflow.git

2021-02-07 08:46:10

请问如何借助SC Express减少结构化测试次数？

如何借助SC Express减少结构化测试次数？

2021-05-11 06:46:56

阿里OCR接口记录

OCR调用文档中需要传入BASE64,感谢Apache

2019-08-08 07:48:51

首发 | 告别手动录入，开放平台OCR上线印刷文字识别！

位置。而将这些文本录入也一直耗费着大量的时间和人力。如何高效处理海量非结构化数据，使它们能快速转化为计算机可处理的数据，方便进一步数据库采集、管理、分析和决策，已成为下阶段的行业大方向。作为处理图片文字

2018-05-17 15:18:23

结构化综合布线技术

结构化综合布线实质就是指建筑物或建筑群内所安装的传输线路.

2010-06-09 14:33:05

什么是OCR

什么是OCR OCR的英文全称： OCR是英文Optical Character Recognition的缩写，意思是光学字符识别，也可简单地称为文字识别，是文字自动输入的一种方法。它通过扫描和摄像

2009-04-10 12:55:05

5458

ISSP结构化ASIC解决方案

ISSP结构化ASIC解决方案 结构化专用集成电路(structured ASIC)对设计工程师而言还是一个新名词，然而目前已经有多家公司正计划涉足这一领域。快速硅

2009-12-27 13:32:40

1174

结构化布线的综合说明

结构化布线的综合说明一、结构化布线系统简介随着计算机和通信技术的飞速发展,网络应用

2010-04-14 17:16:05

605

结构化综合布线系统的问题分析

,智能大楼的出现为传统的建筑注入了全新的概念,并成为现代建筑发展的方向,而结构化的布线">综合布线系统是实现大楼智能化的基础和先决条件。

2011-02-22 10:46:51

1804

工业洗涤设备结构化编程方式

本内容介绍了工业洗涤设备结构化编程方式

2011-06-16 15:54:51

探究最佳的结构化ASIC设计方法

由于与深亚微米标准单元ASIC相关的非重复性工程费用（NRE）越来越大，设计周期又很长，因此利用结构化ASIC进行定制IC设计的吸引力正变得越来越大。结构化ASIC能以极具竞争力的单位成

2012-05-02 10:39:19

1655

输液袋喷码OCR字符检测# 机器视觉# OCR识别# 自动化检测# 喷码字符检测

OCR

fuweizn发布于 2023-04-17 15:53:01

基于zed的tesseract移植过程记录

于是今天就打算把这个软件移植到Zynq上，在PC上之前就已经成功安装了tesseract了，并且利用自带的测试图片试了下，没问题。

2017-02-10 18:50:31

1427

利用状态机的状态机实现层次结构化设计

练习九.利用状态机的嵌套实现层次结构化设计目的：１.运用主状态机与子状态机产生层次化的逻辑设计；

2017-02-11 05:52:50

3126

非结构化P2P资源搜索策略研究_杨正华

非结构化P2P资源搜索策略研究_杨正华

2017-03-19 11:30:43

pytesseract简要解析

、Image、tesseract-ocr，然后： pip install pytesseract pytesseract在官网上说了自己是个wrapper，真正干活的是tesseract-ocr

2017-10-11 14:14:23

软件工程中结构化设计方法探究

设计、程序设计之前，必须先确定软件总体结构。软件总体结构设计的方法主要有结构化设计、面向数据结构的设计和面向对象的设计，其中结构化设计方法是应用最广泛的一种，它是建立良好程序结构的方法，提出了衡量模块质量的标准是高

2017-10-19 14:38:54

MCS-51系列单片机结构化程序设计实现方法

中，实现隔离的方法是将处理特定任务的指令和数据设计成子程序或中断服务子程序。这些子程序或中断服务子程序称作功能模块，其具有确定功能，处理特定任务，解决专门问题。在MCS-51系列单片机结构化程序设计时，按照总体规划和总体设计，由若干软件设

2017-10-30 10:10:28

改进区域生长的非结构化道路识别

针对智能车辆在非结构化道路识别中需要采用众多的特征参数，增加了特征融合识别难度与计算复杂度，并且部分背景与道路区域存在相似性会产生道路识别的误分、误判的问题，提出了一种基于主成分分析的支持向量

2017-12-01 14:59:18

中文商品属性结构化方法

从非结构化商品描述文本中抽取结构化属性信息，对于电子商务实现商品的对比与推荐及用户需求预测等功能具有重要意义．现有结构化方法大多采用监督或半监督的分类方法抽取属性值与属性名，通过文法分析器分析

2018-01-02 15:58:42

什么叫结构化的算法_算法和结构化数据初识

结构化算法是由一些基本结构顺序组成的，就是把一个大的功能的实现分隔为许多个小功能的实现。在基本结构之间不存在向前或向后的跳转，流程的转移只存在于一个基本的结构范围内。一个非结构化的算法可以用一个等价的结构化算法代替，其功能不变。这样的好处是可以将复杂问题简单化，让编程更容易，提高代码维护和可读性。

2018-01-03 16:09:37

11532

三菱Q系列PLC编程手册（结构化文本篇）

Q系列PLC编程手册（结构化文本篇）

2018-03-07 18:00:00

东方网力“天眼”结构化一体机实现实时视频流结构化分析

东方网力“天眼”结构化一体机可以实现实时视频流结构化分析，并基于结构化分析结果进行告警、检索和挖掘等功能，还可以针对离线视频文件上传并结构化分析，基于分析结果进行大数据分析、检索等。所以，该一体机也可单机部署应用。单机应用模式架构涉及的设备主要包括结构化一体机、IPC或NVR等。

2018-08-14 17:34:33

5096

什么是视频结构化，又能做些什么？

　利用CPU+GPU协同计算能力实现资源动态调配，采用先进的智能分析技术，自动提取实时或离线的视频图像中的车辆、行人、非机动车细节特征信息，对目标类型、颜色等属性特征进行结构化，为事前、事中、事后的事件布防、综合布控、研判分析提供数据基础，保证信息查找检索的高效性，提高公安视频的应用效率。

2018-09-04 10:44:00

10387

结构化布线系统的四点注意事项

布线系统结构化 结构化布线 title=结构化布线结构化布线 title=结构化布线结构化布线系统网络有至少15年的使用寿命，因此网络的运营成本和升级成本将等于或超过最初的投资金额。

2018-10-16 10:52:00

1093

如何使用西门子结构化文本编程

下面，我就结合自己的一些使用经验介绍一下如何使用结构化文本编程。

2019-08-04 08:29:00

9314

视频结构化技术在智慧交通领域有什么可以应用的

视频结构化描述既是海量视频实现信息化、情报化转化行之有效的技术，也是当前公共安全领域中对视频结构化处理的一个指向性方案。

2019-10-28 16:07:54

961

海量非结构化数据存储难题，杉岩数据对象存储完美解决

过去几年，大数据产业更多关注的是如何处理海量、多源和异构的数据，但我们必须承认这些只是冰山一角。目前，结构化数据仅占到全部数据量的20%，其余80%都是以文件形式存在的非结构化和半结构化数据。伴随

2020-03-15 17:22:00

1025

安防监控视频结构化那些事儿

即便不考虑各个监控系统之间的信息关联，光浏览这些视频就需要花费大量的人力物力。解决这一问题的核心技术即视频结构化描述技术，将海量视频或图片的非结构化数据提取并转化为结构化信息描述。

2020-03-20 10:20:50

2986

西门子PLC教程之结构化编程的详细资料说明

本文档的主要内容详细介绍的是西门子PLC教程之结构化编程的详细资料说明。

2020-03-25 16:39:00

视频结构化怎样实现突破

视频结构化技术是一种把视频画面声音、转化为人和机器可以理解的信息的技术，目前主要应用于安防、交通领域，可以检测车流、人流，甚至锁定某个人，某辆车。

2020-04-03 10:39:11

790

结构化道路环境中的视觉导航系统的设计与实现

根据结构化道路环境的特点提出了一种将边沿检测和道路环境知识相结合的机器视觉算法并结合基于行为响应的路径规划方法和智能预瞄控制方法实现了一套基本的机器人视觉导航系统。在自主机器人实验平台ATRV2上的实验结果表明，该视觉导航系统能够实时理解结构化道路环境，并且能够控制机器人沿着合理路径行驶。

2020-07-06 14:54:58

使用贝叶斯决策和Hough实现非结构化道路检测与障碍物识别算法

为了实现非结构化道路检測与障碍物的识别，提出了一种基于最小错误率贝叶斯决策与 Hough变换相结合的非结构化道路检测与障碍物识别算法。算法首先将Otsu多阈值理论引入到最小错误率贝叶斯决策中并进

2020-07-06 17:45:58

使用数字识别和AI实现OCR的资料合集

本文档的主要内容详细介绍的是使用数字识别和AI实现OCR的资料合集。

2020-07-17 08:00:00

怎么样使用机器视觉技术和支持向量机实现非结构化道路的检测

机器视觉检测非结构化道路边缘的难点在于路面像素与非路面像素特征差异复杂。使用支持向量机分类算法实现了非结构化道路的边缘检测。算法引入感兴趣区域来消除环境噪声，并通过交叉验证方法优化了算法参数。最后在支持向量机的分类结果上使用霍夫变换提取道路边缘。 Matlab实验证明算法具有很好的准确性和鲁棒性。

2020-08-27 14:30:00

FPGA模块化设计与AlteraHardCopy结构化ASIC

本文档的主要内容详细介绍的是FPGA模块化设计与AlteraHardCopy结构化ASIC。

2021-01-20 17:03:51

汇编语言结构化设计程序教程

汇编语言结构化设计程序教程说明。

2021-03-26 09:38:56

如何使用FPGA实现结构化LDPC码的高速编译码器

结构化LDPC码可进行相应扩展通过对编译码算法，优化编译码结构进行调整，降低了编译码嚣硬件实现中的关键路径迟延，并采用Xilinx公司的Virtex一4 VLX80 FPGA芯片实现了一个码长10 240，码率1／2的非正则结构化LDPC码编码器和译码器。实现结果表明：该编码器信息吞吐量为1．878 Gb／

2021-03-26 15:58:00