如何使人工系统从图像或多维数据中“感知”-德赢Vwin官网网

一、什么是计算机视觉

计算机视觉是一门研究如何使机器“看”的科学，更进一步的说，就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所指的信息指Shannon定义的，可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提取信息，所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。

视觉是各个应用领域，如制造业、检验、文档分析、医疗诊断，和军事等领域中各种智能/自主系统中不可分割的一部分。由于它的重要性，一些先进国家，例如美国把对计算机视觉的研究列为对经济和科学有广泛影响的科学和工程中的重大基本问题，即所谓的重大挑战（grand challenge）。

计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。机器视觉需要图象信号，纹理和颜色建模，几何处理和推理，以及物体建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起。

我们目前如果是在校学生，对于计算机视觉和机器学习的相关知识的学习是非常有用的，无论是对于自己的工作前景还是相关论文的撰写都是非常有用的，而且目前对于计算机的相关知识已经设计到了各个专业领域，其中包括医学领域（计算机视觉分析CT成像）、电学领域（使用matlab及相关领域画图）、人脸识别和车牌识别等等。而且有想要做交叉学科的对于计算机可以和任意领域及进行无障碍交叉。

由于我这个理工男的语文功底并不好，语言组织能力不强，所以我们今天就啰嗦到这里，总结一下就是计算机视觉及机器学习等和计算机相关的东西特别重要！

二、图片处理基础操作

首先我们来看一段简单的计算机视觉相关代码：

import cv2img=cv2.imread（‘path’）#path指图片相关路径cv2.imshow（‘Demo’，img）cv2.nameWindow（‘Demo’）cv2.waitKey（0）cv2.destroyAllWindows（）

这段代码就可以在计算机中显示出img的相关图像。接下来我们讲解一下每一步的相关操作。

图片处理：读入图像

相关函数：image=cv2.imread（文件名相关路径［显示控制参数］）

文件名：完整的路径。

其中参数包括：

cv.IMREAD_UNCHANGED ：表示和原图像一致

cv.IMREAD_GRAYSCALE ：表示将原图像转化为灰色图像。

cv.IMREAD_COLOR：表示将原图像转化为彩色图像。

例如：

cv2.imread（‘d:image.jpg’，cv.IMREAD_UNCHANGED）

图片处理：显示图像

相关函数：None=cv2.imshow（窗口名，图像名）例如：

cv2.imshow（“demo”，image）但是在OpenCV中我们图像显示还是要加上相关约束：

retval=cv2.waitKey（［delay］）如果没有这个限制，那么显示的图像就会一闪而过，就会发生错误。其中delay参数包括：dealy=0，无限等待图像显示，直到关闭。也是waitKey的默认数值。delay《0，等待键盘点击结束图像显示，也就是说当我们敲击键盘的时候，图像结束显示。delay》0，等待delay毫秒后结束图像显示。最后我们还需要显示

cv2.destroyAllWindows（）

把图像从内存中彻底删除。

图片处理：图像保存

相关函数：retval=cv2.imwrite（文件地址，文件名）

例如

cv2.imwrite（‘D:test.jpg’，img）

将img保存到了路径D： est.jpg

三、图像处理入门基础

图像成像原理介绍

首先我们第一个要深深深深的刻在脑子里的概念就是：

——图片是由像素点构成的生动一点表示就是这样：

这样就可以完美的展示出计算机图像的成像原理，就是用一个个有颜色的像素点拼接而成的。

图像分类

图像一般分为三类：

一、二值图像

二值图像表示的意思就是每一个像素点只由0和1构成，0表示黑色，1表示白色，而且这里的黑色和白色是纯黑和纯白。所以我们看到的图像也就是这个样子。

二、灰度图像

灰度图像就是一个8位的位图。什么意思呢？就是说00000001一直到11111111，这就是二进制表示。如果表示成我们常用的十进制就是0-255。其中0就表示纯黑色，255就表示纯白色，中间就是处于纯黑色到纯白色的相关颜色。

灰度图像一块像素点：

三、彩色图像（RGB）计算机中所有的颜色都可以由R（红色通道）、G（绿色通道）、B（蓝色通道）来组成，其中每一个通道都有0-255个像素颜色组成。比如说R=234，G=252，B=4就表示黄色。显示出来的也是黄色。所以说彩色图像由三个面构成，分别对应R，G，B。

所以说我们就可以知道复杂程度排序的话就是：彩色图像-灰度图像-二值图像。所以我们在进行人脸项目或者是车牌识别项目中最最最常用的操作就是将彩色图像转化为灰度图像，然后将灰度图像转为最简单的二值图像。

四、像素处理操作

读取像素

相关函数：返回值=图像（位置参数）我们先以灰度图像，返回灰度值：

p=img［88，142］print§

这里我们就可以返回图片坐标［88，142］处的灰度值。然后我们以彩色图像为例子：我们知道彩色图像由BGR三个通道的值构成。那么我们需要返回三个数值：

blue=img［78，125，0］green=img［78，125，1］red=img［78，125，2］print（blue，green，red）

这样我们就返回了这三个数值。

修改像素

直接暴力修改。对于灰度图像， img［88，99］=255对于彩色图像，img［88，99，0］=255img］［88，99，1］=255img［88，99，2］=255这里也可以写成img［88，99］=［255，255，255］等同于上方。改动多个像素点例如还是以彩色图像为例子：

i［100：150，100：150］=［255，255，255］

意思也就是将图像横坐标100到150和纵坐标100到150的这个区间全部用白色替代。

使用python中的numpy修改像素点

读取像素 相关函数：返回值=图像.item（位置参数）我们以灰度图像为例： o=img,item(88，142) print(o) 对于彩色图像我们还是： blue=img.item(88，142，0) green=img.item(88，142，1) red=img.item(88，142，2) 然后print(blue，green，red) 修改像素图像名.itemset（位置，新的数值）我们以灰度图像为例子： img.itemset((88，99)，255) 对于BGR图像： img.itemset((88，99，0)，255) img.itemset((88，99，1)，255) img.itemset((88，99，2)，255)

import cv2import numpy as np i=cv2.imread('path',cv2.IMREAD_UNCHANGED)print(i.item(100，100))i.itemset((100，100),255)print(i,item(100，100))

通过这段代码我们就可以看得出来像素的更改。对于彩色图像也是一样。

五、获取图像属性

形状

shape可以获取图像的形状，返回值包含行数、列数通道数的元组。灰度图像返回行数列数彩色图像返回行数、列数、通道数。

import cv2img1=cv2.imread('灰度图像')print(img1.shape)

像素数目

size可以获取图像的像素数目。灰度图像：行数列数彩色图像：行数列数*通道数

图像类型

dtype返回的是图像的数据类型

import cv2img=cv2.imread('图像名称')print(img.dtype)

六、图像ROI

ROI（region of interest）表示感兴趣区域

从被处理的图像中以方框、圆、椭圆或者不规则多边形等方式勾勒出需要处理的区域。
可以通过各种算子（operator）和函数来求ROI，并进行下一步操作。

import cv2import numpy as npa=cv2.imread('path')b=np.ones((101，101，3))b=a[220:400,250:350]a[0:101,0:101]=bcv2.imshow('o',a)cv2.waitKey()cv2.destroyAllWindows()

我们还可以将感兴趣的图像加入到别的图像当中。

七、通道的拆分与合并

拆分

import cv2img=cv2.imread('图像名')b = img[ : , : , 0 ]g = img[ : , : , 1 ]r = img[ : , : , 2 ] 我们在OpenCV中有专门拆分通道的函数： cv2.split(img)

import cv2import numpy as npa=cv2.imread("imagelenacolor.png")b,g,r=cv2.split(a)cv2.imshow("B",b)cv2.imshow("G",g)cv2.imshow("R",r)cv2.waitKey()cv2.destroyAllWindows()合并

import cv2import numpy as npa=cv2.imread("imagelenacolor.png")b,g,r=cv2.split(a)m=cv2.merge([b,g,r])cv2.imshow("merge",m)cv2.waitKey()cv2.destroyAllWindows() 审核编辑：郭婷

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器视觉

机器视觉

+关注

关注
161

文章
4369

浏览量
120272
人工智能

人工智能

+关注

关注
1791

文章
47182

浏览量
238195

原文标题：【光电智造】计算机视觉及其图像处理操作

文章出处：【微信号：今日光电，微信公众号：今日光电】欢迎添加关注！文章转载请注明出处。

超简单的计算机视觉书推荐

如何使人工系统从图像或多维

发表于 07-01 10:28 •3424次阅读

未来已来，多传感器融合感知是自动驾驶破局的关键

的信息，将感知系统的感知维度扩展以实现多维度（多模态）感知目标的完整信息。如下图示例，芯片将摄像头图像

发表于 04-11 10:26

FPGA在人工智能中的应用有哪些？

，FPGA可以快速调整其硬件结构以适应新的算法，而无需更换整个硬件系统。二、云计算加速FPGA也被广泛应用于云计算领域，用于加速各种网络功能，如数据包的控制、分类和改写等。这样可以提供更快速、稳定

发表于 07-29 17:05

基于SoPC的自感知运动图像采集系统设计

卡或硬盘中，而在SoPC系统直接实现SD卡的图像采集数据文件存储在国内还未见报道。　　另外还提出了一种新的适合在FPGA硬件实现的快速运动检

发表于 11-01 17:21

全高级驾驶员的感知系统

道路安全从摩尔定律中受益良多，处理能力的提升以及 CMOS 图像传感器 (CIS) 和其他传感器技术的发展，让车辆制造商得以推出高级驾驶员感知系统

发表于 05-13 08:12

通过深度学习提高和发展车辆感知

自动泊车辅助、自动紧急制动、车道保持辅助、驾驶员疲劳警报等。基于摄像头的感知功能在当今的车辆中至关重要。感知系统的功能与人体具有很强的相似性：摄像头

发表于 11-10 08:09

基于SoPC的自感知运动图像采集系统设计

基于SoPC的自感知运动图像采集系统设计　引言　　近年来，嵌入式图像采集技术得到快速发展，但由于嵌入式系统的处理、传输和存储

发表于 11-25 11:02 •935次阅读

多维数据集是什么

使用多维数据集向导，可以在 SQL Server 2005 中轻松定义简单的多维数据集。该向导可以帮助您为

发表于 02-24 10:48 •9640次阅读

计算机视觉是什么

是从感官信号中提取信息，所以计算机视觉也可以看作是研究如何使人工系统从图像

发表于 12-08 09:24 •2.1w次阅读

计算机视觉原理分析及其应用

是从感官信号中提取信息，所以计算机视觉也可以看作是研究如何使人工系统从图像

发表于 07-30 16:50 •8563次阅读

用于计算机视觉训练的图像数据集

计算机视觉使计算机能够理解图像和视频的内容。计算机视觉的目标是使人类视觉系统可以实现任务自动化。计算机视觉任务包括图像采集、

发表于 12-31 09:33 •2339次阅读

用于计算机视觉训练的图像数据集

计算机视觉使计算机能够理解图像和视频的内容。计算机视觉的目标是使人类视觉系统可以实现任务自动化。计算机视觉任务包括图像采集、

发表于 02-12 16:13 •1393次阅读

机器学习和计算机视觉的前20个图像数据集

计算机视觉使计算机能够理解图像和视频的内容。计算机视觉的目标是使人类视觉系统可以实现任务自动化。计算机视觉任务包括图像采集、

发表于 01-28 07:40 •5次下载

计算机视觉中的立体视觉和深度感知Python示例实现

在人工智能和图像处理的迷人世界中，这些概念在使机器能够像我们的眼睛一样感知我们周围的三维世界中起

发表于 11-21 10:50 •630次阅读

智能感知系统的组成主要包含哪些

智能感知系统是一种利用人工智能技术和感知技术，通过感知环境中的信息并对其进行处理和分析的

发表于 12-01 15:26 •4745次阅读

搜索历史

如何使人工系统从图像或多维数据中“感知”

评论

超简单的计算机视觉书推荐

未来已来，多传感器融合感知是自动驾驶破局的关键

FPGA在人工智能中的应用有哪些？

基于SoPC的自感知运动图像采集系统设计

全高级驾驶员的感知系统

通过深度学习提高和发展车辆感知

基于SoPC的自感知运动图像采集系统设计

多维数据集是什么

计算机视觉是什么

计算机视觉原理分析及其应用

用于计算机视觉训练的图像数据集

用于计算机视觉训练的图像数据集

机器学习和计算机视觉的前20个图像数据集

计算机视觉中的立体视觉和深度感知Python示例实现

智能感知系统的组成主要包含哪些