机器视觉基础:从图像处理到人工智能,全面解析目标检测与图像增强技术
基本概念机器视觉主要涉及数字图像处理、计算机视觉、人工智能;主要解决问题:目标检测、目标计数、缺陷检测、图像增强、图像变换、图像压缩等。
语义分割:这里的语义不是语言的意思,而是指图像的像素
分辨率、灰度级、坐标系、像素空间关系(8邻4邻)
彩色图像:RGC、HSV(色调、饱和度、亮度)、YCBCR、CMYK
二元化
方法:全局对偶法、最小误判概率法、大足法(类内差异最小、类内差异最大)、局部自适应对偶法
连通域标记:等价表法(遍历4个邻居并标记两次)、种子填充法
图片格式
https://img2.baidu.com/it/u=2090418654,3616669462&fm=253&fmt=JPEG&app=138&f=JPEG?w=650&h=406
基本操作包括膨胀(恢复连通性)、腐蚀(去除噪声)、开运算(先腐蚀再膨胀)、闭计算(先膨胀再腐蚀)、顶帽操作:原图灰度运算结果(消除背景光衰)不消除背景的光线均匀现象,保留比周围环境亮的像素)和底盖操作:Asxia封闭运输结果-原始图片(保留比周围环境暗的像素)等。
空间过滤器
目的:去除高频噪声和干扰,以及图像边缘增强、线性增强
语音应用:均值滤波、平滑度(高斯分布加权)、中值滤波
噪声:盐和盐噪声通常使用中值滤波器降噪,Gauz噪声通常使用平滑滤波降噪
常用的卷积成因:、Sobel (高斯分布的平滑卷积)、算子(通过图像的二阶得到边缘信息,可以得到边缘信息)、Canny算子(最常见的边缘检测算子已经解决)很好地解决了伪边缘问题,主要步骤如下: • 高斯卷积降噪 • 计算图像的一阶微分、方向和幅度值。 -大值抑制•双阈值处理)
几何变换
比例、旋转、对称、错位、平移、模仿(无特征线特征,平行线的平行线不变)和投影(仍保持点线特征,平行线可能不再平行)、整体缩放放大
https://img2.baidu.com/it/u=2787136986,155919156&fm=253&fmt=JPEG&app=138&f=JPEG?w=578&h=346
插入算法:最近邻插值法、对偶线性插值法(线性)、对偶三插值法(拟合曲线)
图像特征
颜色、形状、纹理、角点、SIFT(不变特征变换的尺度,特征点的描述方法)、HOG(方向梯度直方图,某一区域的特征向量的描述方法)
角度检测算法的基本思想是使用固定窗口(取一个像素的邻居窗口)在图像中任意方向滑动。比较滑动前后的两种情况。如果在任意方向上有滑动,都有较大的灰度变化,那么我们就可以认为窗口中存在一个角度点。
频域处理
包含的信息频率从低到高:轮廓、(边缘、线条、纹理)、噪声
应用于缺陷检测、图像修复等。
页:
[1]