news 2026/4/16 18:54:56

在大模型班学算法的笔记记录-形态学

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
在大模型班学算法的笔记记录-形态学

形态学操作是OpenCV中处理二值图像的核心手段,常用于目标检测、图像降噪、轮廓提取等场景

一、核心流程:从原图到二值化

形态学操作的前提是得到干净的二值图像,核心步骤为:灰度图 → 低通滤波 → 二值化

1. 灰度图转换

彩色图像需先转为灰度图(单通道),减少计算量,聚焦像素亮度信息:

import cv2 import numpy as np # 读取灰度图(参数0表示灰度模式) path = r"/Users/yangjunhui/Desktop/lenaNoise.png" img = cv2.imread(path, 0)

2. 低通滤波:去除噪声

原始图像可能存在椒盐噪声,用高斯滤波(低通滤波的一种)平滑图像,保留主体的同时弱化噪点:

# 高斯滤波:(5,5)为滤波核尺寸,0为标准差(自动计算) blur = cv2.GaussianBlur(img,(5,5),0)

作用:模糊图像边缘,减少后续二值化的噪点干扰。

3. 二值化:黑白分离

将灰度图转为仅含0(黑)、255(白)的二值图像,突出目标区域:

# 二值化:阈值35,超过则设为255(白),否则0(黑) ret, ths1_img = cv2.threshold(blur, 35, 255, cv2.THRESH_BINARY)

关键:阈值需根据图像调整,目标是让主体为白色,背景为黑色。

二、形态学核心操作:腐蚀与膨胀

二值化后,通过腐蚀/膨胀调整目标区域的形态,解决“毛刺”“孔洞”等问题。

1. 先搞懂:形态学核(Kernel)

操作的“工具”是卷积核,决定腐蚀/膨胀的范围和形状:

# 自定义3×3全1核(常用尺寸,可根据需求调整为5×5、7×7等) kernel = np.ones((3,3), np.uint8)
  • np.ones((3,3)):生成3行3列全1矩阵,代表以当前像素为中心,覆盖周围8个像素;
  • np.uint8:像素值专用类型(0-255),保证计算兼容。

OpenCV也提供预设核(无需手动定义):

# 矩形核(默认) kernel_rect = cv2.getStructuringElement(cv2.MORPH_RECT, (5,5)) # 椭圆核(更贴合圆形目标) kernel_ellipse = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (5,5))

2. 腐蚀(Erosion):去毛刺、瘦化目标

原理

用核扫描每个像素,仅当核覆盖的所有像素都是白色(255)时,中心像素才保留白色,否则设为黑色

代码实现

# 腐蚀操作:迭代1次(次数越多,腐蚀越强) erosion_img = cv2.erode(ths1_img, kernel, iterations = 1) # 显示结果(自定义显示函数) def show(img, title=''): cv2.imshow(title, img) cv2.waitKey(0) show(erosion_img, '腐蚀后')

效果

  • 白色前景区域“收缩”,边缘被侵蚀,细小花絮/毛刺(噪点)被消除;
  • 孤立的白色小噪点(如单个像素)会被完全去掉;
  • 目标区域之间的窄连接可能被断开。

适用场景:去除二值图中的白色噪点、细化目标边缘。

3. 膨胀(Dilation):填孔洞、加粗目标

原理

与腐蚀相反,核扫描时只要覆盖区域内有至少一个白色像素,中心像素就设为白色

代码实现

# 膨胀操作:迭代1次 dilate_img = cv2.dilate(ths1_img, kernel, iterations=1) show(dilate_img, '膨胀后')

效果

  • 白色前景区域“扩张”,细小孔洞/断裂处被填充;
  • 目标边缘变粗,孤立的黑色小噪点被覆盖;
  • 断裂的线条可被重新连接。

适用场景:填补目标区域的黑色孔洞、连接断裂的轮廓。

4. 拓展:形态学梯度

通过“膨胀-腐蚀”“膨胀-原图”或“原图-腐蚀”,可提取目标的边缘像素,得到空心轮廓效果,常用于轮廓检测。

四、完整实战代码

import cv2 import numpy as np # 自定义显示函数 def show(img, title=''): cv2.imshow(title, img) cv2.waitKey(0) cv2.destroyWindow(title) # 关闭窗口,避免占用内存 # 1. 读取灰度图 path = r"/Users/yangjunhui/Desktop/lenaNoise.png" img = cv2.imread(path, 0) show(img, '原始灰度图') # 2. 高斯滤波降噪 blur = cv2.GaussianBlur(img, (5,5), 0) show(blur, '高斯滤波后') # 3. 二值化 ret, ths1_img = cv2.threshold(blur, 35, 255, cv2.THRESH_BINARY) show(ths1_img, '二值化后') # 4. 定义形态学核 kernel = np.ones((3,3), np.uint8) # 5. 腐蚀操作 erosion_img = cv2.erode(ths1_img, kernel, iterations=1) show(erosion_img, '腐蚀后') # 6. 膨胀操作 dilate_img = cv2.dilate(ths1_img, kernel, iterations=1) show(dilate_img, '膨胀后')

五、总结

操作核心效果适用场景
腐蚀去毛刺、瘦化目标消除白色噪点、细化边缘
膨胀填孔洞、加粗目标填补黑色孔洞、连接断裂轮廓
梯度提取边缘、生成空心轮廓目标轮廓检测

形态学操作的关键是“先腐蚀去噪,再膨胀修复”(开运算),或“先膨胀填洞,再腐蚀还原”(闭运算),灵活组合可解决大部分二值图处理问题。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 9:24:49

java后端工程师+AI大模型开发进修ing(研一版‖day63)

今日总结 java随笔录——什么是聚簇索引,什么是非聚簇索引?什么是覆盖索引?AI随探录——NLP中RNN到Attention机制的演进代码随想录——n皇后,贪心算法—分发饼干 目录 今日总结 详细内容 java随笔录 1、什么是聚簇索引&#x…

作者头像 李华
网站建设 2026/4/16 9:21:39

【TypeScript全栈开发指南:从入门到企业级应用实战-web技术栈】

一、TypeScript的价值与优势 1.1 为什么选择TypeScript? 在现代Web开发中,TypeScript已经成为JavaScript的强力替代品。它不仅保持了JavaScript的灵活性,还提供了静态类型检查的安全性: 类型安全:编译时发现错误&am…

作者头像 李华
网站建设 2026/4/16 9:21:53

C语言实现memcpy函数功能(附带源码)

一、项目背景详细介绍在C语言标准库中,memcpy 是一个极其基础但又极其重要的内存操作函数,用于将一段内存的数据复制到另一段内存中。它不关心数据类型,也不关心数据内容的含义,只负责按字节进行拷贝。memcpy 被广泛应用于以下场景…

作者头像 李华
网站建设 2026/4/16 9:20:40

说说线程的生命周期和状态

在Java中,线程的生命周期和状态是由java.lang.Thread.State枚举定义的。 目录NEW(新建)RUNNABLE(可运行)BLOCKED(阻塞)WAITING(等待)TIMED_WAITING(超时等待&…

作者头像 李华
网站建设 2026/4/16 9:20:04

性能测试怎么做?看完这篇文章你就懂了

性能测试流程介绍: 01 流程一 — 问清性能测试需求 1、新系统能力验证 2、明确客户需求 3、找出系统性能瓶颈 4、稳定性验证(强度测试) 02 流程二 — 了解系统结构 系统架构对于测试新手来是最难的;先来了解系统所使用的技…

作者头像 李华