news 2026/4/16 9:09:09

基于SHAP可解释性AI的支持向量机和K近邻工业轴承故障诊断特征贡献分析(Python,jupyter nootbook文件)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
基于SHAP可解释性AI的支持向量机和K近邻工业轴承故障诊断特征贡献分析(Python,jupyter nootbook文件)

首先加载包含23个时域和频域特征的模拟振动数据集,这些特征模拟了真实轴承在健康、内圈故障、外圈故障和滚动体故障等不同状态下的振动特性。算法通过t-SNE降维技术可视化高维特征空间的数据分布,展示不同故障类型在二维空间的聚类情况。接着,算法构建并优化两个分类模型——支持向量机(SVM)和K近邻(kNN),采用网格搜索交叉验证方法分别寻找最优的超参数组合(如SVM的核函数与正则化参数C,kNN的邻居数K),确保模型在训练集上达到最佳分类性能。然后,算法利用SHAP(Shapley Additive exPlanations)可解释性框架,通过核解释器计算每个特征对模型预测的贡献值,从合作博弈论的角度量化各特征在故障分类决策中的重要性。最后,算法生成两类可视化结果:一是SHAP特征重要性汇总图,以点云分布形式展示每个特征值大小与SHAP值的关系;二是特征重要性条形图,按平均绝对SHAP值排序显示前10个关键特征,从而直观揭示SVM和kNN模型在不同故障类别分类决策中依赖的核心特征及其影响方向。

详细算法步骤

数据准备与特征选择:加载模拟轴承振动数据集,从中提取23个预先定义的时域和频域特征作为模型输入,这些特征包括偏度、峭度、形状因子等关键诊断指标,对应文献中所述的轴承故障敏感特征。

数据可视化与探索:对标准化后的特征数据应用t-SNE降维算法,将高维特征空间映射到二维平面,生成散点图以观察不同故障类型(健康、内圈故障、外圈故障、滚动体故障)的数据分布与聚类情况,初步评估特征的可分性。

分类模型构建与训练:分别建立支持向量机(SVM)和K近邻(kNN)分类模型,采用流水线方式整合数据标准化与分类器。使用网格搜索结合5折交叉验证,在训练集上优化SVM的核函数类型、正则化参数C以及kNN的邻居数K,以准确率为评价指标选择最优超参数组合。

模型可解释性分析:利用SHAP(Shapley加性解释)框架,基于合作博弈论原理,通过核解释器分别计算SVM和kNN模型中每个特征对各类别预测结果的贡献值(SHAP值)。SHAP值量化了特征对单个样本预测结果相对于基线(平均预测)的影响大小与方向。

特征重要性可视化:生成两类可视化图表:一是SHAP汇总图,用散点展示每个样本的特征值(颜色)与对应SHAP值(水平位置)的关系,揭示特征如何影响各类别的预测概率;二是特征重要性条形图,按平均绝对SHAP值排序展示前10个最重要的特征,直观比较不同特征对SVM和kNN模型决策的总体贡献程度。

诊断结果解读与应用:基于SHAP分析结果,识别对轴承故障分类最具判别力的关键特征(如偏度、形状因子等),解释这些特征在物理意义上如何反映不同故障类型的振动特性,从而为工业现场轴承状态监测提供可解释的故障诊断依据,并指导特征工程的优化方向。

参考文章:

基于SHAP可解释性AI的支持向量机和K近邻工业轴承故障诊断特征贡献分析(Python,jupyter nootbook文件) - 哥廷根数学学派的文章
https://zhuanlan.zhihu.com/p/1998401433163294662

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/31 11:11:05

导师严选9个一键生成论文工具,研究生论文写作必备!

导师严选9个一键生成论文工具,研究生论文写作必备! AI 工具助力论文写作,效率与质量并重 在当前研究生论文写作过程中,AI 工具的应用已经逐渐成为一种趋势。随着 AIGC 技术的不断进步,许多学生开始借助 AI 工具来提升…

作者头像 李华
网站建设 2026/4/7 15:03:31

本地win系统和vmware 虚拟机 ubuntu实现文件共享

在实际的工作开发中,经常会运用到虚拟机的情况。当然,随着win系统版本地提升,从win10开始,本身win系统也自带了虚拟机的功能。但有一些老式的机子,是不支持的。为此,我就以 vmware 安装 ubuntu 来实现它与本…

作者头像 李华
网站建设 2026/4/12 23:19:40

Linux(ubuntu)如何锁定cpu频率工作在最低能耗模式下

最低频率最省电最省钱 三部曲: 1 sudo apt install -y cpufrequtils linux-tools-common linux-tools-generic 2 sudo cpupower frequency-set -g powersave 3 cpufreq-info 性能对比 https://blog.csdn.net/ZhangRelay/article/details/157299108 最高性…

作者头像 李华
网站建设 2026/4/3 7:38:11

论文答辩时,评审组导师一旦开始问问题,通常会问哪些问题?

先说一句你可能不爱听、但非常重要的话:评审组导师一问问题, 其实已经在心里对你的论文有了一个初步判断。接下来的提问, 不是临时发挥, 而是围绕几个固定维度,快速确认三件事:这篇论文是不是你真正理解的研…

作者头像 李华
网站建设 2026/4/13 14:15:46

读研方法-2026

文献综述 ① 读综述起手,快速扫清盲区 构建文献图谱-Connected Papers | Find and explore academic papers 提供真实文献的-Paper Digest – AI-Powered Research Platform 知网-硕博论文综述部分-中国知网 边看边记,构建自己的关键词语录&#xff…

作者头像 李华