news 2026/4/16 13:59:35

基于贝叶斯优化的卷积神经网络-门控循环单元回归预测模型及评估指标 - BO-CNN-GRU B...

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
基于贝叶斯优化的卷积神经网络-门控循环单元回归预测模型及评估指标 - BO-CNN-GRU B...

(Matlab)基于贝叶斯(bayes)优化卷积神经网络-门控循环单元(CNN-GRU)回归预测,BO-CNN-GRU/Bayes-CNN-GRU多输入单输出模型。 1.优化参数为:学习率,隐含层节点,正则化参数。 2.评价指标包括:R2、MAE、MSE、RMSE和MAPE等,方便学习和替换数据。 3.运行环境Matlab2020b及以上

最近在捣鼓时间序列预测的活儿,发现CNN-GRU这个组合拳挺有意思。但调参真是要人命,手动一个个试效率太低,干脆搬出贝叶斯优化这个神器。今天就跟大伙儿唠唠怎么用Matlab整活这个BO-CNN-GRU模型,重点解决多输入单输出的回归问题。

先上硬菜——数据预处理这块儿得整明白。咱们用mapminmax标准化处理数据,这个函数比zscore更适合处理不同量纲的混合特征:

% 数据归一化(这里假设原始数据存储在data矩阵中) [inputn, inputps] = mapminmax(input', 0, 1); [outputn, outputps] = mapminmax(output', 0, 1); inputn = inputn'; outputn = outputn'; % 数据集划分(7:3比例) train_ratio = 0.7; train_size = round(size(inputn,1)*train_ratio); train_input = inputn(1:train_size,:); train_output = outputn(1:train_size,:); test_input = inputn(train_size+1:end,:); test_output = outputn(train_size+1:end,:);

模型架构是CNN和GRU的串行结构。这里有个坑要注意:Matlab的卷积层默认是2D的,处理时序数据得用1D卷积。直接上layerGraph构建网络骨架:

function layers = create_cnn_gru(input_size, num_hidden, reg_param) layers = [ sequenceInputLayer(input_size) % CNN部分 convolution1dLayer(3, 16, 'Padding','same') batchNormalizationLayer reluLayer maxPooling1dLayer(2,'Stride',2) % GRU部分 gruLayer(num_hidden,'OutputMode','sequence') dropoutLayer(0.2) % 输出层 fullyConnectedLayer(1) regressionLayer ]; % 添加正则化 for i = 1:length(layers) if isprop(layers(i),'WeightRegularizer') layers(i).WeightRegularizer = regularizer.l2(reg_param); end end end

贝叶斯优化的重头戏在这里。设置优化变量范围时要注意学习率得用对数尺度,节点数必须是整数:

optimVars = [ optimizableVariable('learning_rate', [1e-4, 1e-2], 'Transform','log') optimizableVariable('num_hidden', [32, 256], 'Type','integer') optimizableVariable('reg_param', [1e-5, 1e-2], 'Transform','log') ]; % 跑30次迭代,别问我为啥选这个数,问就是穷(显存不够) results = bayesopt(@(params)train_cnn_gru(params,train_input,train_output),... optimVars, 'MaxObjectiveEvaluations',30,... 'UseParallel',false);

目标函数的设计是灵魂所在。这里用5折交叉验证的MSE作为优化指标,防止过拟合:

function objective = train_cnn_gru(params, X, Y) options = trainingOptions('adam', ... 'LearnRateSchedule','piecewise',... 'InitialLearnRate', params.learning_rate,... 'MaxEpochs', 100, ... 'MiniBatchSize', 32,... 'Verbose',0); % 5折交叉验证 cv = cvpartition(size(X,1), 'KFold',5); loss = 0; for i = 1:5 train_idx = training(cv,i); val_idx = test(cv,i); net = create_cnn_gru(size(X,2), params.num_hidden, params.reg_param); trained_net = trainNetwork(X(train_idx,:), Y(train_idx,:), net, options); y_pred = predict(trained_net, X(val_idx,:)); loss = loss + mean((y_pred - Y(val_idx,:)).^2); end objective = loss/5; end

最后测试集评估的时候,记得把预测结果反归一化。评价指标的计算用了个小技巧——直接向量化运算,比循环快得多:

% 反归一化 pred = predict(trained_net, test_input); pred = mapminmax('reverse', pred', outputps)'; real = mapminmax('reverse', test_output', outputps)'; % 指标计算 mae = mean(abs(pred - real)); mse = mean((pred - real).^2); rmse = sqrt(mse); mape = mean(abs((pred - real)./real))*100; ssr = sum((real - mean(real)).^2); sse = sum((real - pred).^2); r2 = 1 - sse/ssr; disp(['R²: ',num2str(r2),' MAE:',num2str(mae)]) disp(['RMSE:',num2str(rmse),' MAPE:',num2str(mape),'%'])

实际跑起来发现几个有意思的现象:贝叶斯优化往往会找到比较小的学习率(1e-3左右),正则化参数在1e-4附近波动。节点数倒是经常选到128以上的大值,看来GRU层确实需要足够的容量来捕捉时序特征。

遇到显存不足报错的话,可以试着把MiniBatchSize调小到16或者8。另外数据量大的时候可以把卷积核数量从16增加到32,不过别贪多,CNN部分太深容易把时序特征给卷没了。

最后说个坑:Matlab的贝叶斯优化对参数范围特别敏感,建议先用大范围跑少量迭代锁定大致区间,再缩小范围精细搜索。这个方法比无脑调参快至少3倍,亲测有效!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 9:23:26

RabbitMQ vs RocketMQ ——延迟 / 定时消息落地终极指南

延迟消息 = “消息在未来某个时间点才能被消费”,属于 异步事件驱动系统中最常见的需求 📌 如:订单未支付 30 分钟自动取消、T+1 清算、优惠券过期、短信失败重试、IoT 数据延迟触达 不同 MQ 的实现方式天差地别,本文一次讲透👇 🎯 一、业务为什么需要延迟消息? 🛒…

作者头像 李华
网站建设 2026/4/16 0:05:20

Prime Intellect开源INTELLECT-3:性能超越多数前沿大模型

这项由Prime Intellect团队于2025年12月发表的研究报告,详细介绍了他们开发的INTELLECT-3模型及其完整的开源训练基础设施。这个研究团队包括了来自多个机构的研究人员,包括Mika Senghaas、Fares Obeid、Sami Jaghouar等十多位专家。研究成果发表在arXiv…

作者头像 李华
网站建设 2026/4/16 12:33:32

基于spark的西南天气数据的分析与应用(毕设源码+文档)

背景 本课题聚焦西南地区天气数据的深度挖掘与价值转化需求,针对当前西南区域气象数据体量庞大、处理效率低下、分析维度单一、数据应用场景不足等痛点,开展基于Spark的西南天气数据的分析与应用研究。研究以Spark为核心大数据处理框架,结合气…

作者头像 李华
网站建设 2026/4/16 11:11:44

基于SpringBoot框架社区老年人健康杂志阅读分享管理系统(毕设源码+文档)

课题说明本课题聚焦社区老年人健康知识获取与交流分享的核心需求,针对当前老年群体健康读物适配性不足、阅读资源分散、交流渠道匮乏、健康知识传播效率偏低等痛点,设计开发基于SpringBoot框架的社区老年人健康杂志阅读分享管理系统。系统以SpringBoot为…

作者头像 李华
网站建设 2026/4/16 0:27:15

基于SpringBoot特色农产品销售系统(毕设源码+文档)

课题说明本课题聚焦特色农产品产销对接的数字化需求,针对当前特色农产品流通渠道狭窄、品牌推广不足、供需信息不对称、交易流程不规范等痛点,设计开发基于SpringBoot的特色农产品销售系统。系统以SpringBoot为核心后端框架,结合前端主流开发…

作者头像 李华