news 2026/6/9 18:28:57

DAY12@浙大疏锦行

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
DAY12@浙大疏锦行

笔记和作业

使用bayes_opt库的流程

1.# 定义目标函数

def knn_cv_score(n_neighbors, weights, metric): """ 输入KNN参数,返回交叉验证平均准确率 参数说明: - n_neighbors: 近邻数(整数,贝叶斯优化会自动处理浮点转整数) - weights: 权重方式(0=uniform,1=distance) - metric: 距离度量(0=euclidean,1=manhattan,2=chebyshev) """
# 将连续参数转换为整数(贝叶斯优化默认传浮点,需转为KNN要求的类型) n_neighbors = int(round(n_neighbors)) # 近邻数必须是整数 weights = "uniform" if weights < 0.5 else "distance" # 类别参数映射 metric_map = {0: "euclidean", 1: "manhattan", 2: "chebyshev"} metric = metric_map[int(round(metric))] # 创建模型 knn = KNeighborsClassifier( n_neighbors=n_neighbors, weights=weights, metric=metric, n_jobs=-1 # 并行计算加速 ) # 5折交叉验证,返回平均准确率 cv_scores = cross_val_score(knn, X_train, y_train, cv=5, scoring="accuracy") return cv_scores.mean()

2.# 定义参数搜索空间

# 注意:贝叶斯优化仅支持连续型参数,类别型需映射为数值区间 pbounds = { "n_neighbors": (3, 30), # 近邻数范围:3~30 "weights": (0, 1), # 0→uniform,1→distance "metric": (0, 2) # 0→euclidean,1→manhattan,2→chebyshev } for param, (low, high) in pbounds.items(): # items方法返回字典的键值对 range_size = high - low print(f" {param:20s}: [{low:7.1f}, {high:7.1f}] (范围: {range_size:7.1f})")

3.# 创建贝叶斯优化器,优化的过程已经被这个对象封装了

# 初始化优化器(verbose=2:打印迭代过程) optimizer = BayesianOptimization( f=knn_cv_score, pbounds=pbounds, random_state=42, verbose=2 ) start_time = time.time() # 开始优化(n_iter:迭代次数,init_points:初始随机搜索点数) # init_points越多,初始探索越充分;n_iter越多,优化越精细 optimizer.maximize(init_points=5, n_iter=20) end_time = time.time() print(f"优化完成!总耗时: {end_time - start_time:.2f} 秒".center(80))

4.# 提取所有迭代的结果

terations = [] scores = [] for i, res in enumerate(optimizer.res): # res包含每次迭代的结果,index从0开始 iterations.append(i + 1) # 迭代次数从1开始 scores.append(res['target']) # 提取得分

5.# 计算累计最优值

best_scores = [] current_best = -np.inf # 初始化为负无穷大 for score in scores: if score > current_best: # 检查当前得分是否打破历史记录 current_best = score best_scores.append(current_best)

6.# 绘制优化轨迹

# 左图:每次迭代的得分 ax1.plot(iterations, scores, 'o-', label='每次迭代得分', alpha=0.7, markersize=6) ax1.plot(iterations, best_scores, 'r--', label='累计最优得分', linewidth=2) ax1.axhline(y=optimizer.max['target'], color='green', linestyle=':', label=f'最终最优: {optimizer.max["target"]:.4f}') # axhline绘制水平线 ax1.set_xlabel('迭代次数', fontsize=12) ax1.set_ylabel('准确率', fontsize=12) ax1.set_title('贝叶斯优化收敛曲线 (超大空间100次迭代)', fontsize=14, fontweight='bold') ax1.legend() ax1.grid(True, alpha=0.3) # 右图:初始探索 vs 贝叶斯优化 init_points = 20 # 更新为20 ax2.plot(iterations[:init_points], scores[:init_points], 'bo-', label=f'随机探索 (前{init_points}次)', markersize=8, alpha=0.7) ax2.plot(iterations[init_points:], scores[init_points:], 'go-', label=f'贝叶斯优化 (后{len(iterations)-init_points}次)', markersize=8, alpha=0.7) ax2.axvline(x=init_points, color='red', linestyle='--', alpha=0.5, label='探索→利用') # axvline绘制垂直线 ax2.set_xlabel('迭代次数', fontsize=12) ax2.set_ylabel('准确率', fontsize=12) ax2.set_title('探索阶段 vs 利用阶段', fontsize=14, fontweight='bold') ax2.legend() ax2.grid(True, alpha=0.3) plt.tight_layout() plt.show()
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 21:52:47

21、大型网络安全与QoS实现策略

大型网络安全与QoS实现策略 1. 核心路由器防火墙配置 核心路由器为数据中心和分布式网络中的设备提供了首道防线,对于部分设备而言,核心路由器更是唯一的外部防护。以下是核心路由器的防火墙配置示例: $I -N manag #Lo + dns + icmp + !syn $I -A INPUT -i lo -j ACCEPT…

作者头像 李华
网站建设 2026/6/10 10:49:09

Kotaemon与主流大模型对比:优势在哪里?

Kotaemon与主流大模型对比&#xff1a;优势在哪里&#xff1f; 在企业纷纷拥抱AI助手的今天&#xff0c;一个现实问题摆在面前&#xff1a;为什么很多基于GPT或Claude构建的聊天机器人&#xff0c;在真实业务场景中总是“答非所问”或者“一本正经地胡说八道”&#xff1f;更别…

作者头像 李华
网站建设 2026/6/10 10:23:08

学会Excel这四组快捷键,批量操作不在话下,告别熬夜加班必备

在前面的文章中,分享了许多有关Excel数据整理分析,工作表美化等相关知识。有许多小伙伴积极提出了一些宝贵的意见和建议。虽然有些Excel操作很实用,但是步骤太过繁琐,不利于提高办公效率。 总结整理小伙伴们的宝贵建议,现将几个常用的批量处理快捷键分享给大家,希望能够…

作者头像 李华
网站建设 2026/6/10 10:49:33

huggingface_hub 1.0 正式版现已发布:开源机器学习基础五周年回顾

简要总结&#xff1a; 经过五年的持续开发&#xff0c;huggingface_hub 发布 v1.0 正式版&#xff01;这一里程碑标志着这个库的成熟与稳定。它已成为 Python 生态中支撑 20 万个依赖库 的核心组件&#xff0c;并提供访问超过 200 万公开模型、50 万公开数据集 和 100 万 Space…

作者头像 李华
网站建设 2026/6/10 10:49:31

10个会议减碳妙招,让企业环保又省钱

会议服务行业绿色转型分析&#xff1a;技术赋能下的减碳实践行业痛点分析当前&#xff0c;会议服务领域正面临日益严峻的环保与成本双重挑战。传统线下会议在差旅、物料消耗、能源使用等方面产生了大量碳排放&#xff0c;而线上会议虽减少了差旅排放&#xff0c;但其数据中心能…

作者头像 李华