news 2026/4/16 10:56:11

大模型推理不确定性的根因和解决方法

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型推理不确定性的根因和解决方法

根因:

不确定性是浮点运算导致的

  • 浮点运算中顺序不同,计算结果会有微小差异,即 a + b ≠ b + a
  • 推理过程由于需要加速运算,导致计算顺序不是固定的

解决方法:

  • api调用层面:设置确定性相关的参数
  • 服务端层面:控制底层的模型部署

https://zhuanlan.zhihu.com/p/1961192621759242664

实践效果:

api调用层面

对于短问题,仅采用该方法确定性已经较高。对长问题,效果很差

req_body = { "model": deepseek-v3-0324, # 假设LLMConf是您的配置对象 "messages": [ { "role": "user", "content": "假如美联储有降息的倾向,黄金会增值还是贬值,简要回答" } ], "max_tokens": 500, "temperature": 0, # 设为0,完全消除随机性 "top_p": 1, #
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/11 16:48:21

基于stm32的数控恒流源设计

基于STM32的数控恒流源设计 第一章 绪论 传统恒流源多采用模拟电路搭建,存在输出精度低、调节范围窄、无法数字化控制与参数读取、适配场景有限等问题,难以满足电子设备测试、传感器标定、实验室研发等场景下对精准、可编程恒流输出的需求。STM32单片机…

作者头像 李华
网站建设 2026/4/15 0:35:16

CI/CD 工具选型指南:Jenkins vs GitLab CI vs Arbess

面对众多的CI/CD工具,如何根据功能、价格和易用性做出选择?本文旨在通过多款工具的横向对比,为你提供清晰的梳理与参考。1、Jenkins 1.1 产品介绍Jenkins 作为开源CI/CD领域的领导者,支持超过 1000 个插件,覆盖构建、部…

作者头像 李华
网站建设 2026/3/14 3:16:55

博士日常:其实再大的困难也就几个小时

前几天改数据改到怀疑人生,论文里一个图改了快五次还不满意,设定的ddl就快截止。可我坐在桌前盯着屏幕,脑子空白,什么都不想干。 那一刻,我真觉得“算了,干脆别写了”。 / 但我没有关电脑,而是把…

作者头像 李华
网站建设 2026/4/13 12:26:51

谁在掌控AI芯片的命脉?全球半导体新金字塔格局解析

当AI算力成为数字经济的水和电,全球科技巨头围绕半导体供应链展开的无声战争,已经重新划分出芯片产业的权力版图。黄仁勋在2025年底的财务会议上展示了一张数据中心的蓝图,清晰地标明了从GPU到HBM再到电源模块的每一个连接点。 这一幕如同一则…

作者头像 李华
网站建设 2026/4/13 14:55:47

Thinkphp和Laravel框架的北部湾大学教室管理系统设计与开发主

目录北部湾大学教室管理系统设计与开发摘要开发技术源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!北部湾大学教室管理系统设计与开发摘要 该系统基于ThinkPHP和Laravel框架开发,旨在优化北部湾大学教室资源的调度与管理效…

作者头像 李华
网站建设 2026/4/1 19:15:58

LoadRunner

可以把它理解为一个非常专业的“压力测试实验室”。就像汽车工厂会在专门的测试场,模拟各种极端路况(颠簸、高温、严寒、长时间驾驶)来检验车辆性能一样,LoadRunner就是在数字世界里,为网站、应用程序或服务器搭建的这…

作者头像 李华