news 2026/4/29 2:32:49

Azure AI Search 性能优化实战:从 40 秒到 8 秒的优化之旅

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Azure AI Search 性能优化实战:从 40 秒到 8 秒的优化之旅

背景

我们的知识库问答系统使用 Azure Container Apps + Azure AI Search + Azure OpenAI 构建,架构如下:

用户请求 → Container App → AI Search (向量搜索) → OpenAI (生成回答)

系统上线后,性能表现不佳:

  • P50 响应时间:18 秒
  • P99 响应时间:41 秒
  • 最慢请求:40.9 秒

用户体验极差,需要紧急优化。

问题分析过程

第一次分析:应用层串行执行(部分正确)

查看应用日志,发现单个请求内部执行流程:

00:00:00.000 - 请求开始 00:00:02.000 - get_search_results took 7.053s 00:00:07.000 - get_search_results took 10.068s (5秒后才开始) 00:00:26.000 - get_search_results took 23.689s (19秒后才开始) 00:00:32.000 - get_search_results took 27.646s (6秒后才开始) 00:00:34.000 - combine_content took 40.618s

初步结论:应用层串行执行多次 AI

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/26 15:20:07

Flink SQL EXPLAIN “看懂计划”到“用 PLAN_ADVICE 调优”

1. EXPLAIN 能解决什么问题? 在 Flink Table/SQL 里,EXPLAIN 主要用来: 看清楚:SQL 会被解析成什么 逻辑计划(Logical Plan / AST)看明白:优化器做了哪些 算子改写(如 Filter 下推、…

作者头像 李华
网站建设 2026/4/25 12:35:40

一生一芯学习:程序,运行时环境与AM(一)

前我们已经跑通了cpu-test和实现了riscv-I型指令所需的42条指令,现在我们已经可以到跑简单程序的地步了,我们也希望运行简单的程序,因此我们需要运行时环境(runtime environment)。比如现在要结束程序,那我们就要用提前准备好的AP…

作者头像 李华
网站建设 2026/4/26 0:12:17

DAY27 pipeline管道

一、知识回顾: 1、转化器和估计器的概念 (1)转换器 转化器通俗的来说就是对数据进行预处理的工具,转换器的特点是无状态的,即它们不会存储任何关于数据的状态信息(指的是不存储内参)&#xff0c…

作者头像 李华
网站建设 2026/4/27 0:47:05

Colima 下 docker pull 失败自查流程

macOS Colima 下 docker pull 超时问题排查总结 一、问题现象 在 macOS 上使用 colima 运行 Docker service 时,执行: docker pull BALABALA报错: Error response from daemon: Get "https://registry-1.docker.io/v2/": net/http…

作者头像 李华
网站建设 2026/4/24 4:18:18

基于springboot的健身房预约与学习管理系统

博主介绍:java高级开发,从事互联网行业六年,熟悉各种主流语言,精通java、python、php、爬虫、web开发,已经做了多年的设计程序开发,开发过上千套设计程序,没有什么华丽的语言,只有实…

作者头像 李华
网站建设 2026/4/26 22:47:40

STM32H723 芯片基本配置指南:从新手到专家的进阶之路

引言 作为一名初次接触 STM32H723 芯片的开发者,我在基本配置过程中遇到了不少挑战和困惑。这款高性能的 Cortex-M7 微控制器虽然功能强大,但复杂的配置选项和参数设置确实让人望而生畏。经过一番摸索和实践,我终于掌握了正确的配置方法。今天,我将通过这篇博客,分享我在…

作者头像 李华