华为云DWS上线AI数仓能力，持续引领融合分析新范式！-编程阁

本文分享自华为云社区《华为云DWS上线AI数仓能力，持续引领数智融合新范式！》

导语

正如OpenAI CEO Sam Altman所言“2024年以前，AI大模型领域尚处在探索期，更多面向开发者参与。2025年随着推理模型和垂域模型能力提升突破拐点，当前开始进入企业级AI时代”。随着推理模型和垂域能力的突破，AI正从开发者工具演变成企业核心生产力。在数据智能催生的产业变革里，打造AI-Ready数据资产将成为企业对数仓平台新的技术诉求。而数据基础设施的战略定位正在被重新定义——从被动存储走向主动智能，从批量分析走向实时推理，从结构化处理走向多模态融合。

传统数据仓库面临三重挑战：多引擎架构带来的数据冗余与运维负担、AI与数据平台割裂导致的开发效率低下、非结构化数据价值难以充分释放。企业需要的不再仅是“更快的查询引擎”，而是能够理解、推理并创造价值的“智能数据伙伴”。

近日，华为云DWS即将发布9.1.1.210版本，提供Data for AI融合分析能力，集成MCP协议，支持一站式OLAP分析、点查、全文检索、库内推理和AI推理等融合分析能力，重塑企业智能应用开发新范式，让数据工程师更加方便地使用AI，从而实现数据价值最大化，为企业客户提供更加实时、智能、高效的决策支持。

为什么企业需要AI原生数据仓库？

传统融合分析架构依赖多引擎协同：ES处理全文检索、Milvus负责向量检索、Doris专注OLAP分析场景等等。该架构存在显著痛点：

存储冗余：数据在各引擎间重复存储，资源利用率低下
运维复杂：多系统独立维护，故障定位与性能调优困难
开发低效：数据格式转换与链路适配消耗大量研发资源
实时性不足：批量数据流转难以满足AI应用毫秒级响应需求

DWS提供的AI原生的一站式分析引擎，极大地简化原有多引擎协同分析架构，集成MCP协议打通与大模型平台的交互通道，集成向量检索能力，内置AI Function支持大模型调用，实现端到端的库内推理，从而构筑AI-Ready数据分析基础设施，消除数据孤岛，同时，通过基于binlog的物化视图实现流批一体增量计算能力，面向开发者提供声明式Pipeline加工新范式，实现近实时分析，整体架构更加简化、轻量，极大提高开发效率，降低运维管理难度，满足企业AI平台部署一站式多模态融合分析的核心诉求。

四大核心能力

1. MCP协议原生集成：打通AI生态的“神经网络”

MCP（Model Context Protocol，模型上下文协议）是由 Anthropic 推出的一种开放标准，即”AI的USB-C“，旨在统一大模型与外部数据源和工具之间的通信协议，从而解决当前 AI 模型因数据孤岛限制而无法充分发挥潜力的难题，MCP 使得 AI 应用能够安全地访问和操作本地及远程数据，为 AI 应用提供了连接万物的接口。
DWS支持对接MCP协议，一键式可配置，即插即用。通过标准化协议接口，企业可无缝接入Claude、Cursor等主流AI平台，内置8个常用的数据分析与运维监控类型API，真正实现“万物互联，开箱即用”。

产品文档：MCP Server

最佳实践：基于DWS MCP Server搭建数据分析Agent

2. AI Function：可插拔式的库内AI推理

DWS集成开源社区插件pgai，支持对接外部开源大模型、华为云Maas服务等，通过库内SQL方式调用大模型进行推理，提供文本分析（ai.classify）、向量化（ai.embed）、文本摘要（ai.summarize），情感分析（ai.sentiment）等24个AI Function，将大模型推理能力下沉至数据库内核，从而为企业客户提供更加智能化的数据分析服务，实现数据即推理、即处理的全新操作模式，助力企业快速获取洞察，提升决策质量和效率。

产品文档：库内推理

最佳实践：基于DWS构建RAG框架生成行业调研报告

3.向量计算：非结构化分析的“水电煤”

企业80%的数据都是文档、图像、音视频等非结构化数据，过去是数据挖掘的暗区，其数据价值长期被低估，多模态统一向量存储和表示，使得多模态的检索不再困难。
DWS深度集成开源社区插件pgvector，实现分布式架构的改造，支持向量数据类型，支持IVFFlat、HNSW索引结构，支持相似度计算、最近邻搜索等多种高阶算法，实现基本的向量检索能力。

产品文档：向量计算

最佳实践：基于DWS的向量计算功能实现简单的商品搜索推荐系统

4.内置大模型特征算子：赋予用户AI分析”无限创造力“

通过PL/Python扩展支持，内置32个自研扁鹊大模型算子，将Python数据科学生态完整引入SQL工作流。开发者可直接在库内运行复杂AI算法，消除跨系统数据流转开销，实现从特征工程到模型推理的端到端闭环。

产品文档：大模型特征算子

DWS AI数仓能给客户带来哪些价值？

场景1. 零售行业：实时运营、智能选品及精准营销三位一体，提升消费者体验

客户痛点

传统数仓仅存储交易订单、会员信息等结构化数据，无法分析用户浏览日志、商品评价、直播弹幕等非结构化数据。
离线分析无法支撑实时促销决策。比如，直播间某商品爆火，无法快速调整库存和定价。
用户画像以规则化标签为主，无法基于语义推理从商品评价、直播弹幕等挖掘用户真实槽点或诉求。

业务价值创造

在线报表：支持年、月、周、日度报表的高效生成，统计商品类目信息、销量情况等，助力客户日常经营决策。
实时运营：对接直播销售渠道，实时采集某商品评价负向情感占比超30%，自动触发预警，运营人员随机调整话术或发放优惠券。
智能选品：结合"销量数据+评价情感+相似商品热度"，筛选高潜商品，指导采购决策。
精准营销：结合用户画像，向“高复购+评价提到’送礼’”的用户，推送礼盒装商品优惠券。

场景2. 制造行业：以设备-工艺-质量联动，助力实时决策与品质提升

客户痛点

设备IoT数据、工艺参数表、质检报告分析存在不同系统（IoT平台、ERP、MES），跨系统分析存在冗余数据同步；
质量缺陷分析依赖人工经验，无法快速定位“设备参数异常-工艺偏差-缺陷产生”等关联关系；
离线分析无法支撑实时工艺调整，比如，某台设备振动值超标，无法即时预警避免批量次品。

业务价值创造

流批一体：IoT设备数据实时入库，并定期做批量增删改操作。离线计算历史工艺参数与缺陷率的关联规则，实时监控IoT数据，当参数偏离最优区间时触发预警。
质量溯源：输入某批次次品编号，一键查询”生产设备IoT数据+工艺参数+质检记录“，快速定位缺陷根因。
预测性维护：基于设备传感器数据和历史故障记录，预测设备故障概率，提前安排维保，减少停机时间。
工艺优化：SQL统计分析不同工艺参数组合的合格率，回归算法建模“温度-压力-合格率”的关系，输出最优工艺参数区间，将产品合格率提升5%-10%。

场景3. 金融行业：交易-行为-舆情联动，构筑金融风控实时决策新防线

客户痛点

传统风控仅依赖交易数据（金额、时间、商户），无法识别"异常行为-舆情风险"，比如，用户账户被盗后，交易金额正常但登录设备异常。
规则引擎无法应对新型手段，比如，“羊毛党”通过批量注册账号，模拟正常行为薅羊毛。
舆情风险（如某企业被曝财务造假）无法实时同步到风控体系，导致信贷决策滞后。

业务价值创造

实时风控：交易发生时，实时完成多维度风险评估（含账户、设备异常），拦截盗刷、羊毛党等欺诈行为，降低损失率。
实时反欺诈：实时筛选分析“单笔交易大于5万+月交易次数骤增10倍”的用户，向量检索匹配用户行为与欺诈样本相似度。
信贷智能决策：向企业发放贷款前，结合“财务数据+舆情风险+行业趋势”等，输出信贷额度和利率建议。
舆情风险预警：当企业被曝负面新闻时，自动标记相关信贷客户，启动风险排查流程。

场景4. 政务行业：智慧城市一体化建设，驱动城市智能化管理升级

客户痛点

政务数据分散在各部门，数据格式不统一，难以支撑跨部门协同分析。
民生反馈（如市长热线、政务APP留言等）多为非结构化文本，无法量化分析居民诉求。
城市治理依赖人工巡检，无法实时响应突发问题。

业务价值创造

智能交通调度：结合时空和实时车流数据，动态生成交通拥堵热力图，智能推荐疏导线路，早晚高峰时段，实时调整红绿灯配时，缓解交通拥堵。
民生诉求精准响应：根据居民诉求的语义分类和区域分布，优先调配资源解决高频问题。
突发公共事件预警：当监测到积水超标+强降雨预警，自动触发防汛响应，输出防汛预案建议，辅助相关职能部门应急决策。

展望

历经十余年技术深耕和沉淀，华为云DWS数据仓库服务已完成三次关键跃迁：从2.0时代以存算一体架构筑牢数据底座，到3.0时代存算分离架构的颠覆性升级，再到如今5.0时代融合AI技术构筑AI-Ready数仓底座，始终以“打造智能数据时代融合分析平台”为使命，构筑覆盖全场景、多样化、智能化的数据分析能力。迄今已服务全球超1700家企业客户，在金融、政企、互联网等关键领域支撑起大规模数据决策。
迈入AI驱动的产业变革新阶段，DWS将持续聚焦三大核心方向：

融合分析性能加速：非结构化、时空数据、全文检索等执行引擎持续优化，提升全数据类型融合分析效率。
统一开放的格式：全面拥抱开源表格式，引入非结构化格式Lance，打破私有格式壁垒，降低数据使用门槛，真正实现“数据不动，计算流动”的开放架构。
智能体基础设施：为企业Agent应用、AI工作流提供高可靠、高性能、易集成、可扩展的数据底座。

我们相信，华为云DWS将继续扎根行业真实需求，以持续进化的平台能力，助力每一家企业构建属于自已的数据智能核心，持续引领数智时代融合分析新范式，在AI时代创造可持续的竞争优势。

华为云DWS上线AI数仓能力，持续引领融合分析新范式！

小白也能上手，2026年OpenClaw（Clawdbot）极速简易部署方案

不会“黑”安全就别玩？这个“果汁店”让你合法“搞破坏”！

DeepEval：AI代理评估框架

效率翻倍！2026TOP6 AI 论文生成软件榜单，功能+性价比全解析

P0926GX FBM233冗余以太网通信

收藏备用｜RAG应用五大分块策略详解（小白程序员必看，直接套用提升系统性能）