news 2026/5/8 16:32:04

【案例】Doris4.x全文检索与查询加速在电商领域的应用

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【案例】Doris4.x全文检索与查询加速在电商领域的应用

业务场景:电商商品搜索与评论分析系统

假设我们有一个电商平台的商品表和评论表,需要实现复杂的全文检索功能。

第一步:创建支持全文检索的表

1. 创建商品表(支持全文检索)


CREATE TABLE tmp.products (
    product_id BIGINT,--产品id
    product_name STRING,--产品名称
    product_description TEXT,--产品描述
    brand STRING,--品牌
    category STRING,--分类
    tags ARRAY<STRING>,--标签
    attributes MAP<STRING, STRING>,--属性
    price DECIMAL(10, 2),--价格
    stock INT,--库存
    create_time DATETIME --时间
) ENGINE = OLAP
DUPLICATE KEY(product_id)
DISTRIBUTED BY HASH(product_id) BUCKETS 10
PROPERTIES (
    "replication_num" = "1"
);

2. 为商品描述创建倒排索引(支持短语搜索)

CREATE INDEX idx_product_desc ON tmp.products(product_description) USING INVERTED 
PROPERTIES(
    "parser" = "english",
    "support_phrase" = "true"
);

3. 为商品名称创建索引

CREATE INDEX idx_product_name ON tmp.products(product_name) USING INVERTED 
PROPERTIES("parser" = "english");

4. 创建商品评论表

CREATE TABLE tmp.product_reviews_search (
    review_id BIGINT,--评论id
    product_id BIGINT,--产品id
    user_id BIGINT,--用户id
    review_title STRING,--评论标题
    review_content TEXT,--评论内容
    rating INT,--评分
    review_date DATE --评论日期
) ENGINE = OLAP
DUPLICATE KEY(review_id)
DISTRIBUTED BY HASH(review_id) BUCKETS 10
PROPERTIES("replication_num" = "1");

5.为评论内容创建全文索引

CREATE INDEX idx_review_content ON tmp.product_reviews_search(review_content) USING INVERTED 
PROPERTIES(
    "parser" = "english",
    "support_phrase" = "true"
);

6.插入商品和商品评论表数据

#插入商品表数据

INSERT INTO tmp.products VALUES
(1, 'iPhone 15 Pro Max', 'The new iPhone 15 Pro Max features an A17 Pro chip, titanium design, advanced camera system with 5x optical zoom, and USB-C connector. Perfect for photography and gaming enthusiasts.', 'Apple', 'Smartphones', ['apple', 'iphone', 'premium', '5g'], map('color', 'black', 'storage', '512GB'), 1299.99, 100, '2026-01-01 10:00:00'),
(2, 'Samsung Galaxy S24 Ultra', 'Samsung Galaxy S24 Ultra comes with AI features, 200MP camera, S Pen support, and long battery life. Great for business and creativity.', 'Samsung', 'Smartphones', ['samsung', 'android', 'premium', 'ai'], map('color', 'titanium', 'st

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/8 16:31:51

模拟芯片市场结构性博弈:汽车、工业与5G驱动巨头战略分化

1. 模拟芯片市场的“过山车”行情&#xff1a;一场由应用驱动的结构性博弈如果你在半导体行业待过几年&#xff0c;尤其是关注模拟芯片这个领域&#xff0c;那你对“稳如泰山”这个词的理解可能会和圈外人不太一样。在很多人眼里&#xff0c;模拟芯片——那些处理连续信号、负责…

作者头像 李华
网站建设 2026/5/8 16:31:49

英雄联盟国服换肤终极教程:5分钟学会R3nzSkin免费解锁全皮肤

英雄联盟国服换肤终极教程&#xff1a;5分钟学会R3nzSkin免费解锁全皮肤 【免费下载链接】R3nzSkin-For-China-Server Skin changer for League of Legends (LOL) 项目地址: https://gitcode.com/gh_mirrors/r3/R3nzSkin-For-China-Server 还在为英雄联盟国服昂贵的皮肤…

作者头像 李华
网站建设 2026/5/8 16:31:38

GeekAI-PLUS:一站式私有化AI创作平台部署与实战指南

1. 项目概述&#xff1a;一个集大成的AI创作与对话平台如果你和我一样&#xff0c;在过去一年里尝试过各种开源的ChatGPT WebUI项目&#xff0c;从最初的ChatGPT-Next-Web&#xff0c;到后来功能更丰富的各类变体&#xff0c;你可能会发现一个痛点&#xff1a;它们往往专注于“…

作者头像 李华
网站建设 2026/5/8 16:31:37

铂金赛尔以科技护航居家康养,让健康长寿更可期

在人口老龄化进程加快与居民健康意识持续提升的背景下&#xff0c;居家康养正成为越来越多家庭的选择。然而&#xff0c;市场上服务商良莠不齐&#xff0c;消费者往往面临三大难题&#xff1a;身体处于亚健康状态却缺乏系统性的调理方案&#xff1b;担心被缺乏科学依据的“伪养…

作者头像 李华
网站建设 2026/5/8 16:31:34

2026年最硬核AI技术风向标来了:从32个分会场中筛选出6场“非去不可”的深度实践课(含现场调试千卡集群、部署实时多模态Agent)——你准备好接管未来了吗?

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;2026年AI开发者大会全景洞察 2026年AI开发者大会&#xff08;AIDC 2026&#xff09;于上海张江科学会堂正式落幕&#xff0c;本届大会以“可信赖的智能涌现”为核心命题&#xff0c;首次将AI系统性可信…

作者头像 李华
网站建设 2026/5/8 16:31:30

在 LabVIEW 编程中,转换选板 (Convert Palette) 是处理数据类型转换、位操作以及数据平滑化的核心工具

在 LabVIEW 编程中,转换选板 (Convert Palette) 是处理数据类型转换、位操作以及数据平滑化的核心工具。在工业级 C# 开发中,这些操作通常对应 System.BitConverter、位移运算以及类型强制转换。 以下是对选板模块的详细解析及其对应的工业级 C# 实现。 一、 转换选板模块详…

作者头像 李华