从零实现AI智能客服接入微信公众号：技术选型与实战避坑指南-编程阁

背景痛点：公众号客服消息的三座大山

把 AI 智能客服塞进微信公众号，表面看只是“收发文本”，真正动手才会踩到三颗钉子：

消息时效性
微信只给 5 秒“黄金时间”。超过 5 秒未回 200，微信会重试三次，用户端看到重复答案，体验瞬间崩塌。
API 调用频率限制
获取 access_token 的接口 2000 次/天，客服消息接口 5000 次/分钟。一旦爆款推文带来流量洪峰，token 被刷空，后续请求直接 42001。
多轮会话管理
微信是“无状态”协议，用户每句话都是独立 POST，没有 session。要在对话里追问“订单号”“是否开发票”，必须自己维护状态机，否则 AI 永远“失忆”。

方案对比：Serverless 还是自建？

维度	腾讯云 SCF	自建 Flask（4C8G）
冷启动	300 ms~1.5 s	0 ms（常驻）
并发上限	1000 实例/地域	单核≈250 QPS，8G 约 1.5K QPS
成本（月）	100 万次调用≈14 元	轻量服务器 80 元 + 带宽 30 元
运维	0 人力	需 CI/CD、监控、告警
微信 token 共享	需外置 Redis	本机 Redis 即可

决策树如下：

结论：

日调用 < 5 万、无状态查询类业务，选 SCF。
需要长连接、多轮会话、本地缓存，选自建。

核心实现：Flask + 异步队列 + 状态机

1. 微信签名验证与 RSA 解密

微信 POST 过来的 XML 使用 AES-CBC 加密，需先解密再业务处理。以下代码符合 PEP8，带类型标注与异常捕获。

# wechat/crypto.py from Crypto.Cipher import AES from typing import Tuple import base64, hashlib, struct class WXBizMsgCrypt: def __init__(self, token: str, aes_key: str, app_id: str): self.key = base64.b64decode(aes_key + "=") self.token = token self.app_id = app_id def decrypt(self, encrypt_msg: str) -> Tuple[str, str]: try: raw = base64.b64decode(encrypt_msg) aes = AES.new(self.key, AES.MODE_CBC, self.key[:16]) plain = aes.decrypt(raw) # 去掉 PKCS#7 补位 pad = plain[-1] content = plain[16:-pad] # 前 4 字节是 len(msg) xml_len = struct.unpack("!I", content[:4])[0] xml_content = content[4:xml_len + 4].decode() from_app_id = content[xml_len + 4:].decode() if from_app_id != self.app_id: raise ValueError("app_id mismatch") return xml_content, from_app_id except Exception as e: raise RuntimeError("decrypt fail") from e

Flask 路由层只做验签与解密，业务逻辑全部抛给 Celery，保证 5 秒内返回 200。

# app.py from flask import Flask, request from wechat.crypto import WXBizMsgCrypt from tasks import reply_task app = Flask(__name__) cryptor = WXBizMsgCrypt(TOKEN, AES_KEY, APP_ID) @app.route("/wx", methods=["GET", "POST"]) def wechat_entry(): if request.method == "GET": # 微信接口验证 return request.args.get("echostr") # POST encrypt_msg = request.get_data(as_text=True) try: xml, _ = cryptor.decrypt(encrypt_msg) except Exception: return "fail", 400 # 异步处理 reply_task.delay(xml) return "success"

2. 异步消息处理架构

Celery 5.2 + Redis 6.2，worker 数量 = CPU 核心数 × 2，保证 IO 等待时切换。

# tasks.py from celery import Celery from wechat.api import send_customer_msg from dialog.fsm import DialogFSM cel = Celery("bot", broker="redis://127.0.0.1:6379/0") @cel.task(bind=True, max_retries=3) def reply_task(self, xml: str): try: msg = parse_xml(xml) fsm = DialogFSM(openid=msg["FromUserName"]) answer = fsm.next(msg["Content"]) send_customer_msg(msg["FromUserName"], answer) except Exception as exc: raise self.retry(exc=exc, countdown=2)

3. 对话状态机（FSM）

用 Python 的enum+transition库写有限状态机，伪代码如下：

# dialog/fsm.py from enum import Enum, auto from transitions import Machine class State(Enum): IDLE = auto() AWAIT_ORDER = auto() AWAIT_INVOICE = auto() class DialogFSM: states = [State.IDLE, State.AWAIT_ORDER, State.AWAIT_INVOICE] transitions = [ {"trigger": "ask_order", "source": State.IDLE, "dest": State.AWAIT_ORDER}, {"trigger": "provide_order", "source": State.AWAIT_ORDER, "dest": State.IDLE}, {"trigger": "ask_invoice", "source": State.IDLE, "dest": State.AWAIT_INVOICE}, ] def __init__(self, openid: str): self.openid = openid self.machine = Machine(model=self, states=DialogFSM.states, transitions=DialogFSM.transitions, initial=State.IDLE) def next(self, text: str) -> str: if "订单" in text: self.ask_order() return "请提供订单号" if self.state == State.AWAIT_ORDER and text.isdigit(): self.provide_order() return f"订单 {text} 查询成功" return "暂不支持该问题"

状态持久化到 Redis Hash，key 为fsm:{openid}，过期 15 分钟，兼顾内存与体验。

避坑指南：把暗礁画成地图

access_token 分布式缓存
采用 Redis + 分布式锁（Redlock）保证 7000 次/小时刷新一次，防止多节点重复刷新。
伪代码：

# token.py import redis, time, requests r = redis.Redis() def get_access_token() -> str: token = r.get("wx:access_token") if token: return token with r.lock("wx:refresh_lock", timeout=5): token = r.get("wx:access_token") if token: return token resp = requests.get(refresh_url).json() r.setex("wx:access_token", 7000, resp["access_token"]) return resp["access_token"]

消息去重 5 种方案
- 微信 MsgId 去重：用户编辑消息会生成新 ID，失效。
- 时间戳 + openid 滑动窗口：5 秒内重复丢弃。
- Redis Set：存msg:{openid}:{md5(content)}，过期 60 s。
- 布隆过滤器：本地内存，1000 万条仅需 11 MB，但无删除，需定期重建。
- 数据库唯一索引：最稳，但 RT 高，适合离线对账。
线上组合：Redis Set + 布隆过滤器双层拦截，命中率 99.2%，RT < 1 ms。

敏感词过滤
用 AC 自动机（Aho-Corasick）一次扫描多模式串，170 KB 词库加载 0.03 s，匹配 10 万字仅需 20 ms。代码片段：

# ac.py from pyahocorasick import Automaton auto = Automaton() for w in load_sensitive_dict(): auto.add_word(w) auto.make_automaton() def filter(text: str) -> str: for end, word in auto.iter(text): text = text.replace(word, "*" * len(word)) return text