Pinecone 全面教程：常用 API 串联与实战指南-编程阁

大家好，我是jobleap.cn的小九。
Pinecone 是一款托管式向量数据库，专为高性能向量检索和相似性匹配设计，广泛应用于语义搜索、推荐系统、AI 问答、计算机视觉等场景。本教程将从环境搭建到核心 API 实战，全面覆盖 Pinecone 的常用用法，通过可运行的代码示例串联所有关键 API，帮助你快速掌握 Pinecone 的完整使用流程。

一、环境准备

1.1 安装 Pinecone 库

Pinecone 官方提供了 Python 客户端库，推荐使用最新的 3.x 版本（2.x 已逐步弃用），安装命令：

pipinstallpinecone-client

1.2 获取 Pinecone API Key

登录 Pinecone 官网注册账号；
进入控制台，创建 API Key（注意保存，仅显示一次）；
记录云厂商（如 AWS/GCP）和区域（如 us-east-1），用于创建索引。

二、核心 API 实战

2.1 初始化 Pinecone 客户端

3.x 版本简化了客户端初始化方式，无需指定environment，仅需 API Key：

importpineconefrompineconeimportPinecone,ServerlessSpec# 初始化 Pinecone 客户端（3.x 推荐方式）pc=Pinecone(api_key="YOUR_PINECONE_API_KEY")# 兼容 2.x 版本（可选，不推荐）# pinecone.init(api_key="YOUR_PINECONE_API_KEY", environment="YOUR_ENV")

2.2 索引管理（核心载体）

索引是 Pinecone 存储向量的核心单元，所有向量操作均基于索引完成，常用操作包括创建、列出、描述、缩放、删除。

2.2.1 创建索引

创建索引时需指定向量维度、相似度度量方式、云厂商/区域（Serverless 模式）：

# 定义索引名称（自定义）index_name="demo-vector-index"# 检查索引是否存在，避免重复创建ifindex_namenotinpc.list_indexes().names():# 创建 Serverless 索引（3.x 推荐，无需管理服务器）pc.create_index(name=index_name,dimension=1536,# 向量维度（如 OpenAI Embedding 为 1536）metric="cosine",# 相似度度量：cosine（余弦）/euclidean（欧氏）/dotproduct（点积）spec=ServerlessSpec(cloud="aws",# 云厂商：aws/gcpregion="us-east-1"# 区域（需与账号一致）))# 等待索引创建完成（约 10 秒）importtimewhilenotpc.describe_index(index_name).status['ready']:time.sleep(1)

2.2.2 索引基础操作

# 列出所有索引all_indexes=pc.list_indexes()print("当前所有索引：",all_indexes.names())# 描述索引详情（维度、度量方式、状态等）index_desc=pc.describe_index(index_name)print("索引详情：",index_desc)# 缩放索引（仅 Pod 类型索引支持，Serverless 无需缩放）# pc.scale_index(name=index_name, replicas=2, pods=1)# 获取索引实例（后续向量操作的核心对象）index=pc.Index(index_name)

2.3 向量操作（增删改查）

向量是 Pinecone 的核心数据单元，由id（唯一标识）、values（向量值）、metadata（元数据，可选）组成，常用操作包括插入/更新、获取、删除。

2.3.1 插入/更新向量（upsert）

upsert是 Pinecone 最核心的写入 API，逻辑为：存在则更新，不存在则插入。

# 1. 单条向量插入single_vec={"id":"vec-1","values":[0.1,0.2,0.3]+[0.0]*1533,# 补全到 1536 维度"metadata":{# 元数据（自定义键值对，用于过滤）"category":"book","price":29.99,"title":"Python编程入门"}}index.upsert(vectors=[single_vec],namespace="ns1")# namespace 用于隔离向量# 2. 批量插入（推荐，提升效率）batch_vecs=[]foriinrange(2,10):batch_vecs.append({"id":f"vec-{i}","values":[0.1*i,0.2*i,0.3*i]+[0.0]*1533,"metadata":{"category":"book"ifi%2==0else"movie","price":10.99+i,"title":f"Content{i}"}})# 批量写入，支持指定命名空间index.upsert(vectors=batch_vecs,namespace="ns1",batch_size=200)# 分块大小（默认 1000）

2.3.2 获取向量（fetch）

# 1. 获取单个向量single_fetch=index.fetch(ids=["vec-1"],namespace="ns1")print("单个向量：",single_fetch)# 2. 批量获取向量batch_fetch=index.fetch(ids=["vec-2","vec-3","vec-4"],namespace="ns1")print("批量向量：",batch_fetch)

2.3.3 更新向量

通过upsert实现更新（仅修改元数据时，向量值可传空列表）：

# 全量更新（向量值 + 元数据）update_vec={"id":"vec-1","values":[0.4,0.5,0.6]+[0.0]*1533,"metadata":{"category":"book","price":39.99,"discount":True}}index.upsert(vectors=[update_vec],namespace="ns1")# 仅更新元数据（向量值不变）meta_only_update={"id":"vec-1","values":[],# 空列表表示不修改向量值"metadata":{"sales":1000}# 新增/修改元数据字段}index.upsert(vectors=[meta_only_update],namespace="ns1")

2.3.4 删除向量

# 1. 删除单个向量index.delete(ids=["vec-1"],namespace="ns1")# 2. 批量删除向量index.delete(ids=["vec-2","vec-3"],namespace="ns1")# 3. 删除命名空间下所有向量index.delete(delete_all=True,namespace="ns1")

2.4 向量查询（核心功能）

Pinecone 的核心价值是相似性检索，支持基础查询、元数据过滤、多向量查询、分页等能力。

2.4.1 基础相似性查询

# 构造查询向量（模拟 1536 维向量）query_vec=[0.5,0.6,0.7]+[0.0]*1533# 基础查询：返回最相似的 5 个向量basic_query=index.query(vector=query_vec,top_k=5,# 返回数量namespace="ns1",include_metadata=True,# 是否返回元数据include_values=False# 是否返回向量值)print("基础查询结果：",basic_query)

2.4.2 元数据过滤查询（高频用法）

支持丰富的过滤操作符（$eq/$ne/$gt/$gte/$lt/$lte/$in/$nin），以及$and/$or/$not组合条件：

# 示例 1：筛选 category=book 且 price>20 的向量filtered_query=index.query(vector=query_vec,top_k=3,namespace="ns1",include_metadata=True,filter={"category":{"$eq":"book"},"price":{"$gt":20}})print("过滤查询结果：",filtered_query)# 示例 2：复杂条件（category=movie 或 price<15）complex_filter=index.query(vector=query_vec,top_k=3,namespace="ns1",include_metadata=True,filter={"$or":[{"category":{"$eq":"movie"}},{"price":{"$lt":15}}]})print("复杂过滤结果：",complex_filter)

2.4.3 多向量查询

支持传入多个查询向量，通过聚合（均值/求和/最大值）生成最终检索结果：

# 多查询向量（如多个文本片段的嵌入向量）multi_query_vecs=[[0.5,0.6,0.7]+[0.0]*1533,[0.8,0.9,1.0]+[0.0]*1533]multi_vec_query=index.query(vector=multi_query_vecs,top_k=5,namespace="ns1",include_metadata=True,multi_vector_query_config={"aggregate":"mean"}# 聚合方式：mean/sum/max)print("多向量查询结果：",multi_vec_query)

2.4.4 分页查询

通过pagination_token实现分页，适用于结果量较大的场景：

# 第一页first_page=index.query(vector=query_vec,top_k=2,# 每页 2 条namespace="ns1",include_metadata=True,pagination_token=None)print("第一页：",first_page)# 第二页（通过第一页的 token 继续查询）if"pagination_token"infirst_page:second_page=index.query(vector=query_vec,top_k=2,namespace="ns1",include_metadata=True,pagination_token=first_page["pagination_token"])print("第二页：",second_page)

2.5 高级操作

2.5.1 命名空间（Namespace）

命名空间用于隔离向量（如按用户/场景分库），不同命名空间的向量相互独立：

# 向不同命名空间插入向量index.upsert(vectors=[single_vec],namespace="ns2")# 查询指定命名空间的向量ns2_query=index.query(vector=query_vec,top_k=1,namespace="ns2",include_metadata=True)print("ns2 命名空间查询：",ns2_query)

2.5.2 索引统计信息

查看索引的向量数量、命名空间分布等：

stats=index.describe_index_stats()print("索引统计信息：",stats)

2.5.3 批量操作最佳实践

单次upsert建议控制在 1000 条以内，避免超时，可封装分块函数：

defbatch_upsert(index,vectors,batch_size=200):"""批量分块插入向量"""foriinrange(0,len(vectors),batch_size):batch=vectors[i:i+batch_size]index.upsert(vectors=batch)print(f"插入第{i//batch_size+1}批，共{len(batch)}条")# 示例：插入 1000 条向量large_batch=[{"id":f"vec-{i}","values":[0.1*i,0.2*i,0.3*i]+[0.0]*1533,"metadata":{"category":"article","views":i*10}}foriinrange(10,1010)]batch_upsert(index,large_batch)

2.6 清理资源

使用完成后删除索引，避免不必要的计费：

pc.delete_index(index_name)print(f"索引{index_name}已删除")

三、综合实战：文本语义检索

结合 OpenAI Embedding 将文本转为向量，实现语义检索（需安装openai库：pip install openai）：

importopenai# 配置 OpenAI API Keyopenai.api_key="YOUR_OPENAI_API_KEY"# 1. 初始化 Pinecone 并创建索引pc=Pinecone(api_key="YOUR_PINECONE_API_KEY")index_name="text-semantic-search"ifindex_namenotinpc.list_indexes().names():pc.create_index(name=index_name,dimension=1536,metric="cosine",spec=ServerlessSpec(cloud="aws",region="us-east-1"))index=pc.Index(index_name)# 2. 文本转向量（OpenAI Embedding）defget_text_embedding(text,model="text-embedding-3-small"):"""获取文本的 Embedding 向量"""returnopenai.embeddings.create(input=[text.replace("\n"," ")],model=model).data[0].embedding# 3. 准备文本数据并插入 Pineconetexts=[{"id":"t1","content":"Python是一种解释型、面向对象的高级编程语言","category":"编程"},{"id":"t2","content":"Pinecone是一款专为向量检索优化的托管式向量数据库","category":"数据库"},{"id":"t3","content":"OpenAI的Embedding API可以将文本转换为高维向量","category":"AI"},{"id":"t4","content":"语义搜索通过向量相似度匹配实现精准的文本检索","category":"搜索"},{"id":"t5","content":"向量数据库广泛应用于推荐系统、问答机器人等AI场景","category":"AI"}]# 批量转换并插入vectors=[]foritemintexts:embedding=get_text_embedding(item["content"])vectors.append({"id":item["id"],"values":embedding,"metadata":{"content":item["content"],"category":item["category"]}})index.upsert(vectors=vectors)# 4. 语义检索query_text="向量数据库在AI中的应用"query_embedding=get_text_embedding(query_text)# 检索 AI 分类的文本results=index.query(vector=query_embedding,top_k=3,include_metadata=True,filter={"category":{"$eq":"AI"}})# 输出结果print(f"\n查询文本：{query_text}")print("检索结果（按相似度排序）：")formatchinresults["matches"]:print(f"相似度：{match['score']:.4f}| 内容：{match['metadata']['content']}")# 5. 清理资源pc.delete_index(index_name)

四、常见问题与注意事项

版本兼容：3.x 与 2.x API 差异较大，优先使用 3.x，避免依赖废弃接口；
向量维度：创建索引时的dimension必须与插入的向量维度一致，否则报错；
元数据限制：单个元数据字段值不超过 10KB，单个向量元数据总大小不超过 40KB；
计费说明：Serverless 索引按查询次数和存储量计费，Pod 索引按 Pod 数/副本数计费，用完及时删索引；
性能优化：批量操作提升写入效率，top_k不宜过大（建议 ≤ 100），选择合适的相似度度量方式（余弦相似度适合文本检索）。

五、总结

本教程完整串联了 Pinecone 的核心 API，包括客户端初始化、索引管理、向量增删改查、相似性查询（含元数据过滤）、命名空间操作等，并通过实战案例演示了语义检索的端到端流程。掌握这些用法后，你可轻松将 Pinecone 集成到语义搜索、推荐系统、AI 问答等场景中，结合业务需求优化向量维度、过滤条件和检索策略，提升系统的检索性能和准确性。