news 2026/4/16 15:47:19

初探 Python 製作一個 簡單聊天機器人

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
初探 Python 製作一個 簡單聊天機器人

前言

透過這篇文章,我們將使用 python spacCy開發一個用於聊天機器人

本範例以 Python 為基礎,結合 spaCy 的中文語言模型,實作一個可進行基本中文對話的簡易 ChatBot。

安裝相關模型

spaCy是一個用於自然語言處理的開源軟件庫

參看: https://pypi.org/project/spacy/

% pip install spacy

安裝 使用 spaCy 的 中文模型

% python3 -m spacy download zh_core_web_sm

中文模型簡介:

zh_core_web_sm: 最小的中文語言模型,用於基本的語言處理任務。

zh_core_web_md: 一個中等大小的中文語言模型,比 zh_core_web_sm 包含更多的詞彙、語言特徵和上下文訊息,可以用於更多的語言處理任務。

zh_core_web_lg: 最大的中文語言模型,比 zh_core_web_md 包含更多的語言特徵和上下文信息。

建立對話回覆檔(範例)

將回覆內容獨立存放於外部responses.json檔案,不僅能讓對話資料與程式邏輯分離,也讓後續新增或調整對話內容變靈活。

{ "greeting": [ "你好!", "你好呀,有什麼需要幫忙的嗎?", "哈囉~", "嗨,很高興見到你", "嗨!今天過得如何?" ], "how_are_you": [ "我很好,謝謝你的關心!", "還不錯,你呢?", "一切都很順利~", "心情不錯,希望你也是", "還可以,正在學習中" ], "goodbye": [ "再見!", "掰掰,祝你有美好的一天", "下次再聊!", "保重~", "期待再和你聊天" ], "thanks": [ "不客氣!", "很高興能幫上忙", "沒問題!", "隨時都可以找我", "這是我應該做的" ], "name": [ "我是簡單的聊天機器人", "你可以叫我 ChatBot", "我是一個用 Python 寫的聊天機器人", "目前還沒有名字 😄", "我是你的對話小助手" ], "help": [ "你可以跟我聊天或問問題", "我可以陪你練習對話", "你可以問我一些簡單的問題", "我還在學習中,但我會盡力回答", "試著跟我說聲你好吧" ], "default": [ "我還在學習,能換個方式說嗎?", "這個我暫時不太懂", "可以再說清楚一點嗎?", "不好意思,我沒聽懂", "這部分我還需要多學習" ], "weather": [ "今天天氣如何呢?", "我沒辦法即時查天氣", "你可以看看窗外", "天氣好壞都要保持好心情", "希望今天是個好天氣" ], "jokes": [ "為什麼程式設計師不喜歡大自然?因為有太多 bug", "程式設計師最怕三個字:可以改嗎?", "我不是懶,我只是把效能最佳化到極致", "我不是健忘,只是記憶比較挑人", "世界上最遙遠的距離,是需求文件跟實際功能", "程式跑不動的時候,先怪電腦,準沒錯", "為什麼程式設計師不喜歡出門?因為外面沒有 Wi-Fi", "Debug 就像當偵探,而兇手通常是昨天的自己", "程式寫得好不好不重要,能不能跑比較重要", "我有一個笑話關於遞迴,但你可能要聽很多次才懂", "需求說『很簡單』的時候,通常最不簡單", "為什麼程式設計師愛喝咖啡?因為沒有咖啡就沒有 code", "有時候程式不是錯,只是不照你的想法執行", "能跑的程式就是好程式", "Bug 不會消失,它只是換個地方出現", "為什麼程式設計師討厭早起?因為腦袋還沒 compile", "今天的我,比昨天多懂一個 bug", "我不是拖延症,我只是比較晚開始", "今天本來想早睡,結果手機不同意", "有時候腦袋轉得太快,身體卻跟不上", "我不是方向感不好,只是比較有探索精神", "錢不是問題,問題是我沒有錢", "我每天都很努力,只是努力在想要不要努力", "有些事情想不通,就先不要想了", "人生很多問題,睡一覺也不一定會解決,但至少比較不累", "我對未來很有規劃,只是還沒開始", "明明什麼都沒做,卻覺得很累", "有些人表面看起來很正常,其實也是", "我不是不想動,是沙發黏住我了", "今天的我,依然沒有辜負昨天的期待", "有時候沉默,不是沒話說,是在整理思緒", "夢想還在路上,只是搭的是慢車", "我不是選擇困難,只是每個都想選", "生活已經很難了,笑一個比較划算" ] }

建立檔案simple_chatbot.py

import os import spacy import json import random # 取得 目前所在的資料夾路徑 BASE_DIR = os.path.dirname(os.path.abspath(__file__)) RESPONSES_PATH = os.path.join(BASE_DIR, "responses.json") # 載入中文模型 nlp = spacy.load("zh_core_web_sm") # 讀取回覆資料 with open(RESPONSES_PATH, "r", encoding="utf-8") as f: responses = json.load(f) def get_response(intent): return random.choice(responses.get(intent, responses["default"])) def respond_to_user(user_input): doc = nlp(user_input) text = user_input.lower() if any(word in text for word in ["你好", "哈囉", "嗨", "hello", "hi"]): return get_response("greeting") if any(word in text for word in ["你好吗", "你好嗎", "過得"]): return get_response("how_are_you") if any(word in text for word in ["你是誰", "你的名字"]): return get_response("name") if any(word in text for word in ["幫助", "能做什麼"]): return get_response("help") if any(word in text for word in ["笑話", "講個笑話", "好笑的"]): return get_response("jokes") if any(word in text for word in ["謝謝", "感謝"]): return get_response("thanks") if any(word in text for word in ["再見", "掰掰", "bye"]): return get_response("goodbye") # 使用 NER(人名/地點) for ent in doc.ents: if ent.label_ == "PERSON": return f"你提到了 {ent.text},他是你的朋友嗎?" if ent.label_ == "GPE": return f"{ent.text} 聽起來是個地方" return get_response("default") if __name__ == "__main__": print("ChatBot 已啟動,輸入「bye」結束對話") while True: user_input = input("你:") if user_input.strip() == "": continue response = respond_to_user(user_input) print("ChatBot:", response) if user_input in ["bye","再見", "掰掰"]: break

備註:

NER (命名實體識別)是什麼

一般指識別文本中具有特定意義的實體,指的是可以用專有名詞標識的事物,通常包括人名、地名、組織機構名、日期時間、專有名詞等文字。

測試

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 12:29:07

10 个AI写作工具,助继续教育学生轻松写论文!

10 个AI写作工具,助继续教育学生轻松写论文! AI写作工具,让论文之路更轻松 在当前的继续教育环境中,学生和科研工作者常常面临论文写作的压力。无论是开题报告、文献综述,还是最终的毕业论文,都需要大量的时…

作者头像 李华
网站建设 2026/4/16 9:04:50

旧文章自动更新发布时间伪装成新内容|会被谷歌惩罚吗?

把三年前的文章修改发布时间伪装成新内容,流量短期上涨后又暴跌?不少站长误以为只要调整时间戳就能"激活"旧内容,实则可能触发搜索引擎的惩罚机制。本文基于Google2023年算法更新实测数据,给出3种被官方白皮书认可的旧内…

作者头像 李华
网站建设 2026/4/15 21:54:16

GraniStudio:IO初始化以及IO资源配置例程

1.文件运行 导入工程 双击运行桌面GraniStudio.exe。 通过引导界面导入IO初始化以及IO资源配置例程,点击导入按钮。 打开IO初始化以及IO资源配置例程所在路径,选中IO初始化以及IO资源配置.gsp文件,点击打开,完成导入。 2.功能说明…

作者头像 李华
网站建设 2026/4/16 9:04:26

GraniStudio:IO读取例程

1.文件运行 导入工程 双击运行桌面GraniStudio.exe。 通过引导界面导入IO读取例程,点击导入按钮。 打开IO读取例程所在路径,选中IO读取.gsp文件,点击打开,完成导入。 2.功能说明 实现输入IO读取以及显示。 2.1通过初始化IO算子…

作者头像 李华
网站建设 2026/4/16 11:06:21

【C++】2.3 二叉搜索树的实现(附代码)

二叉搜索树左子树<根&#xff0c;右子树>根根据需求不同&#xff0c;等于的元素可能会被去重也可能会被留下这样查找一个数就可以只遍历一次&#xff0c;数大选哪个右走&#xff0c;小往左走查找效率&#xff1a;ologn~on改进&#xff1a;AVL树&#xff0c;红黑树&#x…

作者头像 李华