Hunyuan-MT ProStreamlit终端扩展：添加历史记录导出CSV/Excel功能-编程阁

Hunyuan-MT Pro Streamlit终端扩展：添加历史记录导出CSV/Excel功能

1. 项目背景与需求

Hunyuan-MT Pro是基于腾讯混元（Hunyuan-MT-7B）开源模型构建的现代化翻译Web终端。这个工具已经提供了流畅的多语言翻译体验，但在实际使用中，用户经常需要保存翻译历史记录以便后续参考或分析。

当前版本缺少历史记录导出功能，导致用户不得不手动复制粘贴翻译结果。本文将介绍如何为Hunyuan-MT Pro添加历史记录导出功能，支持CSV和Excel两种格式。

2. 功能设计与实现思路

2.1 核心功能设计

新增的历史记录导出功能需要实现以下核心能力：

自动记录：保存每次翻译的源文本、目标文本、时间戳和语言对
数据持久化：使用轻量级数据库存储历史记录
导出选项：提供CSV和Excel两种导出格式
界面集成：在Streamlit侧边栏添加导出控制面板

2.2 技术方案选择

为实现这些功能，我们采用以下技术方案：

数据存储：使用SQLite数据库，轻量且无需额外配置
数据处理：Pandas DataFrame用于数据转换和导出
界面组件：Streamlit原生表单和按钮组件
文件导出：
- CSV：使用Pandas的to_csv()
- Excel：使用Pandas的to_excel()配合openpyxl引擎

3. 代码实现步骤

3.1 数据库初始化

首先在app.py中添加数据库初始化代码：

import sqlite3 from datetime import datetime # 初始化数据库 def init_db(): conn = sqlite3.connect('translation_history.db') c = conn.cursor() c.execute('''CREATE TABLE IF NOT EXISTS translations (id INTEGER PRIMARY KEY AUTOINCREMENT, source_text TEXT, target_text TEXT, source_lang TEXT, target_lang TEXT, timestamp DATETIME)''') conn.commit() conn.close() # 在应用启动时调用 init_db()

3.2 记录翻译历史

修改翻译函数，添加记录功能：

def save_translation(source_text, target_text, source_lang, target_lang): conn = sqlite3.connect('translation_history.db') c = conn.cursor() c.execute("INSERT INTO translations (source_text, target_text, source_lang, target_lang, timestamp) VALUES (?, ?, ?, ?, ?)", (source_text, target_text, source_lang, target_lang, datetime.now())) conn.commit() conn.close() # 在翻译函数调用后添加 save_translation(input_text, translated_text, source_lang, target_lang)

3.3 添加导出界面

在Streamlit侧边栏添加导出控制面板：

import pandas as pd from io import BytesIO # 在侧边栏添加导出部分 with st.sidebar.expander(" 历史记录导出"): # 获取所有历史记录 conn = sqlite3.connect('translation_history.db') df = pd.read_sql_query("SELECT * FROM translations", conn) conn.close() if not df.empty: st.write(f"共 {len(df)} 条历史记录") # 导出格式选择 export_format = st.radio("导出格式", ["CSV", "Excel"]) # 导出按钮 if st.button("导出历史记录"): if export_format == "CSV": csv = df.to_csv(index=False).encode('utf-8') st.download_button( label="下载CSV文件", data=csv, file_name='translation_history.csv', mime='text/csv' ) else: output = BytesIO() with pd.ExcelWriter(output, engine='openpyxl') as writer: df.to_excel(writer, index=False) st.download_button( label="下载Excel文件", data=output.getvalue(), file_name='translation_history.xlsx', mime='application/vnd.openxmlformats-officedocument.spreadsheetml.sheet' ) else: st.info("暂无历史记录")

4. 功能测试与优化

4.1 基础功能测试

测试要点包括：

翻译记录是否正确保存到数据库
导出功能是否正常工作
导出的文件内容是否完整准确
界面交互是否流畅

4.2 性能优化

对于大量历史记录的情况，添加分页查询和性能优化：

# 优化后的查询函数 def get_history_data(limit=1000): conn = sqlite3.connect('translation_history.db') df = pd.read_sql_query(f"SELECT * FROM translations ORDER BY timestamp DESC LIMIT {limit}", conn) conn.close() return df

4.3 用户体验改进

添加更多实用功能提升用户体验：

# 在导出面板中添加更多选项 with st.sidebar.expander(" 历史记录导出"): if not df.empty: # 添加时间范围筛选 min_date = pd.to_datetime(df['timestamp']).min().date() max_date = pd.to_datetime(df['timestamp']).max().date() date_range = st.date_input("选择时间范围", [min_date, max_date]) # 添加语言对筛选 lang_pairs = df[['source_lang', 'target_lang']].drop_duplicates() selected_pair = st.selectbox("选择语言对", [f"{row['source_lang']}→{row['target_lang']}" for _, row in lang_pairs.iterrows()]) # 根据筛选条件过滤数据 filtered_df = df[ (pd.to_datetime(df['timestamp']).dt.date >= date_range[0]) & (pd.to_datetime(df['timestamp']).dt.date <= date_range[1]) & (df['source_lang'] == selected_pair.split('→')[0]) & (df['target_lang'] == selected_pair.split('→')[1]) ] # 使用过滤后的数据进行导出 # ...