ERNIE-4.5轻量版PT模型开源：0.36B参数文本生成新选择-编程阁

百度ERNIE系列再添新成员，轻量级模型ERNIE-4.5-0.3B-Base-PT正式开源，以0.36B参数量为开发者提供高效文本生成解决方案。

【免费下载链接】ERNIE-4.5-0.3B-Base-PT项目地址: https://ai.gitcode.com/hf_mirrors/baidu/ERNIE-4.5-0.3B-Base-PT

发展趋势：轻量化大模型成应用落地新趋势

随着大语言模型技术的快速迭代，行业正从追求参数量规模转向"效率优先"的发展阶段。据近期市场研究显示，2024年轻量级模型（1B参数以下）的下载量同比增长300%，尤其在边缘计算、嵌入式设备和低资源场景中需求激增。百度此次推出的ERNIE-4.5轻量版PT模型，正是顺应这一趋势，在保持核心能力的同时，大幅降低部署门槛。

模型亮点：小参数实现高效文本生成

ERNIE-4.5-0.3B-Base-PT作为百度ERNIE 4.5系列的轻量级代表，具备三大核心优势：

1. 极致轻量化设计

模型仅包含0.36B参数，采用18层网络结构和16个注意力头设计，同时支持长达131072 tokens的上下文窗口。这种"小而精"的架构使其能够在普通GPU甚至高性能CPU上高效运行，显著降低硬件投入成本。

2. 跨框架兼容性

该模型提供PyTorch版本权重（PT模型），完美兼容Hugging Face Transformers生态。开发者可直接使用熟悉的transformers库进行调用，无需额外学习新框架，极大提升开发效率。

3. 承袭ERNIE 4.5核心技术

虽然参数规模减小，但模型继承了ERNIE 4.5系列的多项关键技术创新，包括异构MoE结构设计、模态隔离路由机制以及高效量化技术等，确保在小参数量下仍保持良好的文本生成质量。

应用场景与部署指南

ERNIE-4.5-0.3B-Base-PT特别适合以下应用场景：

智能客服自动回复
内容自动补全
代码辅助生成
嵌入式设备端文本处理

模型部署极为简便，通过transformers库可实现快速调用：

import torch from transformers import AutoModelForCausalLM, AutoTokenizer model_name = "baidu/ERNIE-4.5-0.3B-Base-PT" tokenizer = AutoTokenizer.from_pretrained(model_name) model = AutoModelForCausalLM.from_pretrained( model_name, device_map="auto", torch_dtype=torch.bfloat16, ) prompt = "大语言模型的发展趋势是" model_inputs = tokenizer([prompt], add_special_tokens=False, return_tensors="pt").to(model.device) generated_ids = model.generate(**model_inputs, max_new_tokens=1024) result = tokenizer.decode(generated_ids[0].tolist(), skip_special_tokens=True)

对于追求更高性能的场景，模型还支持vLLM等加速框架部署，通过简单命令即可启动高性能推理服务：

vllm serve baidu/ERNIE-4.5-0.3B-Base-PT --trust-remote-code

技术影响：推动大模型普惠化发展

ERNIE-4.5轻量版PT模型的开源，将进一步推动大语言模型技术的普惠化进程。对于中小企业和独立开发者而言，无需庞大的计算资源即可接入优质大模型能力；对于企业用户，可显著降低推理成本，实现大规模部署。

该模型采用Apache 2.0开源协议，允许商业使用，这将加速其在各行业的应用落地。尤其在智能硬件、物联网设备等资源受限场景，ERNIE-4.5-0.3B-Base-PT有望成为首选的文本生成解决方案。

结论与前瞻

ERNIE-4.5-0.3B-Base-PT的推出，展现了百度在大模型轻量化领域的技术实力，也标志着大语言模型产业进入"精准匹配"新阶段——根据不同应用场景提供恰到好处的模型能力，而非一味追求参数规模。

随着轻量级模型生态的不断完善，我们有理由相信，未来会有更多创新应用在边缘设备、移动终端等场景涌现，真正实现大模型技术的"无处不在"。对于开发者而言，现在正是探索轻量级模型应用的最佳时机。

【免费下载链接】ERNIE-4.5-0.3B-Base-PT项目地址: https://ai.gitcode.com/hf_mirrors/baidu/ERNIE-4.5-0.3B-Base-PT

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

Qwen3-8B-Base：119种语言的32K长文本模型

大语言模型领域再添新成员，Qwen3系列推出Qwen3-8B-Base预训练模型，以82亿参数实现32K上下文长度与119种语言支持的双重突破，重新定义中端模型性能标准。【免费下载链接】Qwen3-8B-Base Qwen3-8B-Base具有以下特点： 类型&#xff…

李华

Voxtral-Small：24B多语言音文全能模型

Mistral AI推出最新多模态大模型Voxtral-Small-24B-2507，首次实现语音与文本能力的深度融合，支持8种语言的自动语音识别、翻译及理解，重新定义智能交互边界。【免费下载链接】Voxtral-Small-24B-2507 项目地址: https://ai.gitcode.com/h…