news 2026/4/15 18:41:44

Meta-Llama-3.1-8B-bnb-4bit 下载加载

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Meta-Llama-3.1-8B-bnb-4bit 下载加载

Meta-Llama-3.1-8B-bnb-4bit 加载:

from huggingface_hub import InferenceClient from torch import nn from transformers import ( AutoModel, AutoProcessor, AutoTokenizer, AutoModelForCausalLM, PreTrainedTokenizer, PreTrainedTokenizerFast, BitsAndBytesConfig, ) from pathlib import Path import torch from PIL import Image import os # =============================== # CLIP (SigLIP) # # =============================== # model_id = "google/siglip-so400m-patch14-384" # CLIP_PATH = download_hg_model(model_id, "clip") # clip_processor = AutoProcessor.from_pretrained( # CLIP_PATH, # trust_remote_code=True # ) # clip_model = AutoModel.from_pretrained( # CLIP_PATH, # trust_remote_code=True # ) # clip_model = clip_model.vision_model # clip_model.eval() # clip_model.requires_grad_(False) # clip_model.to("cuda") # =============================== # LLM (LLaMA 3.1 4bit) # =============================== MODEL_PATH = "/data/lbg/models/textoon/ComfyUI/models/LLM/Meta-Llama-3.1-8B-bnb-4bit" tokenizer = AutoTokenizer.from_pretrained( MODEL_PATH, trust_remote_code=True, use_fast=True ) assert isinstance( tokenizer, (PreTrainedTokenizer, PreTrainedTokenizerFast) ), f"Tokenizer is of type {type(tokenizer)}" # ⭐ 2️⃣ bitsandbytes 4bit 配置(关键) bnb_config = BitsAndBytesConfig( load_in_4bit=True, bnb_4bit_quant_type="nf4", bnb_4bit_compute_dtype=torch.float16, bnb_4bit_use_double_quant=True, ) # ⭐ 3️⃣ 正确加载 4bit 模型 text_model = AutoModelForCausalLM.from_pretrained( MODEL_PATH, quantization_config=bnb_config, device_map="auto", trust_remote_code=True, ) text_model.eval()
pip install bitsandbytes
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/14 0:48:52

图像编码成特征向量

目录 siglip-so400m-patch14-384 下载地址: 推理示例: 提取特征 测试代码: 图像编码成特征向量 siglip-so400m-patch14-384 名称:siglip-so400m-patch14-384 系列:CLIP(Contrastive Language–Image P…

作者头像 李华
网站建设 2026/4/13 18:20:56

图像提示词反推 图像获取提示词

目录 textoon部署踩坑,用到了插件 Comfyui_CXH_joy_caption textoon部署踩坑,用到了插件 Comfyui_CXH_joy_caption https://blog.csdn.net/jacke121/article/details/155942636 Comfyui_CXH_joy_caption https://github.com/StartHua/Comfyui_CXH_jo…

作者头像 李华
网站建设 2026/4/13 5:33:43

QtC++定时3秒执行槽函数实战

记忆要点// 连接超时信号到槽函数QObject::connect(timer, &QTimer::timeout, &myObject, &MyClass::delayedSlot);1.QtC定时3秒执行槽函数实战在Qt C中实现3秒后执行槽函数,推荐使用QTimer的单次定时模式。以下是完整实现步骤和代码示例:核…

作者头像 李华
网站建设 2026/4/15 23:58:53

.NET 10 社区SDK(Loongarch 和 RISC-V)

一、Loongarch(loongarch64 / Loongson)上 .NET 10概览发布:v10.0.100-loongarch64(tag)发布者(自动化):github-actions[bot]发布时间(UTC):2025-…

作者头像 李华
网站建设 2026/4/16 12:20:46

【期末分析题与改错题】

文章目录一、程序分析题项目结构分析题01分析题02分析题03分析题04二、程序改错题项目结构改错题01改错题02改错题03改错题04改错题05改错题06一、程序分析题 项目结构 分析题01 代码: package ProgramAnalysis; /*** 1.定义一个二维数组arr,包含3行3…

作者头像 李华
网站建设 2026/4/14 23:22:15

每日八股——Go(4)

gRPC是什么? gRPC (Google Remote Procedure Call) 是一个由谷歌开发的高性能、开源的RPC(远程调用)框架。简单来说,他的核心目的是:让你调用远程服务器上的函数(方法),就像调用本…

作者头像 李华