news 2026/4/16 18:20:31

【pytorch】transform的使用

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【pytorch】transform的使用

一、transforms的用法

transforms​ 是数据预处理与增强的核心工具,主要用于将原始图像转换为模型可接受的格式,并通过随机变换丰富数据集以提高模型泛化能力。
导入方式:

fromtorchvisionimporttransforms

主要用法,按顺序

transform_pipeline=transforms.Compose([transforms.Resize(256),# 调整图像大小至256x256(保持宽高比)transforms.CenterCrop(224),# 从中心裁剪224x224区域(常用预训练模型输入尺寸)transforms.RandomHorizontalFlip(p=0.5),# 以50%概率水平翻转(数据增强)transforms.ToTensor(),# 将PIL图像转换为Tensor(像素值缩放至[0,1])transforms.Normalize(# 标准化(使用ImageNet均值/方差)mean=[0.485,0.456,0.406],# RGB通道均值std=[0.229,0.224,0.225]# RGB通道标准差)])

二、transform的使用

将PIL图像转换成Tensor类型

fromPILimportImagefromtorchvisionimporttransforms img_path=r'data/train/ants_image/0013035.jpg'img=Image.open(img_path)tensor_trans=transforms.ToTensor()tensor_img=tensor_trans(img)print(tensor_img.shape)#CHW


通过tensor()类型的数据生成tensorboard图

fromPILimportImagefromtorch.utils.tensorboardimportSummaryWriterfromtorchvisionimporttransforms img_path=r'data/train/ants_image/0013035.jpg'img=Image.open(img_path)tensor_trans=transforms.ToTensor()tensor_img=tensor_trans(img)# print(tensor_img.shape) #CHWwriter=SummaryWriter('logs')writer.add_image('tensor_img',tensor_img,0)writer.close()


Normalize()归一化使用

fromPILimportImagefromtorch.utils.tensorboardimportSummaryWriterfromtorchvisionimporttransforms img_path=r'data/train/ants_image/0013035.jpg'img=Image.open(img_path)tensor_trans=transforms.ToTensor()tensor_img=tensor_trans(img)# print(tensor_img.shape) #CHWwriter=SummaryWriter('logs')norm_trans=transforms.Normalize([0.485,0.456,0.406],[0.5,0.5,0.5])norm_img=norm_trans(tensor_img)writer.add_image('tensor_img',tensor_img,0)writer.add_image('norm_img',norm_img,1)writer.close()

归一化后的图片和未归一化的图片

Resize()调整大小的使用

fromPILimportImagefromtorch.utils.tensorboardimportSummaryWriterfromtorchvisionimporttransforms img_path=r'data/train/ants_image/0013035.jpg'img=Image.open(img_path)tensor_trans=transforms.ToTensor()tensor_img=tensor_trans(img)# print(tensor_img.shape) #CHWwriter=SummaryWriter('logs')norm_trans=transforms.Normalize([0.485,0.456,0.406],[0.5,0.5,0.5])norm_img=norm_trans(tensor_img)# print(img.size)resize_trans=transforms.Resize((256,256))resize_img=resize_trans(tensor_img)writer.add_image('resize_img',resize_img,0)# print(resize_img.size)#Compose用法trans_resize_2=transforms.Compose([transforms.Resize((512)),transforms.ToTensor()])img_resize_2=trans_resize_2(img)writer.add_image('tensor_img',tensor_img,0)writer.add_image('norm_img',norm_img,1)writer.add_image('img_resize_2',img_resize_2,2)writer.close()

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 14:50:14

EmotiVoice赋能有声书制作:自动生成带情节情绪的朗读

EmotiVoice赋能有声书制作:自动生成带情节情绪的朗读 在有声内容爆发式增长的今天,听众早已不满足于“能听就行”的机械朗读。一部真正打动人心的有声书,需要语气的起伏、情感的流动,甚至角色性格的细微差别——这些原本只能由专业…

作者头像 李华
网站建设 2026/4/15 23:55:50

情人节专属:用爱人声音生成甜蜜告白

情人节专属:用爱人声音生成甜蜜告白 在智能语音助手每天机械地报天气、设闹钟的今天,你有没有想过——它也能轻声说一句:“亲爱的,我想你了”?而且,是用你爱人的声音。 这听起来像科幻电影的情节&#xff0…

作者头像 李华
网站建设 2026/4/16 10:20:29

让AI语音成为桥梁,而不是替代

让AI语音成为桥梁,而不是替代 在虚拟助手机械地念出天气预报、有声书用千篇一律的语调讲述跌宕起伏的故事时,我们不禁要问:为什么技术越先进,声音反而越“不像人”? 语音的本质是情感的载体。人类交流中超过70%的信息…

作者头像 李华
网站建设 2026/4/16 10:20:53

少数民族语言支持计划:EmotiVoice在行动

少数民族语言支持计划:EmotiVoice在行动 在云南红河的清晨,一位哈尼族老人用母语讲述着古老的迁徙传说。这段声音被录下后,仅用了8秒钟音频和一段数字化文本,一个属于他音色的“数字分身”便开始朗读更多未曾录制过的古歌——语气…

作者头像 李华
网站建设 2026/4/16 10:20:19

EmotiVoice在安静/嘈杂环境下的播放效果

EmotiVoice在安静与嘈杂环境下的语音表现力解析 在车载导航提示音被引擎轰鸣淹没、有声书朗读因语调平直而令人昏昏欲睡的今天,用户对语音交互的真实感和适应性提出了前所未有的高要求。传统TTS系统虽然能“说话”,却常常“无情”也“无魂”。而EmotiVoi…

作者头像 李华
网站建设 2026/4/16 10:20:08

EmotiVoice在直播场景的应用设想:实时生成主播语音

EmotiVoice在直播场景的应用设想:实时生成主播语音 在一场深夜的带货直播中,弹幕突然刷起“主播累了,快休息吧”。镜头前的真人主播确实已连续讲解三小时,声音略显疲惫。但就在此时,画面一转——一个音色几乎完全一致、…

作者头像 李华