news 2026/4/16 10:59:40

特征工程十年演进(2015–2025)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
特征工程十年演进(2015–2025)

特征工程十年演进(2015–2025)

一句话总论:
2015年特征工程还是“手工统计+领域专家经验+低维特征拼接”的工程时代,2025年已进化成“万亿级多模态VLA大模型原生特征+实时意图级自适应表示+量子鲁棒自进化+全域具身零样本特征”的普惠智能时代,中国从跟随手工特征跃升全球领跑者(华为盘古、阿里通义千问、百度文心、DeepSeek、小鹏/银河VLA等主导),特征工程渗透率从>90%降至<10%(新项目),手工特征从必备到几乎消失,特征质量从~80%泛化率飙升至>99%全场景零样本,推动AI从“专家手工调参”到“大模型原生意图级表示”的文明跃迁。

十年演进时间线总结
年份核心范式跃迁代表技术/工具特征质量(泛化提升)/自动化程度主要应用/渗透率中国贡献/里程碑
2015手工统计+领域专家手工统计特征 + One-hot~70–80% / 手工为主表格/图像特征阿里/腾讯手工特征工程,中国Kaggle中国队起步
2017自动化初步+嵌入表示Featuretools / Entity Embedding~80–85% / 半自动类别/序列特征华为/百度初代嵌入特征,中国产业化起步
2019深度特征+学习表示爆发CNN/RNN自动特征 + TabNet~85–90% / 初步自动图像/文本深度特征Momenta/地平线车载深度特征量产
2021大模型预训练特征元年BERT/GPT嵌入 + LoRA微调~90–93% / 大模型辅助少样本迁移华为盘古 + 小鹏智驾大模型特征
2023多模态VLA原生特征元年CLIP/VLA Embed + UniFeature~95–97% / 大模型原生跨模态意图特征阿里通义千问 + 百度文心一格 + DeepSeek多模态特征
2025VLA自进化+量子鲁棒终极形态Grok-4 Embed / DeepSeek-Feature>99% / 全域自进化(量子鲁棒)全域社交意图零样本特征华为盘古特征 + DeepSeek万亿 + 小鹏/银河量子级特征
1.2015–2018:手工统计+领域专家时代
  • 核心特征:特征工程以手工统计(均值/方差/分桶)+One-hot编码+领域专家经验为主,低维拼接,泛化率70–85%,完全依赖专家。
  • 关键进展
    • 2015年:Kaggle竞赛手工特征霸榜。
    • 2016–2017年:Entity Embedding类别嵌入初步。
    • 2018年:Featuretools自动化规则初步。
  • 挑战与转折:手工重、泛化弱;深度学习+自动化特征兴起。
  • 代表案例:阿里淘宝/京东手工特征工程,中国电商推荐领先。
2.2019–2022:深度特征+自动化时代
  • 核心特征:CNN/RNN/TabNet自动特征提取+Featuretools/Deep Feature Synthesis自动化,泛化率85–93%,实时化初探。
  • 关键进展
    • 2019年:TabNet注意力表格特征。
    • 2020–2021年:DeepFM/FiGNN深度特征融合。
    • 2022年:Momenta/地平线车载深度特征量产。
  • 挑战与转折:手工仍重;大模型预训练特征需求爆发。
  • 代表案例:小鹏NGP + 华为ADS 2.0深度特征感知。
3.2023–2025:多模态VLA原生自进化时代
  • 核心特征:万亿级多模态大模型+VLA端到端原生特征+意图级动态表示+量子辅助鲁棒,自进化(越用越准),泛化率>99%。
  • 关键进展
    • 2023年:CLIP Embed多模态+VLA原生特征,阿里通义千问/百度文心一格首发。
    • 2024年:DeepSeek/Grok-4专用特征,量子混合精度。
    • 2025年:华为盘古特征 + DeepSeek万亿 + 通义千问量子级,全域社交意图零样本特征+行动直出,普惠7万级智驾/机器人。
  • 挑战与转折:黑箱/长尾;量子+大模型自进化标配。
  • 代表案例:比亚迪天神之眼(7万级多模态意图级特征),银河通用2025人形(VLA动态意图特征)。
一句话总结

从2015年手工统计拼接的“专家特征工程”到2025年VLA量子自进化的“全域意图级原生表示”,十年间特征工程由手工规则转向多模态语义闭环,中国主导深度特征→预训练嵌入→VLA原生特征创新+万亿实践+普惠下沉,推动AI从“特征调参地狱”到“大模型零样本意图级理解”的文明跃迁,预计2030年手工特征工程渗透率<1%+全域永不失真自愈。

数据来源于arXiv综述、IROS 2025及中国厂商技术白皮书。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 10:37:56

如何快速搭建图像识别服务?ResNet18 CPU优化镜像上手体验

如何快速搭建图像识别服务&#xff1f;ResNet18 CPU优化镜像上手体验 在人工智能应用日益普及的今天&#xff0c;图像识别已成为智能安防、内容审核、自动化分类等场景的核心能力。然而&#xff0c;从零搭建一个稳定、高效的图像识别服务&#xff0c;往往需要深厚的深度学习背…

作者头像 李华
网站建设 2026/4/15 9:46:17

可视化文本智能分类|AI万能分类器WebUI使用全解

可视化文本智能分类&#xff5c;AI万能分类器WebUI使用全解“无需训练&#xff0c;即输即分”——基于StructBERT的零样本分类WebUI&#xff0c;让文本打标像填空一样简单。在舆情监控、工单处理、用户反馈分析等场景中&#xff0c;自动文本分类是提升效率的核心能力。传统方案…

作者头像 李华
网站建设 2026/4/3 6:45:29

全网最全专科生必备AI论文软件TOP8测评

全网最全专科生必备AI论文软件TOP8测评 2026年专科生必备AI论文软件测评&#xff1a;从功能到体验的深度解析 随着AI技术的快速发展&#xff0c;越来越多的专科生开始借助智能工具提升论文写作效率。然而&#xff0c;面对市场上琳琅满目的AI论文软件&#xff0c;如何选择真正适…

作者头像 李华
网站建设 2026/4/1 22:35:08

亲测好用10个AI论文网站,本科生毕业论文轻松搞定!

亲测好用10个AI论文网站&#xff0c;本科生毕业论文轻松搞定&#xff01; AI 工具如何让论文写作更高效&#xff1f; 在当今这个信息爆炸的时代&#xff0c;越来越多的本科生开始借助 AI 工具来辅助自己的毕业论文写作。尤其是在面对繁重的文献阅读、数据整理以及论文撰写任务时…

作者头像 李华
网站建设 2026/4/15 18:19:48

1小时打造冲浪游戏原型验证创意

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容&#xff1a; 快速生成一个冲浪游戏概念验证原型&#xff0c;需要包含&#xff1a;1. 可操作的角色控制器 2. 基础碰撞检测 3. 简单关卡地形 4. 临时美术素材&#xff08;可使用几何图形&#x…

作者头像 李华
网站建设 2026/4/11 9:13:28

AI万能分类器部署教程:Docker容器化配置指南

AI万能分类器部署教程&#xff1a;Docker容器化配置指南 1. 引言 在当今信息爆炸的时代&#xff0c;文本数据的自动化处理已成为企业提升效率的关键。无论是客服工单、用户反馈还是新闻资讯&#xff0c;如何快速准确地对海量文本进行分类&#xff0c;是构建智能系统的核心需求…

作者头像 李华