王琳：逐梦大数据从探索到融合的蜕变之旅 | 提升之路系列（二）-编程阁

导读

为了发挥清华大学多学科优势，搭建跨学科交叉融合平台，创新跨学科交叉培养模式，培养具有大数据思维和应用创新的“π”型人才，由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块，形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式，显著提升了学生大数据分析能力和创新应用能力。

大数据领域以其技术前沿性和应用广泛性吸引了我。从学习中汲取养分，通过实践磨砺技能，并在科研和创新项目中展现综合能力，是我不断追求的目标。从研究生入学时对大数据领域的懵懂到如今的成长与积累，我逐步在专业技能、科研能力以及综合素质方面得到了显著的提升，为未来职业发展奠定了坚实的基础。下面我将从理论学习、科研项目、志愿服务等角度回顾我的能力提升之路。

夯实理论基础：学术学习中的自我突破

在学校的学习中，我选修了多门与大数据相关的课程，如《深度学习》、《数智安全与标准化》、《大数据系统基础（B）》和《大数据实践课》等。在学习《深度学习》课程时，我面临了许多挑战。深度学习本身是一门融合数学、编程和实际应用的交叉学科，对数学基础和编程能力要求很高。课程中涉及到大量的线性代数、概率论以及神经网络的底层原理，让我一度感到吃力。特别是在设计深度学习模型和优化算法时，我需要将抽象的理论知识应用于实践，不断调试代码以提高模型的精度。然而，通过认真研读教材、积极请教老师和同学，以及利用课余时间自学相关知识，我逐渐掌握了深度学习的核心概念与实现方法，为后续研究奠定了坚实的技术基础。

在《数智安全与标准化》和《大数据系统基础（B）》两门课程中，我积极担任了小组组长。这对我来说既是责任的担当，也是对能力的全面考验。作为组长，我需要协调组员分工、组织讨论并确保任务按时高质量完成。这些经历不仅提升了我的组织能力和沟通能力，也让我深刻体会到团队合作的重要性。这些角色的经历使我在解决实际问题时更加自信，也让我在团队中学会了如何成为一名高效的领导者。

而在《大数据实践课》中，我在中石化工程建设有限公司进行了为期八周的实践，担任组长带领组员开发了炼化装置能耗、碳排放预测模型，并取得了 A+的优异成绩。这不仅体现了我对理论知识的扎实掌握，还得益于我在之前课程中完成的丰富的实践任务。

通过这些课程，我不仅掌握了大数据的基本理论和技术框架，还深入了解了深度学习在大数据中的应用。这些学习经验使我具备了独立思考和解决问题的能力，为后续科研和实践打下了基础。

科研探索：从理论到应用的转化

理论学习是基础，而科研实践则是将知识转化为实际价值的桥梁。在我的科研探索中，我专注于不同学科背景与计算机的交叉应用。

在医学领域，我以心电图为例，展开健康传感数据过程异常发现研究。传统的时间序列异常检测多聚焦于单点异常，而忽略了系统整体的过程规律可能存在的异常。因此，我的研究以健康传感时间序列数据为切入点，结合事件发现、过程挖掘与基于过程的异常检测方法，构建了一套能够支持健康异常监测与健康风险因素预警的创新模型。由于缺乏相关领域知识，我投入了大量时间进行文献调研和技术尝试，从理论研究到技术实现，全方位探索健康数据处理的前沿方法。在此过程中，我不仅深入理解了时间序列数据分析的复杂性，还成功将理论与实际应用相结合，开发出具有实用价值的异常检测模型。最终，我还完成了论文《融合知识增强与过程挖掘的 12 导联心电图异常检测方法》，并发表在CBPM2025上。这一实践让我对大数据创新的意义有了更深刻的体会：它不仅是技术能力的体现，更是一种解决实际问题、服务社会需求的重要方法。

在石油化工领域，在中石化工程建设有限公司实践的过程中，我进行了炼化装置能耗、碳排放预测的研究。研究的核心在于结合稀疏特征提取和门控循环单元（GRU）模型，对炼化装置的能耗和碳排放进行预测。在研究中，我不仅需要从海量工业数据中提取关键特征，还需优化算法以提高模型的预测精度。该研究不仅让我熟悉了真实数据数据清洗、特征工程和模型优化的完整流程，还增强了我在科研中发现问题、解决问题的能力。针对这一研究，我还完成了论文《基于稀疏特征提取和门控循环环单元的炼化装置能耗预测方法研究》，并发表在《现代化工》期刊上。

社会服务与团队协作：能力的全面发展

除了学习和科研，我也积极参与到志愿服务和教学辅助工作中，以全面提升自己的综合能力。2024 年暑假，我作为志愿者参与了2024 中国高校计算机大赛的筹备与现场服务工作。在这项志愿活动中，我负责现场答辩区域的协调工作以及赛场秩序的维护。这段经历让我近距离见识到国内顶尖计算机人才的风采，感受到大数据和计算机技术的魅力，同时也让我在服务中培养了高度的责任感和组织协调能力。

我还担任了《数智安全与标准化》和《数智安全》课程的助教。作为助教，我主要负责组织同学们进行课前分享，在课后解答同学们的问题。同时，我承担了课程成绩的核算工作，确保每位同学的学习成果都能被公正客观地评价。通过这项工作，我不仅锻炼了与学生和教师之间的沟通能力，还提升了自己的细致度和时间管理能力。这段经历让我更加理解教学的意义，也让我在服务他人的过程中收获了满足感和成就感。

展望未来：持续提升与价值创造

回顾这段“能力提升之路 ”，每一次学习与实践都是我成长的阶梯。未来，我希望能够进一步提升专业技能，尤其是在医疗健康与大数据交叉领域，探索更多可能性。同时，我也期待通过创新创业，将科研成果转化为社会价值，为行业发展贡献力量。

大数据领域充满挑战，但更富机遇。我坚信，只要不断学习、实践与反思，成长的脚步永不会停止。

编辑：文婧

校对：林亦霖

关于我们

数据派THU作为数据科学类公众号，背靠清华大学大数据研究中心，分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识，努力建设数据人才聚集平台、打造中国大数据最强集团军。

新浪微博：@数据派THU

微信视频号：数据派THU

今日头条：数据派THU