news 2026/6/10 13:32:12

2010-2024年上市公司数据风险暴露词频数据

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
2010-2024年上市公司数据风险暴露词频数据

数据简介

数据风险暴露变量作为量化企业数据安全管理水平的核心指标,是衡量上市公司在数字化转型进程中数据治理能力与风险防控实力的关键标尺。随着《中华人民共和国数据安全法》《个人信息保护法》等法规的密集出台,数据风险已成为影响企业持续经营的重要因素,该变量通过文本挖掘技术将企业数据风险相关的定性信息转化为可量化的定量指标,有效填补“数据风险识别—风险程度度量—治理效果评估”分析链条中的数据空白,为监管部门完善数据安全监管政策、高校开展数据治理研究、投资者评估企业运营风险提供权威可靠的数据支撑。

本数据核心来源为2010-2024年中国A股上市公司年度报告中“管理层讨论与分析(MD&A)”部分的文本信息。数据构建过程严格遵循“基础关键词界定—语义拓展—精准匹配—清洗校验”的标准化流程:首先参考《工业和信息化领域数据安全风险信息报送与共享工作指引(2021)》(试行)及和国家互联网信息办公室印发的《国家网络安全事件应急预案(2017)》中对数据风险和网络风险的定义和具体分类,考虑到企业应用数字技术类型的差异还包括了各种数字技术的具体风险,界定了数据泄露、数据窜改、数据滥用、违规传输四大类基础关键词;随后基于Word2vec模型对基础关键词进行语义拓展,形成包含基础词与拓展词的完整关键词词典;再通过在MD&A文本中抓取相关内容并统计词频,最终以词频值作为数据风险暴露变量的核心度量,完整呈现2010-2024年各上市公司数据风险暴露的时序特征。

数据信息

  • 数据格式:excel
  • 数据字段:股票代码、年份、kw_sum、总词数

注:剩余“数据风险暴露”关键词已整合到txt文档中(如下图)

数据展示

参考文献

[1]陆瑶,施函青,周欣怡.中国企业数字技术风险暴露对企业价值的影响——来自大语言模型的文本分析证据[J].经济研究,2025,60(02):73-89.

【下载→

方式一(推荐):主页 ↓个人↓简介

经管数据库-CSDN博客

方式二:数据下载地址汇总_-CSDN博客

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 20:12:05

为什么90%的人无法成功部署Open-AutoGLM到手机?真相令人震惊

第一章:Open-AutoGLM如何部署到手机将 Open-AutoGLM 部署到手机设备上,能够实现本地化、低延迟的自然语言推理与生成能力。这一过程主要依赖于模型量化、移动端推理框架适配以及资源优化等关键技术。环境准备 在开始部署前,需确保开发环境已安…

作者头像 李华
网站建设 2026/6/10 10:55:51

M3u8Downloader_H:重新定义视频下载体验的专业工具

还在为在线视频资源无法保存而烦恼吗?🤔 M3u8Downloader_H 正是为这个痛点而生的专业解决方案!这款基于 .NET 6 开发的工具,让视频下载变得前所未有的简单高效。 【免费下载链接】M3u8Downloader_H [.net6]m3u8下载器,功能强大,多…

作者头像 李华
网站建设 2026/6/10 12:33:43

Open-AutoGLM插件性能实测:响应速度提升8倍的秘密是什么?

第一章:Open-AutoGLM插件性能实测:响应速度提升8倍的秘密是什么?在对 Open-AutoGLM 插件进行深度性能测试时,其平均响应时间从传统 GLM 调用的 1200ms 降低至 150ms,实现了高达 8 倍的性能提升。这一突破性表现背后&am…

作者头像 李华
网站建设 2026/6/10 12:35:09

宏智树ai-课程论文不是“小作业”,而是你学术能力的第一块试金石

大家好,我是专注论文写作科普的教育博主。今天想和大家聊一个常被低估的写作任务——课程论文。 很多同学觉得,课程论文不过是“期末凑学分的小作业”,随便拼凑点内容、引用几篇文献,交差就行。但如果你真的这样想,就…

作者头像 李华