news 2026/6/10 9:06:20

非结构化数据的隐私性较低吗?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
非结构化数据的隐私性较低吗?

从听过任何关于人工智能讨论的调查来看,我们都知道隐私很重要。

我们一次又一次地听到人们谈论如何实现某种类型的人工智能系统,但他们担心涉及的隐私问题。

有时候,从整体格局的细致角度来看,能让我们看到如何做得更好。

例如,新系统越来越能够分析非结构化数据,并将所有相关数据点聚合成统一整体。

这对隐私意味着什么?非结构化数据本质上就不那么个人化,也不那么敏感吗?

把这大量非结构化数据看作是涵盖各种可能涉及任何内容的信息的总包。从这个角度看,从这么宽广的字段获取数据似乎比收集一个精心填充的数据库(里面有人员身份和可能的敏感财务信息如账号等)要小得多。

但你仍然可以有一些相当私密的数据存在于非结构化数据集中。例如,一封与某人HIPAA信息相关的信件,至少在肉眼看来可能没有包含这些内容。但当你用更强大的引擎拿回洞察时,你可能会发现机器能够从一些意想不到的地方提取敏感数据。

社交媒体的例子就是看待这个问题的一种方式。社交媒体是非结构化数据——我们都知道这一点——我们习惯在Facebook或 X 或微博 或在这上看到各种关于自己的故事。你可能会想,嗯,它没有我的社会安全号码或银行账户号码。但鱼叉式钓鱼者并不总是需要这些标识符,只要他们有正确的故事。此外,人工智能可能能够整合各种推断、时间线和影响,构建出令人恐惧的个人故事。比如想想保险欺诈侦探如何利用社交媒体。它可能会抓到欺诈行为——但侵入性有多大?

那么,新的人工智能系统是如何做到这一点的呢?如果你看硬件,我们正进入一个人工智能可以从更结构化数据集转向一种通用技术,吸收大量数据,以至于你可能会认为它接近普世知识的时代。

在最近一次参与某个AI活动中,一位专家谈到了一款拥有90万个核心和40亿晶体管的芯片,它便于扩展并消除并行编程。但她指出,这些系统在处理非结构化数据方面也更有能力。额外的能力有助于搜寻更广泛的知识库并收集你想要的东西。

“如今我们能够在单一系统上运行巨大的模型。因此,我们可以通过数据并行性快速且便捷地扩展。因此,不需要像威震天那样复杂的并行编程库......作为企业,通过开发者使用我们的系统,他们可以专注于人工智能,而非复杂的并行编程。因此,他们可以更快地开始和扩展工作。

一个视角是数据治理。你可以识别数据在AWS对象存储中的位置,以及随之而来的元数据。你可以开始分析AI是否能够从它通过非结构化数据中收集到的零碎信息构建敏感信息模型。首先,正如许多人现在问的那样:谁拥有这些数据?

随着进展,我们将开始看到隐私威胁的所在。或者如果我们不这样做,可能会在用户的个人体验层面看到这些问题,人们理所当然地感到不满。

我得说硬件本身相当令人印象深刻。这些工艺远远超出了多核技术的简单概念。看起来他们会把明天的数据中心变成你手中拿着的东西。

无论如何,当我们思考非结构化数据时,我们应该考虑它被简化、精炼和精炼后会是什么样子,机器能从中推测出关于你的一切!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/8 19:12:11

33、利用TiMidity搭建卡拉OK系统全攻略

利用TiMidity搭建卡拉OK系统全攻略 1. TiMidity基础介绍 TiMidity本质上是一款MIDI播放器,并非专门的卡拉OK播放器,不过它具备一定的可扩展性,经过配置后也能用于卡拉OK场景。默认情况下,它仅播放MIDI音乐并打印歌词。例如,运行以下命令: $timidity ../54154.mid执行…

作者头像 李华
网站建设 2026/6/9 19:40:20

骨髓来源抑制细胞(MDSC)

骨髓来源抑制细胞(Myeloid-derived suppressor cells, MDSC)分为粒形/多核形MDSCs(G-MDSC或PMN-MDSC)与MNP样MDSCs(M-MDSC)。单核吞噬细胞(Mononuclear phagocytes (MNPs))包括单核细胞、巨噬细胞和树突状细…

作者头像 李华
网站建设 2026/6/7 20:05:29

14、邮件系统的插件、安全及配置全解析

邮件系统的插件、安全及配置全解析 在当今数字化的时代,邮件系统是我们日常工作和生活中不可或缺的一部分。无论是个人用户收发邮件,还是企业进行业务沟通,一个稳定、安全且功能丰富的邮件系统至关重要。下面将详细介绍邮件系统相关的插件、安全防护以及配置方法。 一、Sq…

作者头像 李华
网站建设 2026/6/10 3:11:16

22、Procmail 正则表达式及高级应用全解析

Procmail 正则表达式及高级应用全解析 正则表达式简介 正则表达式是处理数据的强大工具。在 Procmail 中,正则表达式的实现与其他 UNIX 实用程序略有不同。Procmail 的匹配默认情况下不区分大小写,除非使用 D 标志,并且默认使用多行匹配。 简单来说,正则表达式可以理解为…

作者头像 李华
网站建设 2026/6/8 13:06:18

3大维度解锁reMarkable客户端:从基础操作到专业工作流

3大维度解锁reMarkable客户端:从基础操作到专业工作流 【免费下载链接】awesome-reMarkable A curated list of projects related to the reMarkable tablet 项目地址: https://gitcode.com/gh_mirrors/aw/awesome-reMarkable reMarkable客户端生态提供了多样…

作者头像 李华
网站建设 2026/6/3 12:59:39

胡桃工具箱:免费开源的终极原神智能助手

胡桃工具箱:免费开源的终极原神智能助手 【免费下载链接】Snap.Hutao 实用的开源多功能原神工具箱 🧰 / Multifunctional Open-Source Genshin Impact Toolkit 🧰 项目地址: https://gitcode.com/GitHub_Trending/sn/Snap.Hutao 还在为…

作者头像 李华