最近,YouTube 向用户发起 AI 视频质量调查,官方称是为打击低质量 AI 内容,但有人认为是帮谷歌训练 AI。其实,谷歌早有借用户之力采集数据的先例。
YouTube 让用户对视频是否为「AI 烂片」打分,官方解释是打击低质量 AI 内容。但有人质疑,这是在利用 1.22 亿活跃用户的数据,为谷歌旗下的 AI 视频生成模型 Veo 训练。谷歌还投资了儿童 AI 视频初创公司,这一系列操作引发诸多猜测。
2000 年前后,垃圾邮件机器人泛滥,卡内基梅隆大学教授路易斯・冯・安发明 CAPTCHA 图形验证码。2007 年,他推出 reCAPTCHA,用户完成验证的同时帮助完成古籍数字化。2009 年,谷歌收购了它。
2012 年前后,谷歌街景采集车需要数据标注。reCAPTCHA v2 让用户通过点击照片完成标注,鼎盛时全球每天有 2 亿个被完成,谷歌每天获取免费劳动价值达 500 万美元。它几乎无处不在,用户难以绕行。
这些数据流向谷歌地图和 Waymo。谷歌地图的底层能力部分建立在人工标注上,Waymo 自动驾驶所需核心训练数据也来自用户标注。如今 Waymo 估值 450 亿美元,仍在扩张。
2018 年,reCAPTCHA 推出 v3 版本,在后台静默运行,收集用户行为数据。有人认为谷歌利用安全机制收割数据,用户却不知情且无收益。YouTube 对 AI 视频打分似有同样嫌疑。
编辑观点:谷歌借用户之力采集数据,虽有一定创造性,但在用户权益保护上有所欠缺。未来,科技公司应在数据采集与用户权益间找到平衡。