超半数AI插件在悄悄收集隐私,你还敢用吗?

1天前
享受AI插件带来的便利,往往需要付出隐私的代价。

快检查一下你使用的AI插件吧,它们很可能是泄露你隐私的幕后推手。近期,数据删除服务机构Incogni发布的AI插件最新研究报告显示,在抽样调查的Chrome AI插件里,超半数存在收集用户数据的行为,其中近三分之一的插件还会获取能直接定位用户本人的个人可识别信息(PII)。



Incogni的研究人员对442款带有“AI”标识的插件进行深度分析后发现,这类插件常通过“脚本编写”权限,实时获取用户输入的内容或修改网页显示的信息。报告指出,编程助手、数学辅助工具、会议助理以及语音转录类插件的风险系数最高,其中不乏Grammarly(在线语法纠正和校对工具)、Quillbot(AI内容检测工具)等知名插件。


目前,用户手中存量设备的算力有限,所以业界向用户提供AI能力的主流方式仍是云端部署。这种方式无需用户在本地安装复杂的框架和运行库,只需下载一个App或打开一个网页就能使用。如此一来,AI插件就成了大家体验AI产品最便捷的途径,只需在浏览器点击安装,上网时就能获得AI的帮助。



不过,AI插件盯上用户数据几乎是必然的,因为“数据荒”已成为悬在所有AI厂商头顶的达摩克利斯之剑。《经济学人》曾提到,到2028年,互联网上所有高质量的文本数据可能会被使用完毕,机器学习的数据集甚至可能在2026年之前就耗尽所有“高质量语言数据”。这意味着“互联网上的可用信息几乎要被AI吸干了”。


缺乏足够的数据来迭代AI模型,是当前所有AI厂商都头疼的问题。为解决这一麻烦,“合成数据”在过去两年成为AI行业的热点,但实际应用中,合成数据难以避免欠拟合(Underfitting)甚至模型崩溃的缺陷。所以,单纯依靠合成数据,无法让AI模型实现突破性发展。



同时,手握数据的新闻媒体、内容平台、社交网站也逐渐“觉醒”,意识到自己手中的数据是AI厂商眼中的“香饽饽”。为此,版权方在全球范围内与AI厂商展开了一场场法律战。微软最近牵头推出“出版商内容市场”(PCM)计划,试图打造AI时代的内容授权集中平台,为AI模型训练提供合规的内容支撑。


既然数据有价值且不愁销路,AI插件开发者盯上用户输入内容也就不足为奇了。而用户的个人可识别信息价值更高,毕竟让广告投放更精准、高效是营销行业的终极课题之一。到了互联网时代,这个问题有了答案:当广告平台比用户更了解自己时,广告就能投其所好,这就是所谓的用户画像。


这时问题来了:监管在哪里?和App Store、Google Play、微软应用商店严格监管的软件不同,浏览器插件是一个被忽视的领域。即便谷歌Chrome商店对插件的审核也极为宽松,恶意插件绕过审核的报道时有发生。



值得注意的是,AI插件目前的分发方式并非围绕Chrome商店,而是以开发者的个人博客、AI社群链接、GitHub等途径为主。出现这种现象并非开发者有意绕开监管,而是效率至上的结果。当前AI圈日新月异,若等AI插件通过Chrome商店审核,类似的竞品可能早已遍地开花。


因此,先把有趣的点子展示给受众,成为AI开发者的普遍想法,老老实实走审核流程反而效率低下。从某种意义上说,在隐私保护和效率之间,AI开发者选择了后者。在缺乏监管且用户数据价值已形成共识的情况下,开发者难免会动不该动的心思。


说了这么多,一个简单的问题摆在眼前:大家是否愿意用隐私换取便利?超50%的AI插件存在收集用户数据的行为,说明这是一个极为普遍的现象,用户甚至无法寄希望于开发者的“良心”。



换句话说,你在享受AI插件带来的高质量翻译、摘要总结等能力时,其实是有代价的。除非放弃这种便利,否则只能让渡一部分隐私,但也要坚守底线。比如,与AI插件的交互内容可以提供,但绝不能容忍AI插件收集你的个人信息。如果一个AI翻译工具要求获取你的精准地理位置或查询你的通讯录,那显然非常可疑。


本文来自微信公众号“三易生活”(ID:IT-3eLife),作者:三易菌,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com