当前位置:首页 > 科技资讯 > 正文

AI插件隐私风险:半数以上收集用户数据

立即检查您的AI插件,因为它们可能是隐私泄露的幕后黑手。近期,数据删除服务机构Incogni发布了一项关于AI插件的最新研究报告,显示在接受调查的Chrome AI插件中,超过一半存在收集用户数据的行为,其中近三分之一涉及直接定位用户本人的个人可识别信息(PII)。

AI插件隐私风险:半数以上收集用户数据 AI插件 隐私泄露 用户数据 监管缺失 第1张

Incogni的研究团队深入分析了442款冠以“AI”之名的插件后,发现这类插件通常通过“脚本编写”权限,实时获取用户输入的内容或更改网页显示的信息。报告指出,编程助手、数学辅助工具、会议助理以及语音转录类插件的风险系数最高,其中不乏Grammarly、Quillbot等知名的在线语法纠正和校对工具。

鉴于当前用户设备的算力有限,业界向用户提供AI能力的主流方式依然是云端部署,无需用户安装复杂的框架和运行库,只需下载一个App或打开一个网页即可。因此,AI插件成为了体验AI产品最便捷的方式,只需点击安装,就能在上网时获得AI的帮助。

AI插件隐私风险:半数以上收集用户数据 AI插件 隐私泄露 用户数据 监管缺失 第2张

然而,AI插件盯上用户数据几乎是不可避免的,因为“数据荒”已经成为悬在所有AI厂商头顶的达摩克利斯之剑。《经济学人》曾预测,到2028年,互联网上所有高质量的文本数据都将被使用殆尽,机器学习的数据集可能在2026年前就耗尽所有“高质量语言数据”。这意味着“互联网上的可用信息几乎被AI吸干了”。

缺乏足够的数据来迭代AI模型,已成为所有AI厂商头疼的问题。为解决这一难题,“合成数据”成为过去两年间AI行业的热点。但在实际应用中,合成数据已被证明难以摆脱欠拟合甚至模型崩溃的缺陷。因此,纯粹依赖合成数据无法让AI模型实现“左脚踩右脚上天”的飞跃。

AI插件隐私风险:半数以上收集用户数据 AI插件 隐私泄露 用户数据 监管缺失 第3张

与此同时,新闻媒体、内容平台、社交网站等手握数据的机构也在“觉醒”,他们意识到自己手中的数据是AI厂商眼中的香饽饽。为此,版权方在全球范围内与AI厂商展开了法律较量。微软最近启动了“出版商内容市场”(PCM)计划,试图打造AI时代的内容授权集中平台,为AI模型训练提供合规的内容支持。

因此,当数据具有价值且不愁销售时,AI插件开发者盯上用户输入内容就不足为奇了。而用户的个人可识别信息价值更高。毕竟,如何让广告投放更精准、更高效是营销行业的终极课题之一。在互联网时代,当广告平台比用户更了解自己时,广告自然就能投其所好,这就是所谓的用户画像。

此时问题就来了:监管在哪里?但不同于被App Store、Google Play、微软应用商店严格监管的软件,浏览器插件是一个被忽视的场景。即便谷歌Chrome商店对插件的审核也极为宽松,所以恶意插件绕过审核的报道时有发生。

AI插件隐私风险:半数以上收集用户数据 AI插件 隐私泄露 用户数据 监管缺失 第4张

值得一提的是,AI插件当前的分发方式并非围绕Chrome商店展开,而是以开发者的个人博客、AI社群的链接、GitHub等途径为主。当然,这一现象并非开发者有意绕开监管,而是效率至上的结果。由于日新月异是当下AI圈的主旋律,等待自己的AI插件通过Chrome商店审核可能意味着竞品早已遍地开花。

因此,先把自己有趣的点子展示给受众已成为AI开发者普遍的想法。老实走审核流程反而缺乏效率。从某种意义上说,在隐私保护和效率的二选一中,AI开发者选择了后者。因此,在缺乏监管且用户数据价值已有共识的情况下,开发者就难免动了不该动的心思。

说到这里,一个简单的问题就摆在眼前:大家是否愿意用隐私来换便利?超过50%的AI插件存在收集用户数据的行为意味着这是一个普遍现象,用户甚至无法指望开发者的良心。

AI插件隐私风险:半数以上收集用户数据 AI插件 隐私泄露 用户数据 监管缺失 第5张

换句话说,屏幕前的你享受AI插件带来的高质量翻译、摘要总结等能力都是有代价的。除非放弃这种便利否则只能让渡一部分隐私但也要坚决守住底线。例如与AI插件的交互内容可以给出去但绝不能容忍AI插件收集关于你的信息。如果一个AI翻译工具要求你的精准地理位置、查询你的通讯录显然就非常可疑了。