近期,有网文圈的网友发布消息称——
「WPS改版,使用了我们的文章喂给AI了」。
「WPS疑似把我的审签内容喂给抖音的豆包AI」。
综合的网友看法,AI搜索让大模型可以直接抓取版权文章来作为回答的内容。
该名网文作者的依据是,他的文章作品只在WPS内进行编辑,怀疑WPS将用户的文档拿去给AI大模型的合作伙伴“豆包”进行训练。
这是继去年底WPS AI改写用户条款,“标注”将默认使用用户提供的文档数据供以大模型进行训练后,又一次陷入「AI版权」相关的纠纷舆情。
往期回顾
警惕!WPS AI正在“悄悄”偷你的个人数据!官方正式回应:已经修改隐私政策
11月16日,WPS AI开启公测,所有用户都可以体验最新的AI内容生成能力。但是根据官方的隐私政策,WPS有权利用用户上传的数据进行AI训练。
针对此事,7月21日,WPS客服针对疑似使用用户数据训练AI快速回应称,并没有使用用户文档训练AI,不存在擅自利用的情况。
然而,这则回应微博并未得到提出疑问的用户的认可:
金山办公的公关人员很快对此事进行了回应:
近日有部分用户反馈WPS AI相关问题,我们第一时间进行了严格排查及用户沟通,相关问题「完全失实」。
●第一,我们严格遵守个人信息保护的相关法律法规,采取严格的安全保护措施,防止用户信息遭到未经授权的泄露。
●第二,WPS AI定位是大语言模型技术服务的应用方,我们强调,所有用户的文档不会被用于任何AI训练目的,也不会在未经用户同意的情况下用于任何场景。
●第三,我们承诺,所有用户的文档不会被任何第三方用于AI训练。对于用户反馈的具体问题,WPS AI与豆包在AI层面目前并未开展任何形式的合作,不存在文档被用作AI训练的情况。
事实上,将用户数据“偷偷”挪去给AI大模型作为训练素材,由来已久。
上周,美国媒体曝出,包括苹果、英伟达、Salesforce在内的头部一线科技巨头们,一直以来长期未经YouTube频道创作者的同意,就擅自利用他们的视频内容生成字幕,再经由文本转制的文档来训练自家的人工智能大模型。
据报道,完成这一系列视频的字幕文件转制是经由一家名为EleutherAI的「非营利组织」完成,他们可以说就是大厂们的“白手套”,声称其目的是为了帮助开发者训练AI大模型,并提供无偿的技术援助。
虽然EleutherAI的创立初衷可能是为小型开发者和学术研究者提供非商业用途的训练材料,但事实上他们的数据都被苹果等科技巨头直接采购并使用。
更有意思的是,7月9日,OpenAI首席技术官(CTO)穆拉蒂在约翰·霍普金斯大学举办的彭博社访谈活动中,当再次被问及Sora视频模型的训练数据来源时,穆拉蒂依旧只提供了一个模棱两可的表述,公关辞令十足。
她承认自己的回答很糟糕,还以「商业机密」为理由,回绝了更详细的解释。
回首今年3月,穆拉蒂面对《华尔街日报》的采访中,对于Sora训练数据来源“一问三不知”,可谓灾难级。
甚至于,本月初,微软AI部门CEO更是提出了一句直言不讳、发人深省的言论:「理论上,互联网上的所有公开信息都可以免费用作AI的训练素材。」
Emm……我只能说,大厂做事怎么能叫偷呢?
年轻人不讲武德,耗子尾汁。