Reddit起诉Perplexity称其窃取网站数据用于AI训练
- 来源:3DM整理
- 作者:3DM
- 编辑:newtype2001
Reddit已对Perplexity及其他公司提起诉讼,理由是这些公司窃取其网站数据。据悉,被窃取的信息未经Reddit许可,拟用于AI训练。
Reddit已针对Perplexity AI采取法律行动,指控其未经授权获取用户评论。此外,Reddit还将其他公司列为追责对象,其中包括部分Perplexity的客户。该案件凸显了一个更广泛的行业问题:AI训练数据的获取方式。被告方表示,计划“为用户自由、公平获取公共知识的权利坚决辩护”。
本周三,Reddit在纽约联邦法院对Perplexity、Oxylabs UAB、AWMProxy及SerpApi提起诉讼。据报道,SerpApi是Perplexity的客户之一。Reddit在声明中阐明了这些平台成为追责目标的原因:
“数据抓取工具绕过技术防护窃取数据,再将其出售给急需训练素材的客户。Reddit之所以成为主要目标,是因为它是全球规模最大、内容最活跃的人类对话数据库之一。”
被告方否认了Reddit的指控,而Perplexity在回应中称自身立场是维护网络社区利益:
“我们的做法始终秉持原则且负责任,通过AI提供真实准确的答案;对于损害信息开放性与公共利益的威胁,我们绝不姑息。”
与此同时,Oxylabs提出观点:任何企业都不应掌控公共数据,并暗示那些掌控公共数据的企业,可能在以虚高价格出售数据。
据Reddit透露,部分公司通过绕过谷歌安全防护、利用搜索引擎记录的方式抓取其数据,这种行为被比作“就像无法进入金库,转而抢劫运输车队一样”。目前,谷歌与OpenAI已与Reddit签署协议,获准获取其数据库用于AI训练。据悉,谷歌为此每年需支付6000万美元费用——尽管并非所有公司都能承担这一成本。
今年6月,Reddit已出于类似原因对Anthropic提起过诉讼。


玩家点评 (0人参与,0条评论)
热门评论
全部评论