外媒报导,加州律师事务所 Clarkson Law Firm 最近对 OpenAI 提起集体诉讼,因未经同意窃取百万使用者数据,甚至包括各年龄儿童可辨识身分,训练 AI 聊天机器人 ChatGPT 和图片生成AI DALL‧E。
Clarkson Law Firm 指 OpenAI 为了训练大语言模型,从网络采集 3,000 亿文字,包括个人信息、Twitter 和 Reddit 等社群媒体的文章,且非常隐密,没有依法律要求注册成为数据经纪人。
OpenAI 如何收集和使用哪些数据训练和开发 ChatGPT,一直备受争议,直到 4 月才让相关者能拒绝通话内容和个人资料提供 ChatGPT。
虽然集体诉讼针对 OpenAI 未经同意进行网络采集且不与 ChatGPT 分享的数据,但也包括不透明的用户隐私政策。
Clarkson Law Firm 认为 OpenAI 获微软大量注资,加上从 ChatGPT Plus 订阅用户赚钱,但未补偿数据来源者。指控高达 15 项,有侵犯隐私、未保障个人信息、非法手段取得大量数据训练模型等。