快科技8月8日消息,OpenAI推出了一种名为GPTBot的网络爬虫机器人,用于收集信息数据以改进未来的AI模型。
据了解,GPTBot将严格遵守任何付费墙的规则,不会抓取需要付费的信息,并且也不会收集能追踪到个人身份的数据。
不仅如此,OpenAI也把是否要把自己的网站数据供GPTBot抓取的选择交到给网站所有者,他们可自行修改其robots.txt文件。或者通过屏蔽其IP地址,来阻止GPTBot从其网站上抓取数据。
这当然仍不足够,修改robots.txt是一种方式,但它可以更便利和更具透明度,也可进一步告知数据将被用于什么用途等等。
此前,OpenAI抓取公开数据来训练专利AI模型的行为备受争议。Reddit和Twitter等网站,已经采取措施打击AI公司免费使用其用户帖子的行为,而一些作者和其他创作者也因为涉嫌未经授权使用其作品而提起诉讼。
本文来源于快科技,如有侵权请联系删除
亚马逊平台涌现大量 AI 生成的虚假旅行指南
伯克利研究人员推出AI智能体Dynalang:可接收复杂指令
Datablau数语科技完成B1轮融资 加速AI大模型与业务融合
微软宣布人工智能 Bing Chat 即将登陆第三方浏览器 包括移动设备
小伙脑门砸核桃破吉尼斯世界纪录:一分钟砸273颗
平时用铁锤砸核桃都得费好大劲,现在有人用脑门砸核桃破吉尼斯世界纪录。8月7日,印度一名男子纳文库马尔一分钟内头砸核桃273颗,创造...
苹果亲民版Vision Pro细节出炉:内嵌iPhone充当屏幕
快科技8月8日消息,不久前,快科技曾报道了苹果获批的一项新专利,该专利能够将iPhone作为头戴式显示器的屏幕,以相对亲民的成本实...
联想集团计划秋季发布英特尔AI PC
网站可以阻止OpenAI网络爬虫 避免数据用于训练 GPT 模型
花妖歌词
海鲜女孩什么意思
用户名
密码
记住登录状态 忘记密码?
邮箱
确认密码
我已阅读并同意 用户协议