OpenAI阻止网络爬虫抓取数据,避免数据被用于训练AI模型

2023-08-08 18:15:27 | 来源:驱动中国


(资料图片仅供参考)

驱动中国2023年8月8日消息,据悉,OpenAI 旗下 GPT 模型的训练需要大量的网络数据,这可能涉及到数据隐私和版权等问题。为了解决这些问题,OpenAI 最近推出了一个新功能,让网站可以阻止其网络爬虫(web crawler)从其网站上抓取数据训练 GPT 模型。

网络爬虫是一种自动化的程序,可以在互联网上搜索和获取信息。OpenAI 的网络爬虫名为 GPTBot,其会以一定的频率访问各种网站,并将网页内容保存下来,用于训练 GPT 模型。

OpenAI 在其博客文章中表示,网站运营者可以通过在其网站的 Robots.txt 文件中禁止 GPTBot 的访问,或者通过屏蔽其 IP 地址,来阻止 GPTBot 从其网站上抓取数据。OpenAI 还表示,“使用 GPTBot 用户代理(user agent)抓取的网页可能会被用于改进未来的模型,并且会过滤掉那些需要付费访问、已知收集个人身份信息(PII)、或者有违反我们政策的文本的来源。”对于不符合排除标准的来源,“允许 GPTBot 访问您的网站可以帮助 AI 模型变得更加准确,并提高它们的通用能力和安全性。”

上一篇 下一篇

相关新闻

OpenAI阻止网络爬虫抓取数据,避免数据被用于训练AI模型

元宵节初一日记250字(通用6篇)

「以高质量党建引领高质量发展——和美城乡“四大行动”」雷山县郎德镇:“廉洁文化+家风建设”纵深推进“四大行动”开展

2023“甲秀杯”五人制足球公开赛正式开赛

基金最大回撤是什么意思?

球迷们有福了!郑州-米兰新航线10月30日开通

中证细分有色金属产业主题指数上涨0.41%,有色50ETF(159652)震荡上涨0.55%

六部门联合印发《氢能产业标准体系建设指南(2023版)》

安徽阜阳供电公司:建成无人机飞控指挥中心

vivoy5s参数8+128(y5s手机vivo参数)

季孟年:老六不打对球队损失巨大 男篮需抓住沃特斯下场的机会

助力灾后重建 房山区纪委监委组织机关党员干部积极参加清淤工作

传播高质量——南方+客户端上线八周年特别报道

2023年8月cfa二级考试成绩什么时候公布?附成绩查询具体步骤

2023年8月保定高阳县限行吗?附最新规定

最新新闻

OpenAI阻止网络爬虫抓取数据,避免数据被用于训练AI模型

元宵节初一日记250字(通用6篇)

「以高质量党建引领高质量发展——和美城乡“四大行动”」雷山县郎德镇:“廉洁文化+家风建设”纵深推进“四大行动”开展

2023“甲秀杯”五人制足球公开赛正式开赛

基金最大回撤是什么意思?

球迷们有福了!郑州-米兰新航线10月30日开通

中证细分有色金属产业主题指数上涨0.41%,有色50ETF(159652)震荡上涨0.55%

六部门联合印发《氢能产业标准体系建设指南(2023版)》

安徽阜阳供电公司:建成无人机飞控指挥中心

vivoy5s参数8+128(y5s手机vivo参数)

季孟年:老六不打对球队损失巨大 男篮需抓住沃特斯下场的机会

助力灾后重建 房山区纪委监委组织机关党员干部积极参加清淤工作

传播高质量——南方+客户端上线八周年特别报道

2023年8月cfa二级考试成绩什么时候公布?附成绩查询具体步骤

2023年8月保定高阳县限行吗?附最新规定

蓝小玲(关于蓝小玲简述)

独角兽超级孵化器是如何炼成的——“高精尖园区调研行”系列报道之二

lpl夏季赛赛程(2021LPL夏季赛赛程安排)

真金白银促消费!河南再推十项举措

省通信管理局来仪调研大数据产业发展情况 孙建年陪同调研

万业企业:加速迈入半导体领域 不再有新增土储

Z180次列车“英雄班组”返回乌鲁木齐,每人获奖10000元

德国西部发现一枚二战遗留炸弹 超万名民众被疏散

新华全媒+|记者手记:亲历涿州救灾一线的温情与感动

玻利维亚总统:金砖国家的存在,能让我们无损尊严地进入国际市场

内蒙古赤峰市一自卸货车行驶中失控发生事故 致3死3伤

8名游客被困青海海西无人区 当地公安历时18小时徒步救援

接力救援河北 彰显淄博大爱

白俄罗斯摩托化步兵部队在与立陶宛边境地区进行军事演习

情人节不想送女朋友礼物怎么办 这样的男人是什么心理?