您的位置:首页 >动态 > 综合精选 >

据报道谷歌图书索引了人工智能编写的不良作品

导读 为出版材料建立索引并已成为学术界必不可少的GoogleBooks已开始为低质量图书建立索引,这可能会影响其为其语言跟踪工具Ngram提供信息的方式

为出版材料建立索引并已成为学术界必不可少的GoogleBooks已开始为低质量图书建立索引,这可能会影响其为其语言跟踪工具Ngram提供信息的方式。

404Media报道称,谷歌图书中包含了几本人工智能可能编写的书籍。该出版物使用“截至我上次知识更新”一词搜索了Google图书,这是ChatGPT等聊天机器人常用的短语。您可以在Google图书中搜索特定的句子或术语,它通常会发回包含这些短语的书面作品。

结果发现,搜索前几页的大多数书籍都是有关人工智能的书籍,但这些结果中散布着一些不谈论该技术且似乎是由机器人编写的书籍。

404Media表示,它发现的书籍,比如TristinMcIver的《熊、牛和狼:岁的股票交易》,看起来就像在维基百科上搜索有关金融事件的信息,并且确实包含了“截至我上次知识更新”这句话。”其他有关Twitter等主题的书籍仍然包含2021年的信息,当时一些人工智能模型最后一次获得训练数据。

Google图书提供了支持Ngram查看器的大部分数据,Ngram查看器是一种跟踪语言随时间变化的研究工具。Ngram从书面作品中获取信息来展示语言使用的演变。

Google图书扫描并索引了可追溯到1500年代的书面作品,Ngram上次更新其引用的数据是在2019年。尽管Ngram并不完美,但许多语言学家和其他学者使用该工具进行研究收集。

谷歌告诉404Media,谷歌图书上的最新作品不会出现在Ngram结果中,但这些可能会出现在未来的数据更新中。

免责声明:本文由用户上传,如有侵权请联系删除!