Reddit 以版权问题为由阻止互联网档案访问

Gwenda

Reddit 只是让人们更难窥视它的过去。这家社交媒体巨头宣布阻止互联网档案馆对其内容建立索引,这标志着正在进行的人工智能训练数据之争的另一个爆发点。

看,我们都知道这会发生。

在 Reddit 与人工智能公司就数据问题进行公开争执之后今年早些时候刮, 平台的采取更加强硬的立场切断互联网上最著名的档案服务之一。

此举意味着那些熟悉的 Reddit 庞大社区讨论快照将不再被互联网自动保存档案馆的时光机。

老实说,这对于任何需要引用旧线程或追踪消失内容的人来说都是一件大事。但这就是有趣的地方。

Reddit 不仅仅是在保护自己的商业利益,它基本上是在告诉人工智能公司“鱼与熊掌不可兼得”。

平台花了几个月的时间谈判人工智能训练数据的 API 定价以及互联网档案馆的这种偷偷摸摸的最终运行并不属于交易的一部分。

科技界的一些人对此并不满意。有一个相当直言不讳的团体认为 Reddit 的举动违背了互联网的开放精神。

当然,公司需要保护他们的资产,但阻止互联网档案馆的感觉有些不同。

这不仅仅是为了阻止人工智能抓取,还在于限制公众访问许多人认为重要的历史记录。

考虑到更广泛的行业背景,这个时机特别有趣。随着人工智能培训成为一项大生意,我们看到越来越多的平台围绕其内容筑起围墙。

Twitter(或 X,无论我们现在怎么称呼它)开创了这一趋势,现在 Reddit 也以自己的方式紧随其后。

事实是,这可能不会阻止坚定的人工智能公司获取 Reddit 的数据。这只会使事情变得更加困难,也许这就是重点。 Reddit 发出了一个明确的信息:如果你想要我们的数据用于人工智能训练,你必须通过官方渠道付费。

对于普通用户来说,这意味着互联网档案馆将无法再充当 Reddit 集体知识的可靠备份。不再可以轻松访问已删除线程或有争议的版主决定的快照。这再次提醒我们,互联网上没有任何东西是真正永久的,即使我们认为它是永久的。