原告方在证据开示阶段发现了更多佐证,上周五提交了经修订的起诉状,大幅扩大了诉讼范围。除新增更多涉案书籍、作者及人工智能模型外,诉状还纳入了更广泛的“影子图书馆”相关指控。诉状指出,“安娜档案馆”承诺向英伟达开放约500TB的数据访问权限,其中包含数百万本图书,这些图书通常仅能通过“互联网档案馆”的数字借阅系统获取。英伟达还被指控使用了其他盗版数据源,如“图书馆基因”(LibGen)、“科学枢纽”(Sci-Hub)以及“Z图书馆”(Z-Library)等平台下载图书。原告方称,英伟达除了自身下载并使用盗版书籍训练人工智能模型外,还向企业客户分发脚本和工具,使其能够自动下载包含盗版Books3数据集的“ThePile”数据库。
