他们还讨论了扫清使用 LibGen 数据集的障碍,这个数据集包含了如 Cengage Learning、Macmillan Learning、McGraw Hill 和 Pearson Education 等出版商的版权作品。 尽管存在版权问题,Meta CEO 马克·扎克伯格 强调,Meta将继续推动 Llama 模型的进步,并缩小与其他封闭模型如 OpenAI 和 ...
扎克伯格表示。这番言论暗示着他对 Meta 使用名为 LibGen 的版权电子书数据集进行 AI 训练的立场。 LibGen 是一个链接聚合网站,提供包括 Cengage Learning、麦格劳 - 希尔和皮尔逊教育在内的多个出版社的版权作品。该网站多次因版权侵权被起诉,并被罚款数千万美元。
IT之家注:LibGen 自称为“链接聚合器”,提供包括 Cengage Learning、Macmillan Learning、McGraw Hill 和 Pearson Education 等出版商的盗版作品。LibGen 曾多次被起诉、关闭,并因版权侵权被罚款数千万美元。 根据 Meta 的证词,原告律师称,扎克伯格在 Meta 的 AI 高管团队和其他 ...
尽管Meta CEO马尔克·扎克伯格曾公开表示希望缩小Llama模型与其他闭源模型的差距,公司内部也因此承受着巨大的压力。扎克伯格在2024年7月的一封信中信心满满地指出,Llama 3已经能与最先进的模型一争高下,并在某些领域处于领先。最终在2024年4月,Meta正式推出了Llama 3,这款开源模型在性能上与市场上的闭源模型不相上下,甚至打败了Mistral的开源模型。
随后,Touvron 和 Al-Dahle 讨论了使用 LibGen 数据集的可能性,该数据集包含 Cengage Learning、Macmillan Learning、McGraw Hill 和 Pearson Education 等出版商的受版权保护作品。Al-Dahle 在消息中问道:“我们是否有合适的数据集?有没有什么数据是你想用却因为某些愚蠢的原因 ...
随后,Touvron 和 Al-Dahle 讨论了使用 LibGen 数据集的可能性,该数据集包含 Cengage Learning、Macmillan Learning、McGraw Hill 和 Pearson Education 等出版商的受版权 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果