自称为”人类历史上最大的真正开放图书馆”的盗版网站安娜的档案宣布,其已从Spotify抓取了人们实际收听内容的99.6%。
该组织表示下载的数据总量略低于300TB,并将通过BT种子方式提供这些内容……
该网站委婉地将其下载行为描述为对Spotify的”备份”。
我们备份了Spotify(元数据和音乐文件)[…] 安娜的档案通常专注于文本(例如书籍和论文)[…]但我们的使命(保存人类的知识和文化)并不区分媒体类型。有时文本之外的机遇会出现。这次就是这样的情况。
不久前,我们发现了一种大规模抓取Spotify的方法。我们认为自己在这里的角色是建立一个主要旨在保存的音乐档案。
从技术上讲,该网站仅获取了Spotify 2.56亿首曲目中的三分之一。但它表示,已下载的8600万首曲目几乎涵盖了人们实际收听的所有音乐。
我们存档了约8600万个音乐文件,约占全部收听量的99.6%。总大小略低于300TB。我们主要使用Spotify的”流行度”指标来优先处理曲目[…]对于流行度>0的曲目,我们获取了平台上接近全部的曲目。
该网站已开始分析数据并分享其发现。例如,它表示三首最受欢迎歌曲的总流量超过了排名靠后的1亿首歌曲的流量总和。
| Lady Gaga, Bruno Mars | Die With A Smile | 30.75亿次播放 |
| Billie Eilish | Birds of a Feather | 31.37亿次播放 |
| Bad Bunny | DtMF | 11.24亿次播放 |
Spotify告诉Engadget,它已禁用负责抓取数据的账户,但这似乎是数据已泄露后的补救措施。
一位发言人在给Engadget的声明中表示:”Spotify已识别并禁用了从事非法抓取的恶意用户账户。我们已针对此类反版权攻击实施了新的保护措施,并积极监控可疑行为。自第一天起,我们就与艺术家社区站在一起反对盗版,并积极与行业合作伙伴合作保护创作者并捍卫他们的权利。”

















