Metaが違法にトレントを使用して81.7TBの著作権侵害データをダウンロードしたとする新たな証拠が暴露され、同社のAI訓練の実行方法が大きな問題となっています。著作権を主張する書籍の著者らは、Metaが盗用した資料をAIの訓練用データとして使用したことから提起した訴訟の一環で、この問題に着目しています。最近公開されたメールによると、Metaは「Anna’s Archive」や「Z-Library」などのシャドーライブラリーから複数回にわたってデータを取得し、その蓄積は35.7TBにも達するとのことです。これにより、著作者たちはMetaの行動がどれほど広範囲かつ深刻であるかを詳しく示すデータを提示しています。著作権者たちは、Metaの違法トレント行為の規模は「驚異的」であり、過去の小規模な著作権侵害行為が逮捕へと繋がった事例と比較して対照的であると訴えています。
書籍の著者達は、Metaがトレントを使用して著作権侵害データをダウンロードし、そのデータをシード(配信)しているのかどうかを探っており、Metaは内部調査においてそれに関する情報提供の要請を阻止してきました。それに応じて、作者たちはメタがその行為を知りつつも、それを隠蔽する意図があったことを示す証拠を収集しました。Metaの技術者であるニコライ・バシュリコフは、2023年4月に「企業のラップトップからトレントを行うのは正しくない」との懸念を示し、法律チームへの相談を進めました。彼は「トレントを使用することはファイルをシードすることに繋がる」と改めて強調し、外部への配信が法的問題を引き起こす可能性があると認識していました。
Metaはトレント行為について知らされていたことを示すメールのやり取りが明らかになったことで、これまでの主張が揺らいでおり、特にCEOのマーク・ザッカーバーグはLibGenを使用したAIモデルの訓練について自らが決定に関与していないと述べています。しかし、最近公開されたメールには「LibGenの使用が決定された」との記述が存在し、著作者たちは新たな証拠に基づき、Metaが著作権侵害行為を隠蔽し続けていると指摘しています。Metaは公判中ずっと、AI訓練は「公正使用」であると主張していますが、著作者たちはその観点が倒錯していると主張しています。
この件が進行中の中、Metaのシード(配信)行為に関する調査がテストとして始まり、その結果次第では今後の裁判におけるMetaの立場に大きな影響を及ぼす可能性があります。書籍の著者たちは現在、直接の著作権侵害の主張を確認するための更なる発見を求めています。Metaは出版の権利者たちに対する訴えが根拠の無いものであると強調し、この主張に反論するための準備を進めています。