Redditのデータ「二重基準」
言論の自由を掲げたグローバルな公民館を築きながら、近隣住民が訪れた際に「入場料」を徴収する。それがAI時代におけるRedditの最新の転換点だ。
ニューヨーク発 – 想像してみてほしい。秘密を打ち明け、ミームを交換し、際限のない議論を巻き起こす活気あるオンラインの市場、Redditが、まるで嫉妬深い用心棒のように、突然その門を固く守り始めたのだ。かつてはオープンな対話を重視していたこのプラットフォームが、ユーザーのやり取りという宝の山をGoogleやOpenAIといったAI大手企業に提供する巨額契約を結んだ。そして今、同じ情報を「入場券なし」で利用した競合他社を訴えているのだ。
マンハッタンの法廷から直接飛び込んできたのは、Redditが、迅速な回答を提供するAIの新星Perplexityに対して大胆な一撃を放ったというニュースだ。この訴訟は、Redditが「大規模なデジタル略奪」と呼ぶPerplexityの行為を非難している。Redditは、この新興企業が、巧妙なスクレイピング業者の一団と共に、Redditの防御をかいくぐって何年もの投稿や意見を吸い上げたとしている。これらは、高度なAIを訓練するための生データとなる。
しかし、さらに深く掘り下げると、現代のウェブの不具合を象徴するような、実に皮肉な事実に突き当たる。Redditは、ボランティアによって生み出された、洗練されていない生の「宝石」によって栄える、インターネットの賑やかな「玄関先」を自称してきた。しかし今、彼らは拳を振り上げ、これらの宝石は誰でも自由に手に入れられる果実ではなく、「賢い売り手のためのプレミアムな資産だ」と主張している。いつものことだ。ある企業にとっては「有料パートナーシップ」であっても、別の企業にとっては「あからさまな詐欺」となる。たとえ両者が、不気味なほど人間に似た知能を模倣するAIを生み出していたとしてもだ。その違いは?「現金」の有無であり、巧妙な意図ではない。
著作権に関する脚注や、DMCAのような古い法律のことは脇に置こう。この争いは、AIをめぐる縄張り争いにおける、より大きな地殻変動を示唆している。「データの不正利用」ビジネス――AIブームを資金面で支えてきたこの仕組みを解体するための権力闘争だと、敏腕弁護士や役員会のベテランたちはささやく。Redditの矛先はPerplexityだけにとどまらない。共犯者とされる企業群、例えばリトアニアのOxylabs、テキサスのSerpApi、さらには旧ロシアのボット群と関連のあるとされるAWMProxyといった怪しげな業者も巻き込んでいる。それは、最終的な購入者だけでなく、闇市場のパイプライン全体を焼き尽くすようなものだ。
Redditのメッセージは明確だ。ウェブの無限の資源を無料で貪り食うことはもう許されない。入場には高額な代償が伴う、それだけのことだ。そして、彼らにはその強気な態度を裏付ける証拠がある。
二重の策略
Redditは高尚な議論に終始しているわけではない。提出された訴状は、狡猾な猫とネズミのゲームを描写している。5月、RedditはPerplexityに対し、厳重な「やめろ」という警告文を送った。略奪行為は減少したのか?いや、むしろ逆だ。Perplexityの回答におけるRedditコンテンツへの言及は、まるで挑戦を無視するかのように増加したのだ。
そこでRedditの技術者たちは、スパイ・スリラーから飛び出してきたような古典的な策略を考案した。「ハニーポット」を仕掛けたのだ。Googleの片隅に、覗き見られないように隠された偽の投稿を作成した。すると数時間後、Perplexityはその投稿の内容を回答として吐き出したのだ。これが決定的な証拠となった。それは、丁寧な参照ではなく、中間プロキシを介したずる賢い迂回が行われたことの証明だった。
Perplexityは崇高な精神を掲げ反論している。何十年も前にRedditの設立を後押しした「規制のないウェブ」の旗を振っているのだ。彼らはまだ書類を見ていないとしながらも、「オープン性と公共の利益」を守り、正確な情報を提供すると誓っている。知識は奔流のごとく流れるべきか、それとも囲われた貯水池となるべきか――これは信念の衝突だ。しかし厄介な点は、Redditが態度を硬化させ始めたのは、今年2月にGoogleと年間6000万ドルという噂の契約を締結し、多額の支払いが入ってきてからだった、ということだ。
ある鋭いデータトレーダーが的確に言い表した。「彼らはチップの中に断層線を作り出した。GoogleやOpenAIのように支払えば優良顧客だ。ケチれば悪者になる。同じデータ、同じ手法なのに、銀行の着信音が鳴らない(=支払がない)だけだ。」
コードの金庫破り
法的な側面では、Redditは、AIが引き起こす著作権侵害の主張――判事を悩ませるフェアユースの曖昧さ――という厄介な領域を避けている。その代わりに、彼らはDMCAの厳しい「回避防止規定」に焦点を絞っている。これは情報を盗んだかどうかではなく、情報を奪うために扉をこじ開けたかどうかだ。
裁判所はこれまで、CAPTCHAのような迷路やファイアウォールの障壁といったデジタルな「濠」を乗り越える行為に対しては、厳しく対処してきた。「借りすぎ」論争よりもはるかに明確なのだ。Perplexityがとったとされる迂回策――robots.txtの立ち入り禁止表示を無視し、プロキシ群を介して身元を隠す――に焦点を当てることで、Redditはこの争点を曖昧な概念から具体的なハッキング行為へと引きずり込んでいる。
早期の差し止め命令を勝ち取れば、その波紋は世界中のAIラボを襲う可能性がある。未承認のウェブコンテンツを貪るあらゆるAIにとって、コストは高騰し、リスクは増大するだろう。突然、古いクリップライブラリや写真シンジケートから、専門誌やコードリポジトリに至るまで、あらゆる「ゲートキーパー」が真の影響力を行使できるようになる。彼らは、AIが切望する「人間が生み出した知識」を巡り、強気の交渉に臨むだろう。強固な権利と堅牢な障壁を持つ大手プラットフォームは利益を上げ、オープンな見方を「公正な利用」と見なしていた小規模な開発者たちは、慌てふためくことになる。
この対決は、ウェブの未開のフロンティアを新たに切り開く。一方には、無秩序が生んだRedditがいる。もう一方には、大衆に知恵を売り込もうとするPerplexityがいる。均衡を保つのは?我々のデジタルな洪水――無数の気の利いた言葉、画像、ひらめき。これらは集合知の共有財産となるのか、それとも未来のエンジンを動かすための質の高い原油として、最も裕福な掘削者たちの手によって搾取されるのか?
あの「ゴッサムの裁きの場」で訴状が山積みにされる間、真の書き手たち――20年もの間、英雄を語り、笑い声を上げ、悲しみを分かち合い、コミュニティを築き上げてきた日常のRedditユーザーたちは、観客として傍観している。彼らの共通の認識は?自分たちが生み出したものが「一等地」だったということだ。今、誰もが問いかける:この棚ぼた式の利益は、誰の懐を潤すのだろうか?
