華為の主力AIプログラムで不正と非行の疑惑を内部告発者が暴露
中国AIの野望の破綻:その内幕
華為(ファーウェイ)の著名な「ノアの箱舟研究所」の主要メンバーが、同社の主力である盤古(Pangu)大規模言語モデルの開発において、広範な不正行為、盗用、学術不正があったと詳細な疑惑を公表した。
匿名の内部告発者が2025年7月9日にGitHubで公開した告発文は、中国で最も名高いテクノロジー大手の「闇の中心」と彼らが表現する内情を前例のない形で明らかにしている。告発文によると、華為が誇るAIにおける功績は、偽造された結果、盗用された知的財産、そして「誠実さを罰し、欺瞞を報いる」文化の上に築かれている可能性があるという。
競合他社のモデルを「外殻化」:疑惑の大規模詐欺
この疑惑の中心にあるのは、「外殻化(シェルリング)」と呼ばれる行為だ。これは華為が競合他社のモデルを入手し、表面的な変更を加えた上で、自社独自の開発として提示したとされるものだ。内部告発者によると、結果を出すようプレッシャーに晒された「王雲鶴の小モデル研究室」が率いるチームは、アリババのQwen-110Bモデルを再パッケージ化し、わずかに修正を施した後、「135B V2」と改名したという。
内部分析により、不一致のアーキテクチャ、Qwenと同一のパラメータ分布、そしてソースコードに依然として「Qwen」の名前が含まれているなど、決定的な証拠が明らかになったと報じられている。内部告発者は、多くのチームメンバーがこの欺瞞に「愕然とした」にもかかわらず、このモデルがダウンストリーム顧客に展開され、社内で称賛されたと主張している。
「あのモデルは似ていただけではない。文字通り、ファーウェイのバッジが貼られただけのQwenだった」と、報復を恐れて匿名を条件に取材に応じた状況に詳しいあるAI研究者は本記者に語った。「アーキテクチャを調べれば、技術的な知識がある者なら誰でも真実を見抜けたはずだ。」
ベンチマークの捏造:ありえない完璧なスコア
おそらく最も損害の大きい疑惑は、華為が公表した盤古Ultraのベンチマークに関するものだ。内部告発者によると、モデル報告書にはARC-Easyベンチマークで数学的に不可能な100%の精度が示されており、この結果は外部の専門家によって直ちに「非現実的または捏造されたもの」と指摘されたという。
華為ノアの箱舟研究所の元エンジニアたちは、憂慮すべき説明を提供した。ARC-Easyの場合、完全なデータセット(約5,200問)でテストする代わりに、チームは内部の簡易チェックに使用される100サンプルのサブセットのみを評価したという。これらの部分的な結果は、時間的プレッシャーの下で最終的な公開報告書に含まれ、完璧なスコアの錯覚を生み出したとされている。
さらに、RACEのようなベンチマークは、競合他社が使用する従来のパープレキシティベースの手法と比較して、スコアを最大40点まで水増しする簡易的な手法を用いて評価された。これらの水増しされた結果は、より厳格な手法で評価された他モデルのスコアと直接比較され、学術規範に反する誤解を招く比較が行われた。
内部告発者の苦悩:「血と汗と犠牲」
告発文は、このスキャンダルに深く個人的な側面があることを明らかにしている。筆者は、NVIDIAのAIハードウェアに対する国内代替品を構築するという華為の使命を信じて、献身的なエンジニアたちが何年にもわたる過酷な作業に従事したと述べている。チームは、華為のAscend NPU上で段階的に大規模なモデルを学習させ、重大な技術的課題に直面したと報じられている。
盗用されたとされる135B V2とは異なり、内部告発者は、135B V3モデル(盤古Ultra)が、洗練されたトークナイザーと改善された学習パイプラインを用いて、彼らのチームによって「真にゼロから学習された」と主張している。このモデルは、「血と汗と犠牲の真の産物」と表現されており、大規模モデルの学習では稀な「クリーンな学習と損失の急増なし」で、競争力のある性能を発揮したという。
「悪い結果は受け入れられる。愚かな結果は受け入れられない」と、かつてノアの箱舟研究所でMoEインフラストラクチャを担当していた清華大学の博士号を持つ「Blealtan」と特定された元エンジ