カルパシー氏、クロードの17000語システムプロンプトに触発された新しいAI学習方法を提案

システムプロンプト学習：AIトレーニングにおける次世代パラダイムに対するアンドレイ・カルパシー氏のビジョン

AI開発における第一人者であり、元テスラのAI責任者であるアンドレイ・カルパシー氏は最近、一見シンプルなアイデアで議論を巻き起こしました。それは、「私たちは、大規模言語モデル（LLM）の学習方法における全く新しいパラダイムを見落としているのではないか」というものです。彼の提案する「システムプロンプト学習」は、より多くのデータや、より複雑なネットワークを使うのではなく、人間の記憶や推論に似た、変更可能な指示を使ってモデルをより賢く導く方法です。

講演中のアンドレイ・カルパシー氏。テスラやOpenAIでの仕事で知られる。(ytimg.com)

AIへの投資が、力任せの事前学習や高価なファインチューニングを超えるブレークスルーにかかっている世界において、このアイデア（Claudeの17,000語にも及ぶシステムプロンプトの仕組みからヒントを得たもの）は、AIをより効率的かつ責任ある方法でスケールアップする方法について、重要な問いを投げかけています。

事前学習、ファインチューニング…その次は？

現在のAIトレーニングの主流は、以下の2つの主要な戦略です。

事前学習（Pretraining）: LLMは大量のテキストを取り込むことで、言語と世界に対する一般的な理解を深めます。
ファインチューニング（Fine-tuning）: 特定の動作は、教師あり学習の例や強化学習を通じて強化されます。これにはしばしば人間のフィードバック（RLHF）が活用されます。

人間からのフィードバックによる強化学習（RLHF）とは、AIモデル、特に大規模言語モデルを、人間の好みに合わせてより適切に調整するために使用される多段階プロセスです。モデルの様々な出力に人間が順位をつけるなどのフィードバックを利用して報酬モデルを作成し、その報酬モデルが強化学習を通じてAIの学習を導きます。

どちらのアプローチも、モデルの内部パラメータを変更します。しかしカルパシー氏は、これらの方法が見落としている人間の学習特性を指摘します。私たちは学習する際に、必ずしも脳を「再配線」するわけではありません。メモを取ったり、自分自身に明確なリマインダーを残したりします。私たちは、中核的な配線ではなく、内部の指示を変更することで適応します。

システムプロンプト学習は、この原則を取り入れています。勾配を使って重みを編集する代わりに、システムプロンプト、つまりタスク全体にわたってモデルの振る舞いを形成する持続的な指示のセットを編集することを提案しています。この枠組みでは、LLMは理論上、自分自身の問題解決戦略を書き、改良し、更新することができます。これはまるで、個人的なノートブックを付けるようなものです。

Claudeの17,000語マニュアル：変化の火付け役

カルパシー氏の提案は理論上の話ではありませんでした。それは、実際の例によって引き起こされました。AnthropicのClaudeモデルは、システムプロンプトが17,000語近くに及びます。この巨大なプロンプトには、道徳的な境界線（例：著作権保護された歌詞を避ける）から、質問への回答に関する詳細な戦略（例：「strawberry」のような単語の文字数を数える方法）まで、あらゆる情報が組み込まれています。Claudeの完全なシステムプロンプトはこちらで確認できます。

表1：Claudeのシステムプロンプトの特徴と構成要素

特徴	詳細
サイズ	約16,739語 (110KB)
トークン長	報告によると約24,000トークン
比較	OpenAIのo4-mini（2,218語、15.1KB）よりも大幅に大きい
主要構成要素
現在の情報	会話開始時の日付や文脈情報を提供
行動ガイドライン	回答形式や対話スタイルの指示
役割定義	Claudeのアイデンティティと運用パラメータを確立
ツール定義	最大の構成要素。MCPサーバーからのツール使用方法に関する指示
安全パラメータ	有害な可能性のあるリクエストへの対応に関するガイダンス
技術的指示	単語/文字数の数え方や書式設定に関するガイドライン
目的	LLMがユーザーとどのように対話するかの「設定」として機能
開発	ユーザーフィードバックや設計改善に基づき定期的に更新

知識を重みにハードコードすること（これは非効率的で柔軟性がなく、コストがかかる可能性があります）ではなく、Anthropicはシステムプロンプトを動的な指示セットとして使用しているようです。カルパシー氏によれば、これは人間が適応する方法に似ています。「Xが起こったときは、Yのアプローチを試みなさい」と明確に述べることで調整するのです。

この変化は、システムプロンプトを静的な行動ガイドから生きている文書へと捉え直します。これは、LLMが汎化された戦略を保存し、時間をかけて改訂できる場所となります。事実上、これはAIを単に賢くするだけでなく、より教えやすくするための提案です。

なぜこれが投資家や開発者にとって重要なのか

システムプロンプト学習の魅力は、単に学術的なものではありません。現在のAI展開における主要な課題に直接応えるものです。

1. 運用コストの削減

ファインチューニング、特にRLHFを用いたものは、コストが高く時間がかかります。一方、システムプロンプトの更新はほぼ無料で瞬時です。中核的な動作を重みの再トレーニングではなく、指示の更新によって変更できるなら、展開はより速く、より安価になります。

AIモデル更新方法：ファインチューニング/RLHF 対プロンプト編集

方法	コストと労力	実装までの時間	主な特徴
ファインチューニング / RLHF	高い：計算資源、データ、機械学習の専門知識が必要	長い（数日～数週間）	タスク/分野の精度向上のためモデルの重みを更新。訓練後の柔軟性は低い
プロンプト編集	低い：主にプロンプトの設計/テスト	短い（数時間～数日）	指示を通じて動作を調整。迅速、柔軟、再トレーニング不要
一般的な注意点	コストはモデルサイズ、トークン、インフラに依存	継続的なメンテナンスが必要	選択は目標、リソース、必要な性能に依存。組み合わせることも可能

2. よりアジャイルなAI製品

特定分野のエージェント（法律ボット、医療アシスタント、カスタマーサービスツールなど）を開発するスタートアップは、迅速な反復が必要です。システムプロンプトを使用すると、モデルの再トレーニングなしで迅速な変更が可能になり、本番環境での適応性が向上します。

3. データ効率とフィードバックループ

従来のファインチューニングには大量のデータセットが必要です。システムプロンプト学習は、より高次元のフィードバックチャネルを提供します。スカラーの報酬のために最適化するのではなく、人間が指示を与える方法に近い、より豊かなテキストによるフィードバックを可能にします。

専門家たちの見解

このアイデアは、AI界隈で賛否両論を呼んでいます。

賛成派は、システムプロンプトを「書かれたトーラー（律法）」、つまり基本的な指示を定義するものに例え、新しいケースは、インタラクティブな学習を通じて適応・拡張される「口伝のトーラー」に似ていると見なします。
反対派は、スケールと複雑さを懸念しています。プロンプトが大きくなるにつれて、壊れやすく、一貫性がなく、矛盾するリスクがあります。これは、ミッションクリティカルなアプリケーションにおける信頼性を損なう可能性があります。
一部はハイブリッドアプローチを提唱しています。システムプロンプトの知識を定期的に重みに「蒸留」し、人間がそうするように、AIが明示的な知識から習慣的な知識へと移行できるようにするというものです。
また、メモリ階層を用いて実験する者もいます。ここでは、モデルが問題解決の例を索引付けし、必要な時にのみプロンプトの文脈に引き込みます。これを検索拡張生成（RAG）やプランニングツールと組み合わせるのです。

検索拡張生成（RAG）とは、大規模言語モデル（LLM）が生成する回答を改善するために設計されたAIアーキテクチャです。これは、まず外部の知識ソースから関連情報を検索し、その文脈をLLMに与えることで、より正確で関連性が高く、最新の回答を生成するという仕組みで機能します。

その可能性にもかかわらず、システムプロンプト学習をパラダイムシフトではなく、漸進的な進化と見なす意見もあります。それでも、Anthropic、OpenAI、Googleのような企業がシステムプロンプトのサイズにおいて劇的に異なる（Claudeの16,739語に対し、OpenAIは約2,218語）ことから、プロンプトが新たなフロンティアになりつつあることは明らかです。

今後の展開

もしLLMが自律的に自身のシステムプロンプトを書き換え、更新できるようになれば（学んだ教訓、試した戦略、改善したタスクなどを文書化して）、私たちは新しいAIトレーニングアーキテクチャの誕生を目撃するかもしれません。

本番環境で自身のマニュアルを改訂することで進化する自己改良型エージェント
新しい分野で大規模な再トレーニングを必要としないタスク特化型モデル
プロンプトベースの知識を選択的に長期的な重みに移動させ、柔軟性を失うことなく性能を向上させる半自動化された蒸留

これは、企業のニーズとうまく合致する可能性があります。解釈可能で、追跡可能で、ダウンタイムを最小限に抑えながら段階的にトレーニング可能なモデルです。

マシンのためのノートブック

カルパシー氏のアイデアは抽象的に聞こえるかもしれませんが、それは深い直感を捉えています。知性とは、単に「何を知っているか」だけでなく、「その知識をどのように活用するために構造化するか」なのです。システムプロンプト学習は、LLMがより大きな脳だけでなく、より良いノートブックを必要としていることを示唆しています。

より多くのAI企業が事前学習とファインチューニングの間のこの中間領域を探求するにつれて、プロンプトエンジニアリングがプロンプトアーキテクチャ、つまりそれ自体の専門分野へと進化することを期待してください。これが次のパラダイムになるのか、あるいは強力な補助手段となるのかは、まだわかりません。

しかし、一つ明らかなことがあります。より賢く、より安価で、より制御可能なAIを構築するための競争において、「モデルが何を学ぶか」よりも、「モデルがどのように学ぶか」の方が、まもなくより重要になるかもしれません。