元Metaの研究者たちが、長時間の動画を理解するAIを構築するため、Memories.ai向けに800万ドルを調達

著者
Tomorrow Capital
11 分読み

記憶革命:Memories.aiの800万ドルシード資金調達がビデオインテリジェンスの未来をどう変革するか

ビデオデータが溢れる世界において、元Metaの研究者からなる小規模なチームが、AIの最も厄介な限界の一つ、すなわち長尺のビデオコンテンツを真に理解できない問題を解決したと信じています。彼らのソリューションは、セキュリティからエンターテイメントに至るまで、各業界を再構築し、AIインフラにおける新たな投資分野を創出する可能性があります。

マシンビジョンの忘れ去られた側面

元Meta Reality Labsの研究者であるショーン・シェン博士とエンミン・ゾウ氏によって設立されたMemories.aiは、2025年7月24日に800万ドルのシード資金調達ラウンドを完了し、ステルスモードから脱却しました。このラウンドはSusa Venturesが主導し、Samsung Next、Fusion Fund、Crane Venture Partners、Seedcamp、Creator Venturesが参加しました。

このスタートアップは、現在のAIシステムが数時間以上のビデオ映像の処理に苦戦するという限界を克服するために、「大規模視覚記憶モデル(LVMM)」と彼らが呼ぶものを開発しました。同社によれば、彼らの技術は最大1,000万時間ものビデオを分析できる規模にまで拡張可能であり、業界の既存の能力をはるかに超えています。

当初目標の2倍の額となったこの資金調達ラウンドは、Susa Venturesが主導し、Samsung Next、Fusion Fund、Crane Venture Partners、Seedcamp、Creator Venturesが参加しました。

デジタル記憶:誰もが気づかなかった数十億ドル規模の問題

Memories.aiが取り組むこの限界は、複数の業界にわたる大規模な非効率性を示しています。テキストベースのAIが数十万トークンを処理できるモデルを開発している一方で、ビデオ分析は通常、わずか数分間のコンテンツで失敗します。

「企業は、効果的に検索・分析できないペタバイト級のビデオを抱えています」と、ある大手投資銀行のシニアテクノロジーアナリストは指摘します。「セキュリティチームは無限の映像を手作業で見ています。メディア企業は自身のアーカイブから特定のシーンを見つけられません。マーケティング部門はキャンペーンビデオから洞察を抽出するのに苦労しています。」

この非効率性は、多大な市場機会へと繋がります。世界のビデオ分析市場は、2024年に約123.3億ドルと評価されており、2034年までに約945.6億ドルに達すると予測され、この期間に22.6%の年平均成長率(CAGR)で成長する見込みです。

現実規模に拡張する計算的記憶

Memories.aiのアプローチを際立たせているのは、その規模とアーキテクチャの両方です。LVMMはまず、生のビデオを取り込み、構造化された記憶レイヤーに圧縮した後、任意の時間枠にわたる視覚要素間の文脈的関係を構築します。

「従来のモデルはビデオをフレームごと、または短いクリップで分析するため、セグメント間の文脈がすべて失われます」とゾウ氏は説明します。「当社のシステムは人間の記憶を模倣し、ノイズを除去しながら重要な情報を保持し、関連するイベント間のつながりを構築し、自然言語による特定の瞬間の検索を可能にします。」

この技術は、報告によると最大1,000万時間もの映像を処理できる規模に拡張可能であり、現在の能力を桁違いに超えています。さらに印象的なのは、この処理の多くがクラウド上だけでなく、ユーザーデバイス上で直接行えることです。

監視カメラからハリウッドのアーカイブまで

初期のアプリケーションは、ビデオデータに溺れている分野に焦点を当てています。

セキュリティや監視の分野では、このシステムは広大なアーカイブから関連する映像を瞬時に特定でき、事件調査を数日から数分に短縮する可能性があります。メディア企業にとっては、膨大なコンテンツライブラリをシーン、小道具、キャラクター、またはアクションで瞬時に検索可能にすることを約束します。

マーケティングチームは何千ものソーシャルメディア動画のトレンドを分析でき、ロボット企業は視覚的経験から継続的に学習する機械の可能性を見ています。

おそらく消費者向けアプリケーションとして最も興味深いのは、この技術により、ユーザーが「娘の初めてのステップのビデオを探して」や「休暇中のビーチの夕日をすべて見せて」といった自然言語クエリで個人のビデオコレクションを検索できるようになることです。

ビデオ記憶における優位性を巡る競争

Memories.aiだけがこの機会を認識しているわけではありません。TwelveLabsはNEA、NVIDIA NVentures、Databricks、Snowflakeなどの参加を得て、複数のラウンドで8,000万ドルを調達しています。しかし、彼らの技術は現在、最大60分間のビデオに最適化されています。

その他の競合には、mem0(YC支援、主にテキスト記憶に焦点を当てる)、Letta(Felicisから1,000万ドルのシード資金)、そしてGoogleのVideo Intelligence APIやAmazon Rekognitionといったテクノロジー大手のサービスがあります。

「Memories.aiを際立たせているのは、彼らが目指す規模とオンデバイス機能の両方です」と、AI投資を専門とするベンチャーパートナーは述べます。「彼らが約束していることの半分でも、許容できるパフォーマンスで実現できれば、今日の現行企業を飛び越えるでしょう。」

今後の展望:機会と課題

有望な技術と潤沢な市場があるにもかかわらず、Memories.aiは重大な課題に直面しています。同社は、制御されたデモだけでなく、実世界での展開において大規模での精度とパフォーマンスを維持できることを証明する必要があります。

現在15名のみの、研究重視のチームにとって、エンタープライズ向けの営業体制を構築することも別の課題です。数百万時間のビデオを処理するための計算コストを管理しつつ、価格競争力を維持することも、もう一つの障害となります。

「防御可能な堀(moat)を築くための時間は短い」と、ある大手テクノロジー投資会社のパートナーは警告します。「MicrosoftのCopilot Memoryは来月リリースされますし、GoogleとAmazonもビデオ機能を急速に拡張しています。」

投資の視点:シグナルを読み解く

ビデオインテリジェンス分野を注視する投資家にとって、いくつかの指標がMemories.aiの軌跡を示す可能性があります。

コンバージョン指標: 特に痛点が最も顕著なセキュリティおよびメディア分野において、パイロットプログラムが年間数十万ドル規模の契約に転換したという発表に注目してください。

エッジ展開の成功: 大規模な分析をデバイス上で実行できる能力は、特にプライバシー規制が世界的に厳しくなるにつれて、潜在的な競争優位性となるでしょう。

ユニットエコノミクス: 処理効率は極めて重要です。大規模な健全なマージンを維持するためには、ビデオ1時間あたりの計算コストを大幅に削減する必要があります。

戦略的パートナーシップ: (オンデバイス機能を活用する)デバイスメーカーや、エンタープライズ導入を加速させる可能性のあるセキュリティシステムインテグレーターとの潜在的な協業に注目してください。

市場の観察者は、3つの潜在的な結果を提案しています。大手企業(Adobe、NVIDIA、AWSなどが有力候補)による戦略的買収、独立した株式公開に向けた成長、または「記憶SDK」としてエッジハードウェアへの統合です。

この技術は有望に見えますが、機関投資家は多額の資本を投じる前に、徹底的な技術検証を行うべきです。40,000時間以上の「コールド」データセットに対してシステムをテストし、競合他社と比較して精度/再現率の指標を比較することで、Memories.aiが野心的な主張を実現できるかどうかについて貴重な洞察が得られるでしょう。

企業も消費者も、増え続けるビデオデータ量に苦しむ中、見たものを真に理解し、記憶する機械を構築する競争は、今後数年間にわたってテクノロジー市場とユーザー体験の両方を再構築することを約束しています。

あなたも好きかもしれません

この記事は、 ニュース投稿のルールおよびガイドラインに基づき、ユーザーによって投稿されました。カバー写真は説明目的でコンピューターにより生成されたアートであり、事実を示すものではありません。この記事が著作権を侵害していると思われる場合は、 どうぞご遠慮なく弊社まで電子メールでご報告ください。皆様のご協力とご理解に感謝申し上げます。これにより、法令を遵守し、尊重あるコミュニティを維持することが可能となります。

ニュースレターに登録する

最新のエンタープライズビジネスとテクノロジー情報をお届けします。さらに、新しいサービスや提供物をいち早く独占的にチェックできます。

当社のウェブサイトでは、特定の機能を有効にし、より関連性の高い情報を提供し、お客様のウェブサイト上の体験を最適化するために、Cookieを使用しています。詳細については、 プライバシーポリシー および 利用規約 で確認できます。必須情報は 法的通知