ホワイトペーパー
News

AI Native Company に関する考察

Ko Ohashi

ogp_ai_native_whitepaper

——シリコンバレーの謳い文句は本当か——

— YC・Karpathy・Dorsey・Nadella・a16z の主張を批判的に検証する —


ただしAndrej Karpathyが指摘するように、「検証可能性」の高い業務から実験を始めることは合理的であり、2040年に約1,100万人の労働力不足が確定している日本では、その実験の経済合理性は特に高い。シリコンバレーも含めて、まだ誰も答えを持っていない。だからこそ、今実験することが唯一合理的な戦略である。




1. 「AI Native Company」とは誰が、なぜ語っているのか

2025年後半から2026年にかけて、「AI Native Company(AIネイティブ企業)」という言葉はシリコンバレーの中心的な語彙になった。YCのGarry Tanは「6人で年間売上1,000万ドル(約15億円)を、12か月以内に達成できる」と語り、Diana HuはAIを「会社が動くオペレーティングシステム」と位置づけ、Jack DorseyとSequoiaのRoelof Bothaは共著エッセイで「中間管理職は不要になる」と論じた。

しかし、誰が・どんな根拠で・どんな立場から語っているかを切り分けると、主張の「硬さ」は大きく異なる。

Garry TanがStanford CS153で語った「6人で15億円」は、平均値でも中央値でもない。「can hit(達成できる)」という可能性の表現であり、選ばれた最良ケースの存在証明である。YCは年間数百社に出資しており、「少人数・高収益」の物語はYCの出願数・バリュエーション・ブランド価値を直接押し上げる——つまりYCには、この物語を信じさせることで得をする構造的インセンティブがある。

同じ構造はほかの論者にも当てはまる。DorseyとBothaのエッセイは、Blockが全従業員の40%にあたる約4,000人を削減した1か月後に発表された。OpenAIとAnthropicは「エンタープライズAI契約を拡大する」立場にある。DeloitteやMcKinseyは「AI変革コンサルティング」を高額で売っている。a16zはAIエージェント企業への投資を大規模に行っている。

語っている全員が、それを信じさせることで得をする立場にいる。

例外は、Andrej Karpathyである。元OpenAI共同創業者・元Tesla AI責任者として、自身の失敗例や限界を率直に開示し、反証可能な主張をする。ただしKarpathyは2026年5月にAnthropicに入社した。元々誠実な情報発信者として知られるが、今後は利害関係が生じる可能性があり、発言の文脈には注意が必要になる。




2. 数字が示すエンタープライズの現実

語り手たちの輝かしい物語と、組織全体の実測データの間には大きな溝がある。

エンタープライズAI企業Writerが2026年初頭に2,400名の経営層に実施した調査では、97%が「個人としてAIの効果を実感している」と答えた一方、「組織としてのROIを実感している」のは生成AIで29%、AIエージェントでは23%にとどまった。回答者の48%が「AI導入は大きな失望だった」と答え、75%が「自社のAI戦略は実質より"見せかけ"だ」と認めた。

MITのNANDA研究所(2025年7月)は「パイロットの約95%がP&Lインパクトゼロ。成功は約5%のみ」と報告する。Gartnerは「2027年末までにagentic AIプロジェクトの40%超が中止される」と予測している。

さらに興味深いのが、METR研究(2025年)の発見だ。16名の熟練OSS開発者を対象にCursor Pro+Claude 3.5/3.7を使った246タスクのランダム化比較実験を行ったところ——開発者たちは「24%速くなる」と予測し、「20%速くなった」と感じた。しかし実測では、19%遅くなっていた。

「速くなった気がするが実際は遅い」。

この知覚と実測のギャップが、97%が個人の効果を感じるのに組織ROIは29%しか出ない矛盾のメカニズムではないかと我々は考える。AIが自己欺瞞を組織的に生み出す可能性がある。「感じる」と「計測できる」は別物だ。

なお、これはGitHub Copilotの研究(2023年)が「標準タスクで約55%高速化」を実証しているのと矛盾しない。Copilot研究は新規・定型タスクの話であり、METR研究は熟練者が5年保守してきた複雑なコードベースの話だ。同じ「ソフトウェア開発」でも、誰が・何のために・どんなコードを書くかで乗数は桁違いに変わる。スタートアップの創業者が自社プロダクトのためにゼロから書く場合は、100Xの体感も現実的だ。




3. Garyの論理はどこで崩れるか

AI Native論の核心的な主張——「AI Native組織設計で収益性10倍」——には、論理の飛躍がある。

MidjourneyやCursorなどが示す「1人あたり売上数億円」という数字は、組織設計の成果ではなくビジネスモデルの選択の話だ。セルフサーブ・デジタル・限界費用ほぼゼロ・100%課金ユーザーという設計で作られた会社が、必然的にこの数字を出す。Salesforceがどれだけ「Closed Loop組織」に作り替えても、エンプラ営業・CS・実装支援という人間依存の構造は変わらず、同じ乗数は出ない。

YCが自社の成果として語った「マニュアルのAI再生成(2,000時間の録音から150ページのマニュアルを生成)」も、YCの本業——「誰かが化けるか」だけで決まる——の収益性とは無関係な改善だ。

Karpathyは2026年4月のSequoia AI Ascentで、より誠実なフレームワークを提示した。「従来のコンピュータは"コードで記述できること"を自動化した。LLMは"検証できること"を自動化する」——タスクの出力を人間を介さずに検証できるかどうかが、自動化の「可否」ではなく「順序」を決める。AIの進化についていけていない気すら感じているという彼でさえ、誰も完成した答えを持っていないことを公言している。




4. これがこうなれば本物になる

AI Nativeが本物のROIを出す条件として、我々は「1人で2名分の価値」という閾値を提案する。「1000x」のような上限値の修辞ではなく、組織全体に適用したときに事業構造を変える最小の閾値だ(これは著者の経験値に基づく提案であり、業界のコンセンサスではない)。

この閾値の達成可能性は、業務タイプによって大きく異なる。検証可能性が高い業務(数学・コード・明確な正解のある知識処理)では今すぐ達成できる領域がある。複雑な判断・交渉・信頼構築では当面人間が残る。同じ「ソフトウェア開発」でも、組織の大小・コードベースの性質・書く目的で乗数は変わる。

日本においてこの閾値の達成は、欧米以上に死活的な意味を持つ。リクルートワークス研究所の推計によれば、日本は2040年に約1,100万人の労働力不足に直面する。これは景気変動による一時的な不足ではなく、人口動態に起因する構造的・不可逆な制約だ。

ただし残酷なミスマッチもある。労働力不足が最も深刻な業種(介護25%・ドライバー24%・建設22%)は、Karpathyのフレームワークで見ると「最もAIが効きにくい業種」でもある。身体介助・運転・現場作業は検証不能領域だ。ホワイトカラーの仕事が代替されることで生じる労働力の再配置という間接的な経路はあるが、スキルのミスマッチ・時間軸のズレ・賃金水準の乖離という摩擦がある。




5. なぜ今実験することが唯一合理的な答えか

シリコンバレーも含めて、まだ誰も完成した答えを持っていない。

Karpathyは「frontier modelにはマニュアルが付いてこない」と公言する。DorseyとBothaは「Blockはこの移行の初期段階にある。機能する前に壊れる部分もあるだろう」と自ら認める。a16zは「AIネイティブ・エンタープライズの設計図はまだ描かれている最中」と述べる。

それでも今実験することには、4つの理由がある。

理由1:組織学習は買えない・時間がかかる。 「どの業務が検証可能か」は試してみないとわからない。そのノウハウの蓄積に6〜18か月かかる。今の遅れは後で取り返せない性質のものだ。

理由2:ツールが閾値を越えた(Karpathy's December 2025)。 2025年12月以前は修正コストが高く実験が困難だった。今は修正頻度が激減し、実験のシグナルが明確になった。「今やっと実験が成立する環境になった」タイミングでの開始は、過去のどの時点よりも学習コスト対効果が高い。

理由3:「1人で2名分」の答えは実験した人しか手に入らない。 誰もまだ証明していない。証明できた組織が先行者利益を独占する。そして証明の過程で構築した組織能力そのものが差別化になる。

理由4:2040年の労働制約は待ってくれない。 組織的なAI活用能力の構築に3〜5年かかるとすれば、今から始めないと間に合わない可能性がある。

「ベンダーの言う通りに全社をAIネイティブに作り替える」のも、「様子見で何もしない」のも、どちらも非合理だ。唯一合理的なのは、Karpathyの「検証可能性」基準で自社業務を棚卸しし、検証可能性の高い業務から小さく・速く・測定しながら実験することだ。




読者への問い

本稿は、特定のAIツールやベンダーを推奨するものではない。シリコンバレーで語られているAI Native論の何が本当で、何がまだ仮説なのかを正直に整理し、その中で日本企業が向き合う問いの見取り図を提供することが目的である。

最後に、読者に対して問いを残しておきたい。

あなたの会社が現在、AI化のために投じている予算は、測定可能な仮説に基づく実験として設計されているか。それとも、「AI Nativeで収益10倍」という未検証の物語に乗った、見せかけの投資になっていないか。

この問いに対する答えを自分で持てているかどうかが、3年後の自社の競争位置を、静かに、しかし確実に決定する。




ホワイトペーパー(完全版)

本稿はホワイトペーパー本編の要点を抜粋・再構成したものです。本編では以下を詳述しています:

6名の論者(Garry Tan・Diana Hu・Jack Dorsey & Botha・Satya Nadella・Andrej Karpathy・a16z)の主張を「根拠の硬さ」「インセンティブ」「誠実度」の3軸で比較した詳細分析

エンタープライズAI ROIデータの出典精査と「未確認数字」の明示

METR研究・GitHub Copilot研究の設計と結果の対比

業務タイプ別の現実的な生産性乗数(実証データ付き)

Karpathyの「verifiability」フレームワークの実務的な読み解き

日本固有の労働力不足データと2040年のインパクト試算


ホワイトペーパー全文をダウンロード


まず動画で概要を把握したい方へ

このホワイトペーパーの内容を、著者・大橋功が動画で解説しています。
「6人で15億円は本当か」「語る全員が利害関係者である理由」
「Closed Loopに本質はあるのか」
——約24分で要点をカバーしています。

▶ 動画を見る(YouTube)