「ソフトウェアは電気のような商品となり、LLM 層で直接実行されます。」 それは一体何を意味するのでしょうか?詳細に分解します (長い投稿が入ってきます🍿)、終わったら中間点はありません。あなたはその考えを完全に拒否するか(そして間違っている)、か、改宗者を出て、私はあなたを私のカルト😂に歓迎します 昨日の投稿では、近い将来にこれがはっきりと実現すると述べ、多くの話題や疑問を呼び起こしました。そこで、1年以上にわたってここで共有してきたアイデアを具体化していきます(そして、X以外で私に飽きていない人には、この時点で自分自身にうんざりしています)。それに取り掛かりましょう。 1. 「すべてのソフトウェアはLLMレイヤーで実行されます」 まず、明白なこと。 今日でも、信じられないことに、すべてのソフトウェア(フロントエンド、バックエンド、インフラなど)がプレーンな自然言語で作成される世界に向かっていることを否定する人々がいます。 実際には、Claude、Grok、ChatGPT などの LLM や、Cursor、Windsurf、Lovable などのツールがすでに存在しています。私が知っているまともな開発者は、もうコードを1行も書かない。彼らは自然言語で話し、エージェントの群れにアプリ全体を構築するように指示し、それをレビューする(そして議論したり物乞い🤣したりする)だけで、AIがビジョンを実現するようにします。 その部分は些細なことです。まだそこに到達していないのは、そこに行きたくないからです。 次の飛躍ははるかに大きく、AI に深く関わっている人々でさえ私を懐疑的な目で見ています。 そのレイヤーも必要ありません。Python、HTML、C ++、CSSなど、何もありません。 すべて (ソフトウェア層全体、ロジック、永続性、またはメモリ (必要に応じてデータベースと呼びますが、それ以上のもの) は、LLM 内で直接「実行」されます。 イーロンマスクそれを歴史に残る行に要約しました:「任意の入力ビットストリームから任意の出力ビットストリームへ」。 テクノロジーを知っているなら、おそらくそれ以上は必要ないでしょう。あなたはすでにそれを理解しています。念のため、簡単な例を挙げてみましょう。 今日、Magnificのようなアップスケーラーを構築したい場合は、次のものが必要です。 - バックエンドロジック、サーバー上で実行されているコード(この場合はPython) - データベース(Firebase、Postgres、Supabase、MySQLなど) - フロントエンドレイヤー、ユーザーに表示されるもの:HTML、CSS、JavaScript - インフラ層: 魔法が実行され、API を介してワークフローを呼び出すクラウド GPU なんてサーカスでしょう! 確かに、これはカーソル + クロードですでにほとんど構築できます。しかし、プログラミング言語は人間のために設計されました。将来のAIはそれらを必要としないでしょう。それらは冗長です。削除する必要があるパラメータ。非効率性。 これらすべてが本当に必要だと思いますか?20年後もこのようなことを続けると本当に思っていますか? いいえ。今日では想像しがたいが、思っているよりも早くわかる未来の LLM は、今日の Magnific のスクリーンショットを撮り、その画像とマウスのクリックまたはドラッグだけで、次に何をする必要があるかを推測できます。 次に何をする必要があるかを推測します。 そして、フロントエンド、バックエンド、データベースを密かに内部で構築するという意味ではありません(それは中世です)。つまり、文字通り、ユーザーに表示する次のビジュアルフレームを生成します。これは、スライダーを右に 1 ピクセル移動し、表示された画像をもう少し詳細にアップスケールした同じスクリーンショットである可能性があります。 そんな風に。 「でも...だがしかし。。。だがしかし。。。ハビ...ロジックはどこで発生しますか?プログラムはどこでそんなことをしているのですか?」 LLMの内部に直接!今日のモデルが画像を撮影し、適切な物理学を備えた完全なビデオを生成できるのと同じように、どんなに複雑であっても、現在あらゆるアプリケーションの「ビジネス ロジック」と呼ばれているものを理解します。 「任意の入力ビットストリームから任意の出力ビットストリームへ。」 ロジックは、手作業のコードからではなく、モデル自体から生まれます。 今、あなたはおそらくそれを手に入れたでしょう。そうでない場合は、次のポイントに進む前に、少し時間を取ってアイデアを噛み砕き、喉に詰まらないようにしてください。 2. 「ソフトウェアは電気のような商品になるだろう」 ソフトウェアだけではありません。すべてのデジタル エンターテイメント (映画、ビデオゲームなど) も同様です。リアルタイムで。 デジタル技術の価値のほとんどは、ごく少数の企業に集中するでしょう。マルチモーダル LLM レースに勝つものと、それらが実行されるインフラストラクチャを提供するもの。「これを行うSaaSが欲しい」とか「犬を主役にこのスタイルの映画を作ってくれ」と言うと、今日の最高の作品をはるかに上回る品質のLLMから即座に結果が得られる世界を想像してみてください。 基本的に、すべてのロジックレイヤーとビジュアルレイヤーは、今日ではほとんど想像できない超高度なLLMで実行されると思います。今のようにアプリ、サイト、エンターテイメントを構築するのは意味がありません。それを実現する能力は、最高のLLMとそれらを大規模に実行するためのコンピューティングを備えた企業に集中するでしょう。 AI プロバイダーは主に価格で選び、機能や容量はあまり選ばれません。今日の電力会社や、興味深い IP をロックしている PS 対 Xbox を思い浮かべてください。 3. 「しかし、ハビは決定論的ではなく、記憶も持っていません。彼らはこのようなまともなアプリを決して作らないでしょう」 不可能と言うのは近視眼的です。もちろん、粘り強さと記憶力があるでしょう。ただ、今日私たちが使用している単純な「データベースのような」方法ではありません。 4. 「わかりました。でも、そのようなLLMをどのように構築しますか?」 慎重に 😂 主に合成データを使用します。ここには、まだかなり革命的な明白なアイデアがあります。 LLM とエージェントはエンドツーエンドのアプリ (バックエンドとフロントエンド) の生成に近いため、明示的な目的と報酬関数を使用して、UI の状態と入力をログに記録する閉ループで構築するようにインストルメント化できます。これらの軌跡は、将来の基盤モデルのためのトレーニングに役立てることができます。 私の限られた知識でこれを考えることができれば(たとえ大企業がそれをやっていると公言していないとしても)、私はすでにはるかに聡明な頭脳を持っていると推測できます。 5. 「これが真実であることが判明した場合、どうすれば非信者よりも優位に立つことができますか?」 このようなことについてあなたが正しければ、あなたはすでに先を行っています。今のところ、私の動きは投資を通じてポジショニングを行い、GPU とテクノロジーをロックダウンすることでどの企業がほとんどの電力を集中させるかを把握することです。スレッドの後半にリンクをドロップしますが、それは近視眼的で、今日存在するものに焦点を当てている可能性があります。あなたができる最善のことは、毎日ゲームを追いかけ、鋭敏さを保つことです。 着陸はどうですか? ご質問がございましたら、コメント欄でお答えください。
ええと...@elonmusk、私が説明しているこれらの「スーパー LLM」の 1 つをトレーニングするというこのアイデアについて、「任意の入力ビットストリームから任意の出力ビットストリーム」という概念を実現できるというアイデアについてどう思いますか?👇 「LLM とエージェントはエンドツーエンドのアプリ (バックエンドとフロントエンド) の生成に近づいているため、明示的な目標と報酬関数を使用して、UI の状態と入力をログに記録するクローズド ループで構築するようにインストルメント化できます。これらの軌跡は、将来の基盤モデルのためのトレーニングに役立てることができます。」
「しかし、銀行は依然としてCOBOLで運営されています。」 さて、明確にしましょう:「すべてのソフトウェアはLLMレイヤーで実行されます」です。 常識: ソフトウェアの99%について話しています...原子力発電所のコード、銀行、ハードウェアコントローラーなどの非常に特殊なものを除いて、今から30年経っても引きずっているかもしれません。 しかし、ソフトウェアの 99% (または必要に応じて 90%) が LLM レイヤーで実行され、すべてのデジタル エンターテイメントとともに完全に流動的であるという事実は、それ自体がすでに非常識なパラダイム シフトです。 ここで重要なのは、正確な割合ではなく、このようなことが可能であることに気付くことで、ソフトウェアがコードではなくモデルから直接出現することを意味する飛躍です。これはクソ SF の狂気であり、私たちはそれを自分の目で見ることになります。
20.05K