DApp Store | Hub Web3 pentru evenimente și jocuri

Explore the Momentum ecosystem and earn $1.015M in rewards

Subiecte populare

Bonk Eco continues to show strength amid $USELESS rally

Pump.fun to raise $1B token sale, traders speculating on airdrop

Boop.Fun leading the way with a new launchpad on Solana.

BOOP+0,61 %

Boopa-5,4 %

PORK-1,37 %

Misha Laskin

Co-fondator, CEO la @reflection_ai. Prev: Cercetare @DeepMind. Echipa Gemini RL.

Misha Laskin29 iul. 2025

Ceva mare se va întâmpla mâine. Aceștia sunt unii dintre cei mai talentați cercetători pe care îi cunosc

Deepak Pathak28 iul. 2025

Norocos să lucrez cu o echipă uimitoare @SkildAI. Consultați teaserul contribuțiilor de un deceniu ale echipei noastre înainte de Skild AI. Rămâneți pe fază pentru lansarea de mâine!

2,42K

Misha Laskin16 iul. 2025

Inginerii petrec 70% din timp înțelegând codul, nu scriindu-l. De aceea am construit Asimov la @reflection_ai. Cel mai bun agent de cercetare a codului, construit pentru echipe și organizații.

281,39K

Misha Laskin a repostat

Quentin Anthony12 iul. 2025

Am fost unul dintre cei 16 dezvoltatori din acest studiu. Am vrut să vorbesc despre opiniile mele despre cauzele și strategiile de atenuare a încetinirii dezvoltării. Voi spune ca un cârlig "de ce să te ascult?" că am experimentat o accelerare AI de -38% la problemele mele atribuite. Cred că transparența ajută comunitatea.

1,96M

Misha Laskin10 iul. 2025

Cea mai mare întrebare în cercetarea RL a fost întotdeauna - în ce mediu vă antrenați? Înainte erau jocuri video (Atari) și de societate (Go / Șah). Dar acum că RL lucrează cu LLM-uri, există un singur mediu care contează. Și este produsul tău.

Kevin Lu10 iul. 2025

De ce ar trebui să încetați să lucrați la cercetarea RL și să lucrați în schimb la produs // Tehnologia care a deblocat marea schimbare de scalare în AI este internetul, nu transformatorii Cred că este bine cunoscut faptul că datele sunt cel mai important lucru în AI și, de asemenea, că cercetătorii aleg să nu lucreze oricum la ele. ... Ce înseamnă să lucrezi pe date (într-un mod scalabil)? Internetul a oferit o sursă bogată de date abundente, care a fost diversă, a oferit un curriculum natural, a reprezentat competențele de care oamenii sunt cu adevărat interesați și a fost o tehnologie viabilă din punct de vedere economic pentru a fi implementată la scară largă. Fără transformatoare, orice număr de abordări ar fi putut decola, probabil că am putea avea CNN-uri sau modele spațiale de stare la nivelul GPT-4.5. Dar nu a existat o îmbunătățire dramatică a modelelor de bază de la GPT-4. Modelele de raționament sunt grozave în domenii înguste, dar nu la fel de mari ca GPT-4 în martie 2023 (acum peste 2 ani...) Avem ceva grozav cu învățarea prin întărire, dar teama mea profundă este că vom repeta greșelile din trecut (RL din era 2015-2020) și vom face cercetări RL care nu contează. În modul în care internetul a fost dualul pre-antrenamentului supravegheat, care va fi dualul RL care va duce la un progres masiv precum GPT-1 -> GPT-4? Cred că arată ca un co-design cercetare-produs.

10,98K

Misha Laskin a repostat

Kasey Zhang4 iul. 2025

Este ușor să reglați fin modelele mici cu RL pentru a depăși modelele de fundație pe sarcini verticale. Deschidem Osmosis-Apply-1.7B: un model mic care îmbină codul (similar cu aplicarea instantanee a lui Cursor) mai bine decât modelele de fundație. Link-uri pentru a descărca și încerca modelul de mai jos!

111,47K

Limită superioară

Clasament

Favorite

La modă pe lanț

La modă pe X

Principalele finanțări recente

Cele mai importante