DApp Store | Hub Web3 pour les événements et les jeux

Explore the Momentum ecosystem and earn $1.015M in rewards

Rubriques tendance

Bonk Eco continues to show strength amid $USELESS rally

Pump.fun to raise $1B token sale, traders speculating on airdrop

Boop.Fun leading the way with a new launchpad on Solana.

BOOP+0,38 %

Boopa+6,88 %

PORK+3,95 %

steve hsu

Physicien, fondateur de l’IA, podcast Manifold

steve hsuil y a 21 heures

Je me sens mal pour les zoomers ☹️

17,51K

steve hsu8 août, 20:43

Le NYT contraint de publier des faits qu'il n'aime VRAIMENT pas. MOMENT SPUTNIK = temps de rivaliser, plus de COPE "Après la Seconde Guerre mondiale, lorsque les États-Unis ont été confrontés à une concurrence militaire et scientifique accrue de l'Union soviétique, les universités sélectives ont commencé à accorder plus de poids aux facteurs académiques, y compris le SAT, a déclaré Nicholas Lemann, qui a écrit sur l'histoire des tests standardisés et est professeur de journalisme à l'Université de Columbia."

26,29K

steve hsu8 août, 20:11

"Même les modèles de pointe ont du mal à se mettre à jour au-delà des prioris de préentraînement, peu importe à quel point les nouvelles preuves sont convaincantes." Nous formons des doctorants à faire cela ! Les transformateurs peuvent-ils le faire sans changer leurs poids ?

steve hsu8 août, 07:29

Le raisonnement par chaîne de pensée des LLMs est-il un mirage ? ... Nos résultats révèlent que le raisonnement CoT est un mirage fragile qui disparaît lorsqu'il est poussé au-delà des distributions d'entraînement. Ce travail offre une compréhension plus profonde des raisons pour lesquelles et des moments où le raisonnement CoT échoue, soulignant le défi permanent d'atteindre un raisonnement véritable et généralisable. ... Nos découvertes révèlent que le raisonnement CoT fonctionne efficacement lorsqu'il est appliqué à des données dans la distribution ou proches de la distribution, mais devient fragile et sujet à l'échec même sous des changements de distribution modérés. Dans certains cas, les LLMs génèrent des étapes de raisonnement fluides mais logiquement inconsistantes. Les résultats suggèrent que ce qui semble être un raisonnement structuré peut être un mirage, émergeant de motifs mémorisés ou interpolés dans les données d'entraînement plutôt que d'une inférence logique. ... Ensemble, ces résultats suggèrent que les LLMs ne sont pas des raisonneurs principiels mais plutôt des simulateurs sophistiqués de textes ressemblant à du raisonnement.

12,27K

steve hsu8 août, 04:11

NYT : Le président Trump devrait signer un mémorandum jeudi exigeant que les universités soumettent des données d'admission au gouvernement fédéral pour vérifier la conformité avec une décision de la Cour suprême de 2023 qui a mis fin aux politiques tenant compte de la race, selon un haut responsable de la Maison Blanche. L'action présidentielle exige également que Linda McMahon, la secrétaire à l'Éducation, augmente le nombre de vérifications de précision sur les données fournies par les établissements et prenne des mesures contre les universités qui soumettent des informations tardives ou inexactes. Le mémorandum exigera également que le ministère de l'Éducation réorganise son processus de collecte de données sur l'enseignement supérieur, connu sous le nom de Système intégré de données sur l'enseignement postsecondaire, qui comprend des détails sur les admissions, l'inscription et l'aide financière. Ces informations seront rendues plus accessibles au public, selon une fiche d'information.

steve hsu6 août, 07:05

NYTimes : Columbia et Brown vont divulguer des données sur les admissions et la race dans le cadre de l'accord Trump Il a fallu une menace existentielle de Trump pour les amener à publier ces données. Il y a des années, un comité de faculté du système de l'Université de Californie a examiné ce type de données et a produit les graphiques ci-dessous. Si vous regardez les données, vous comprendrez la nature monstrueuse de l'action affirmative telle qu'elle est pratiquée aux États-Unis depuis environ 50 ans. NYT : ... Columbia et Brown devront maintenir des "politiques d'admission basées sur le mérite", selon leurs règlements, qui codifient les objectifs plus larges de l'administration dans un langage juridiquement contraignant. Les universités "ne peuvent en aucun cas préférer illégalement des candidats en fonction de la race, de la couleur ou de l'origine nationale dans les admissions à travers leurs programmes", stipulent les deux accords dans un langage identique. "Aucun substitut pour l'admission raciale ne sera toléré." ... "Le Département de la Justice mettra fin à un système honteux dans lequel la race de quelqu'un compte plus que sa capacité", a déclaré Chad Mizelle, l'assistant procureur général par intérim, en mars. "Chaque collège et université devrait savoir que la discrimination illégale dans les admissions sera enquêtée et éliminée." Le langage utilisé dans les règlements avec Columbia et Brown renforce des assertions contestées concernant l'affaire des admissions de la Cour suprême que l'administration Trump fait depuis février. Il insiste sur le fait que la décision va au-delà des admissions et interdit toute considération de la race dans la vie universitaire.

6,97K

steve hsu7 août, 20:08

La sororité est GÉNIALE 😀

8,72K

steve hsu6 août, 07:05

23,71K

steve hsu5 août, 19:44

Un autre 💀 graphique - par exemple, regardez les premières dérivées moyennées sur les ~12 derniers mois 🤔 🐒 <-- Le gars qui parle beaucoup de la politique de l'IA mais qui a du mal à calculer les premières dérivées. USA ! USA ! C'est OK !

steve hsu5 août, 18:32

Soutenez ATOM ! L'IA open source est bonne ! Ci-dessous, un autre 💀 graphique. Les choses sont BEAUCOUP pires que ce que ce graphique indique car la plupart des téléchargements du modèle chinois ne se font probablement pas sur HuggingFace. Avec ~50 % des développeurs d'IA en RPC, et ~100 % de leurs téléchargements étant des modèles open source réalisés par des laboratoires chinois (Llama n'est pas compétitif, pour être honnête), le point de croisement s'est déjà produit à l'échelle mondiale.

36,37K

steve hsu5 août, 18:32

Nathan Lambert4 août, 22:08

L'Amérique doit prendre les modèles ouverts plus au sérieux. Cet été, l'avance initiale des États-Unis en matière d'adoption de modèles ouverts via Llama a été dépassée par des modèles chinois. Avec le projet The American Truly Open Models (ATOM), nous cherchons à construire un soutien et à exprimer l'urgence de cette question.

44,23K

steve hsu5 août, 09:10

NYT sur les rationalistes, Lighthaven, Manifest Lighthaven est une manifestation physique de ... ces idées qui ont imprégné la Silicon Valley et la région de la baie de San Francisco — un temple moderne.

3,25K

steve hsu4 août, 22:27

Modèle Huawei openPangu-Ultra-MoE-718B Aucune technologie Nvidia n'a été utilisée pour construire ce modèle - uniquement des puces AI Ascend, CANN et non CUDA. "... entraîné depuis zéro sur NPU Ascend, avec un total de 718 milliards de paramètres et 39 milliards de paramètres activés par token. Le openPangu-Ultra-MoE-718B est entraîné sur environ 19 trillions de tokens, et équipé de la capacité de passer entre une pensée rapide et une pensée lente." Il semble s'agir d'un modèle à la pointe de la technologie, sinon le meilleur modèle ouvert actuellement disponible. Lien ci-dessous - vous pouvez le télécharger et l'utiliser.

27,19K

Meilleurs

Classement

Favoris

Tendance on-chain

Tendance sur X

Récents financements de premier plan

Les plus notables