Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

steve hsu
Físico, fundador de IA, Manifold Podcast
NYT obligado a imprimir hechos que REALMENTE no le gustan.
MOMENTO SPUTNIK = momento de competir, no más COPE
"Después de la Segunda Guerra Mundial, cuando Estados Unidos enfrentó una mayor competencia militar y científica de la Unión Soviética, las universidades selectivas comenzaron a dar mayor peso a factores académicos, incluido el SAT, dijo Nicholas Lemann, quien ha escrito sobre la historia de las pruebas estandarizadas y es profesor de periodismo en la Universidad de Columbia."

24,08K
"Incluso los modelos de frontera luchan por actualizarse más allá de los priors de preentrenamiento, sin importar cuán convincente sea la nueva evidencia."
¡Entrenamos a estudiantes de doctorado para hacer esto! ¿Pueden los transformadores hacerlo sin cambiar sus pesos?


steve hsu8 ago, 07:29
¿Es el razonamiento de cadena de pensamiento de los LLMs un espejismo?
... Nuestros resultados revelan que el razonamiento CoT es un espejismo frágil que desaparece cuando se empuja más allá de las distribuciones de entrenamiento. Este trabajo ofrece una comprensión más profunda de por qué y cuándo falla el razonamiento CoT, enfatizando el desafío continuo de lograr un razonamiento genuino y generalizable.
... Nuestros hallazgos revelan que el razonamiento CoT funciona de manera efectiva cuando se aplica a datos dentro de la distribución o cerca de ella, pero se vuelve frágil y propenso a fallos incluso bajo cambios moderados en la distribución. En algunos casos, los LLMs generan pasos de razonamiento fluidos pero lógicamente inconsistentes. Los resultados sugieren que lo que parece ser un razonamiento estructurado puede ser un espejismo, emergiendo de patrones memorizados o interpolados en los datos de entrenamiento en lugar de inferencia lógica.
... Juntos, estos hallazgos sugieren que los LLMs no son razonadores con principios, sino más bien simuladores sofisticados de texto similar al razonamiento.

10,83K
NYT: Se espera que el presidente Trump firme un memorando el jueves que requerirá a las universidades enviar datos de admisión al gobierno federal para verificar el cumplimiento de una decisión de la Corte Suprema de 2023 que puso fin a las políticas conscientes de la raza, según un alto funcionario de la Casa Blanca.
La acción presidencial también requiere que Linda McMahon, la secretaria de educación, aumente el número de verificaciones de precisión sobre los datos proporcionados por las escuelas y tome medidas contra las universidades que envíen información tardía o inexacta.
El memorando también requerirá que el Departamento de Educación reforme su proceso para recopilar datos de educación superior, conocido como el Sistema Integrado de Datos de Educación Postsecundaria, que incluye detalles sobre admisiones, matrícula y ayuda financiera. Esa información será más accesible al público, según una hoja informativa.

steve hsu6 ago, 07:05
NYTimes: Columbia y Brown revelarán datos de admisiones y raza en el acuerdo con Trump
Se necesitó una amenaza existencial de Trump para que liberaran estos datos. Hace años, un comité de facultad del sistema de la Universidad de California examinó este tipo de datos y produjo los gráficos a continuación. Si miras los datos, entenderás la naturaleza monstruosa de la acción afirmativa tal como se practica en EE. UU. durante ~50 años.
NYT: ... Columbia y Brown tendrán que mantener "políticas de admisión basadas en el mérito", según sus acuerdos, que codifican los objetivos más amplios de la administración en un lenguaje legalmente vinculante.
Las universidades "no pueden, de ninguna manera, dar preferencia ilegalmente a los solicitantes en función de la raza, color u origen nacional en las admisiones a lo largo de sus programas", afirman ambos acuerdos en un lenguaje idéntico. "No se tolerará ningún proxy para la admisión racial."
... "El Departamento de Justicia pondrá fin a un sistema vergonzoso en el que la raza de alguien importa más que su capacidad", dijo Chad Mizelle, el fiscal general asociado interino, en marzo. "Cada colegio y universidad debe saber que la discriminación ilegal en las admisiones será investigada y eliminada."
El lenguaje utilizado en los acuerdos con Columbia y Brown refuerza afirmaciones controvertidas sobre el caso de admisiones de la Corte Suprema que la administración Trump ha estado haciendo desde febrero.
Insiste en que la decisión va más allá de las admisiones y prohíbe cualquier consideración de raza en la vida universitaria.


6,65K
NYTimes: Columbia y Brown revelarán datos de admisiones y raza en el acuerdo con Trump
Se necesitó una amenaza existencial de Trump para que liberaran estos datos. Hace años, un comité de facultad del sistema de la Universidad de California examinó este tipo de datos y produjo los gráficos a continuación. Si miras los datos, entenderás la naturaleza monstruosa de la acción afirmativa tal como se practica en EE. UU. durante ~50 años.
NYT: ... Columbia y Brown tendrán que mantener "políticas de admisión basadas en el mérito", según sus acuerdos, que codifican los objetivos más amplios de la administración en un lenguaje legalmente vinculante.
Las universidades "no pueden, de ninguna manera, dar preferencia ilegalmente a los solicitantes en función de la raza, color u origen nacional en las admisiones a lo largo de sus programas", afirman ambos acuerdos en un lenguaje idéntico. "No se tolerará ningún proxy para la admisión racial."
... "El Departamento de Justicia pondrá fin a un sistema vergonzoso en el que la raza de alguien importa más que su capacidad", dijo Chad Mizelle, el fiscal general asociado interino, en marzo. "Cada colegio y universidad debe saber que la discriminación ilegal en las admisiones será investigada y eliminada."
El lenguaje utilizado en los acuerdos con Columbia y Brown refuerza afirmaciones controvertidas sobre el caso de admisiones de la Corte Suprema que la administración Trump ha estado haciendo desde febrero.
Insiste en que la decisión va más allá de las admisiones y prohíbe cualquier consideración de raza en la vida universitaria.


23,25K
Otro gráfico 💀 - por ejemplo, mira las primeras derivadas promediadas durante los últimos ~12 meses 🤔
🐒 <-- Tipo que habla mucho sobre la política de IA pero tiene problemas para calcular las primeras derivadas. ¡EE.UU.! ¡EE.UU.! ¡Está bien!


steve hsu5 ago, 18:32
¡Apoya ATOM! ¡La IA de código abierto es buena!
A continuación, otro gráfico 💀. Las cosas son MUCHO peores de lo que indica este gráfico porque la mayoría de las descargas del modelo de China probablemente no ocurren en HuggingFace. Con aproximadamente el 50% de los desarrolladores de IA en la República Popular China, y aproximadamente el 100% de sus descargas siendo modelos abiertos creados por laboratorios chinos (Llama no es competitivo, para ser honesto), el punto de cruce ya ha ocurrido a nivel global.
36,32K
¡Apoya ATOM! ¡La IA de código abierto es buena!
A continuación, otro gráfico 💀. Las cosas son MUCHO peores de lo que indica este gráfico porque la mayoría de las descargas del modelo de China probablemente no ocurren en HuggingFace. Con aproximadamente el 50% de los desarrolladores de IA en la República Popular China, y aproximadamente el 100% de sus descargas siendo modelos abiertos creados por laboratorios chinos (Llama no es competitivo, para ser honesto), el punto de cruce ya ha ocurrido a nivel global.

Nathan Lambert4 ago, 22:08
América necesita tomarse más en serio los modelos abiertos. Este verano, el liderazgo inicial en la adopción de modelos abiertos de EE. UU. a través de Llama ha sido superado por modelos chinos.
Con el Proyecto de Modelos Verdaderamente Abiertos de América (ATOM), buscamos construir apoyo y expresar la urgencia de este problema.

44,19K
Modelo Huawei openPangu-Ultra-MoE-718B
No se utilizó tecnología Nvidia para construir este modelo, solo chips de IA Ascend, CANN no CUDA.
"... entrenado desde cero en NPU Ascend, con un total de 718B de parámetros y 39B de parámetros activados por token. El openPangu-Ultra-MoE-718B se entrena en aproximadamente 19 billones de tokens y está equipado con la capacidad de alternar entre pensamiento rápido y lento."
Parece ser un modelo de última generación, si no el mejor modelo abierto disponible actualmente.
Enlace a continuación - puedes descargarlo y usarlo.

27,15K
Parte superior
Clasificación
Favoritos
En tendencia on-chain
En tendencia en X
Principales fondos recientes
Más destacado