Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Noam Brown
Researching reasoning @OpenAI | Co-created Libratus/Pluribus superhuman poker AIs, CICERO Diplomacy AI, and OpenAI o3 / o1 / 🍓 reasoning models
Hmm, tôi tự hỏi điều này có thể là gì...

OpenAI01:00 7 thg 8
TRỰC TIẾP THỨ NĂM 10 GIỜ SÁNG PT
103,9K
Có thể khó để "cảm nhận AGI" cho đến khi bạn thấy AI làm chủ một lĩnh vực mà bạn quan tâm sâu sắc. Mọi người sẽ có khoảnh khắc Lee Sedol của họ vào một thời điểm khác nhau.

Dave White22 thg 7, 2025
tin tức về openai IMO đã ảnh hưởng đến tôi khá nặng nề vào cuối tuần này
tôi vẫn đang trong giai đoạn cấp tính của tác động, tôi nghĩ
tôi coi mình là một nhà toán học chuyên nghiệp (một mô tả mà một số nhà toán học chuyên nghiệp thực sự có thể không đồng ý, nhưng bữa tiệc của tôi, quy tắc của tôi) và tôi không nghĩ mình có thể trả lời một câu hỏi IMO nào
được rồi, vâng, IMO là một phân nhánh thể thao nhỏ của toán học mà tôi chưa được đào tạo, v.v. nhưng. nếu tôi gặp ai đó ngoài đời có huy chương vàng IMO, tôi ngay lập tức cập nhật rằng "người này giỏi toán hơn tôi"
bây giờ một đống robot có thể làm điều đó. là một người có nhiều bản sắc và cuộc sống thực sự xoay quanh "giỏi toán", điều đó thật đau đớn. đó là một kiểu chết dần.
như thể, một ngày nào đó bạn phát hiện ra bạn có thể nói chuyện với chó. điều đó thật thú vị và hấp dẫn nên bạn làm nhiều hơn, học hỏi những tinh tế trong ngôn ngữ và phong tục sâu sắc nhất của chúng. bạn học rằng những người khác ngạc nhiên về những gì bạn có thể làm. bạn chưa bao giờ thực sự hòa nhập, nhưng bạn học rằng mọi người đánh giá cao khả năng của bạn và muốn bạn ở bên để giúp họ. những chú chó cũng đánh giá cao bạn, người duy nhất thực sự hiểu điều đó. bạn tạo ra cho mình một kiểu thuộc về. rồi một ngày bạn thức dậy và máy dịch chó toàn cầu được bán tại walmart với giá 4,99 đô la
kết quả IMO không phải là tin tức, chính xác mà nói. thực tế, nếu bạn nhìn vào biểu đồ độ dài nhiệm vụ của tác nhân METR theo thời gian, tôi nghĩ rằng các tác nhân có thể giải quyết các bài toán ~ 1,5 giờ đang đến đúng thời điểm. vì vậy theo một cách nào đó, chúng ta không nên ngạc nhiên. và thực sự, có vẻ như nhiều công ty đã đạt được cùng một kết quả. chỉ là... thủy triều đang dâng lên nhanh như nó đã dâng lên
tất nhiên, nỗi buồn về bản sắc cá nhân của tôi như một nhà toán học (và/hoặc thành viên sản xuất của xã hội) là phần nhỏ nhất trong câu chuyện này
nhân đôi nỗi buồn đó với *mỗi* nhà toán học, với mỗi lập trình viên, có thể là mỗi người lao động tri thức, mỗi nghệ sĩ... trong vài năm tới... đó là một câu chuyện lớn hơn một chút
và tất nhiên, ngoài điều đó, còn có nỗi sợ cái chết thực sự, mà có lẽ tôi sẽ nói thêm sau.
gói này -- nỗi buồn về sự liên quan, nỗi buồn về cuộc sống, nỗi buồn về những gì tôi đã biết -- không phải là điều độc nhất trong thời đại AI hay bất cứ điều gì như vậy. tôi nghĩ đó là điều tiêu chuẩn khi một người tiếp cận cuối sự nghiệp hoặc cuối đời. chỉ có thể rằng điều đó đang đến sớm hơn một chút cho nhiều người trong chúng ta, tất cả cùng một lúc.
tôi tự hỏi liệu chúng ta có sẵn sàng không
148,62K
Chúc mừng đội GDM về kết quả IMO của họ! Tôi nghĩ rằng thành công song song của họ làm nổi bật tốc độ tiến bộ của AI. Cách tiếp cận của họ có phần khác với của chúng tôi, nhưng tôi nghĩ điều đó cho thấy có nhiều hướng nghiên cứu để tiến xa hơn. Một số suy nghĩ về mô hình và kết quả của chúng tôi 🧵
386,53K
Cược của họ cho phép các hệ thống AI toán học chính thức (như AlphaProof). Vào năm 2022, gần như không ai nghĩ rằng một LLM có thể đạt cấp độ vàng IMO vào năm 2025.

Nat McAleese19 thg 7, 2025
Chúng ta đang chứng kiến sự tiến bộ của AI nhanh hơn nhiều so với những gì **Paul Christiano** và **Yudkowsky** dự đoán, những người đã dự đoán vàng vào năm 2025 với tỷ lệ 8% và 16% tương ứng, bằng các phương pháp tổng quát hơn so với mong đợi.
164,66K
Chúng tôi mất vài tháng để biến biên giới nghiên cứu thực nghiệm thành một sản phẩm. Nhưng tiến độ nhanh đến mức một vài tháng có thể có sự khác biệt lớn về khả năng.

Ravid Shwartz Ziv19 thg 7, 2025
Vậy là, tất cả các mô hình đều kém hơn con người trong các câu hỏi mới của Kỳ thi Toán học Quốc tế, và Grok-4 đặc biệt tệ trong đó, ngay cả với lựa chọn tốt nhất trong số n? Thật không thể tin được!

128,73K
Sheryl (@sherylhsu02) là nhân viên đầu tiên của chúng tôi trong đội ngũ đa tác nhân. Chỉ trong vài tháng sau khi gia nhập, cô ấy đã giúp biến điều này thành hiện thực. Chúng tôi thật may mắn khi có cô ấy trong đội!

Sheryl Hsu19 thg 7, 2025
Việc theo dõi mô hình giải quyết những vấn đề IMO này và đạt được hiệu suất cấp vàng thật kỳ diệu. Một vài suy nghĩ 🧵
114,68K
Hàng đầu
Thứ hạng
Yêu thích
Onchain thịnh hành
Thịnh hành trên X
Ví funding hàng đầu gần đây
Được chú ý nhất