Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Nếu bạn chỉ đọc một điều gì đó trong tuần này, tôi khuyên bạn nên xem báo cáo AI dưới đây:
"Từ Nhà máy Dữ liệu đến Mô hình Thế giới"
Nó kết hợp các nhà máy dữ liệu, kỹ thuật ngữ bối cảnh, môi trường RL, mô hình thế giới và nhiều hơn nữa thành một bài tiểu luận dễ tiếp cận nhưng toàn diện về rìa hiện tại của AI.👇(0/12)
Bài viết đầy đủ:
🧵dưới đây:
1) Từ bản phát hành Grok 4, rõ ràng chúng ta chưa chạm phải "một bức tường" trong chi tiêu tính toán.
Nguồn: @xai

2) Ngày càng nhiều, dữ liệu dường như là cột ngắn trong lều.
Nguồn: @EpochAIResearch

3) Hầu hết chi tiêu này đang được đầu tư vào việc tạo ra các bộ dữ liệu chất lượng cao cho việc huấn luyện sau, điều này đang nhanh chóng tiến gần đến 50% ngân sách tính toán.

4) Điều này đã dẫn đến sự thay đổi trong nhu cầu đối với "nhà máy dữ liệu" như @scale_AI @HelloSurgeAI @mercor_ai và nhiều hơn nữa, những người giúp tìm kiếm chuyên môn cần thiết và xây dựng các đường ống dữ liệu thiết yếu cho RL trong các lĩnh vực không thể xác minh...

5) Điều này có thể giúp cung cấp năng lượng cho các mô hình lý luận ngày càng mạnh mẽ hơn, rõ ràng là mô hình mở rộng đang được ưa chuộng theo @ArtificialAnlys

6) Và vẫn vậy, các mô hình không còn bị giới hạn bởi IQ mà bởi ngữ cảnh. Kỹ thuật nhắc nhở đã chuyển giao cho "Kỹ thuật Ngữ cảnh" - một lĩnh vực đang phát triển tối ưu hóa các tải trọng thông tin cho LLMs.

7) Không gian này cực kỳ năng động nhưng thường liên quan đến việc mở rộng ngữ cảnh qua 2 vectơ:
1. Độ dài ngữ cảnh: những thách thức về tính toán & kiến trúc trong việc xử lý các chuỗi siêu dài
2. Đa phương thức: mở rộng ngữ cảnh vượt ra ngoài văn bản để thực sự tạo ra các môi trường đa phương thức.

8) Có lẽ biểu hiện tối thượng của ngữ cảnh eng. là việc tạo ra "các môi trường RL" mô phỏng hoàn hảo các nhiệm vụ mà RL có thể được thực hiện.
Mặc dù hiện tại còn bị hạn chế về dữ liệu, @MechanizeWork tin rằng chúng ta đang tiến tới một sự chuyển mình "giống như GPT-3" với RL quy mô lớn.

9) Tuy nhiên, việc tạo ra những môi trường này khá tốn công sức và dường như không "đắng-lesson-pilled" lắm.
@_kevinlu đang tự hỏi liệu có cách nào để tận dụng internet cho việc sau đào tạo như đã làm cho việc trước đào tạo không?

10) Mặc dù là một suy nghĩ thú vị, nhưng phần lớn internet đã bị chiếm lĩnh bởi một vài hệ sinh thái lớn mà được tích hợp theo chiều dọc và đang nhanh chóng thực hiện RL trên các thành phần của chúng để có RL nhanh hơn nữa
(nghĩa là alpha tiến hóa từ @GoogleDeepMind)

11) Không rõ liệu những công ty lớn này có coi các môi trường RL khác nhau là thiết yếu hay chỉ là một điểm dừng tạm thời trên con đường hướng tới "mô hình thế giới" hoàn chỉnh, với các bản sao kỹ thuật số của hầu hết mọi hiện tượng.
Genie 3 từ Google chắc chắn là một dấu hiệu hướng tới điều này:

22:03 5 thg 8
Điều gì sẽ xảy ra nếu bạn không chỉ có thể xem một video được tạo ra, mà còn có thể khám phá nó nữa? 🌐
Genie 3 là mô hình thế giới đột phá của chúng tôi, tạo ra các môi trường tương tác, có thể chơi được từ một lời nhắc văn bản duy nhất.
Từ những cảnh quan chân thực đến các vương quốc huyền bí, khả năng là vô tận. 🧵
12) Điều này đặt ra câu hỏi: liệu các phương pháp tích hợp theo chiều dọc trong việc xây dựng trí tuệ tổng hợp với các vòng phản hồi RL nhanh hơn có được định sẵn để vượt lên và chiếm lĩnh thị trường hay liệu các hệ thống mô-đun về tính toán tiềm ẩn, dữ liệu và tài năng có thể cạnh tranh với sự phối hợp hiệu quả?

11,86K
Hàng đầu
Thứ hạng
Yêu thích