Sklep DApp | Centrum Web3 dla wydarzeń i gier

Popularne tematy

Kirill Balakhonov | Nethermind

Twórca AuditAgent | AI x Crypto x Produkt | Budowanie ekonomii agenturalnej

Dlaczego OpenAI wydało modele z otwartymi wagami? Aby zabić własny biznes... (czyż nie?) Tak, @OpenAI właśnie wydało dwa modele z otwartymi wagami, co oznacza, że deweloperzy mogą z nich korzystać, nie płacąc OpenAI nic. Konkretnie, zostały one wydane na najbardziej liberalnej komercyjnej licencji Apache 2.0. Więc dlaczego OpenAI to zrobiło? Jest kilka aspektów. Ale chcę wyjaśnić, że kiedy firma wydaje model z otwartymi wagami, nie oznacza to, że model jest tak samo otwartoźródłowy jak kod otwartoźródłowy, który możesz uruchomić samodzielnie, jak system operacyjny @Linux. Nie, w przypadku modeli AI jest to trochę inne. W szczególności model to czarna skrzynka, zestaw wag. I chociaż możesz go testować na różnych zadaniach i zobaczyć, jak działa, jeśli nie możesz odtworzyć procesu treningowego, nigdy nie będziesz wiedział, czy w tym modelu nie ma żadnych tylnych drzwi ani luk bezpieczeństwa, które przypadkowo lub celowo się w nim znalazły. Więc oddzielmy to od otwartego źródła od razu. Niestety, modele z otwartymi wagami nie mogą być w pełni zaufane (choć mogą być tanie). Inny aspekt, który zauważyłem, pokazany na zdjęciu, to to, że jakość modeli otwartoźródłowych nie różni się zbytnio od flagowych modeli OpenAI, które są dostępne tylko przez API. To świetnie! To niespodziewane! Można by pomyśleć, ile pieniędzy OpenAI mogłoby stracić, pozwalając deweloperom korzystać z ich modeli? Jednak to nie wszystko. Modele to nie wszystko, co otrzymujesz, korzystając z OpenAI przez API. Na przykład, gdy korzystasz z ChatGPT przez UI i wybierasz model o3, tak naprawdę działa tam złożony agent, który, korzystając z tych modeli, ma dużo logiki napisanej na górze, aby naprawdę dobrze współpracować z twoimi dokumentami i narzędziami. Nie masz do nich dostępu przez te modele opublikowane przez OpenAI. Więc dlaczego OpenAI wydało modele z otwartymi wagami? Po pierwsze, ich główni konkurenci, szczególnie @Meta, @MistralAI i @deepseek_ai (o, i @Google), już wydali konkurencyjne modele z otwartymi wagami, z których ludzie korzystają. A popularność OpenAI wśród osób korzystających z otwartych modeli nie rośnie. Jednak dla deweloperów, którzy potrzebują zarówno modeli z otwartymi wagami (do obliczeń lokalnych/prywatnych), jak i modeli dostępnych przez API (do trudniejszych rzeczy), jeśli potrzebują obu, po prostu nie mogą korzystać z OpenAI. Łatwiej jest im korzystać z konkurencji, takiej jak Google czy DeepSeek. Po drugie, istnieje znaczna presja ze strony zarówno użytkowników, jak i regulatorów, którzy chcą większej otwartości. Ludzie obawiają się, że AI może wymknąć się spod kontroli lub znaleźć się pod kontrolą wąskiej grupy firm w Dolinie Krzemowej, a ludzie chcą większej przejrzystości. Chociaż ośmielam się powiedzieć, że nawet martwiąc się o konkurencję i spadające sprzedaże, taki ruch w kierunku otwartości prawdopodobnie sprawi, że biznes OpenAI stanie się jeszcze większy. A po trzecie, oczywiście, jest żart o nazwie firmy OpenAI. Sądząc po tym, jak wszystko się rozwijało, firma o nazwie OpenAI była najbardziej zamkniętą firmą AI wśród liderów. To samo w sobie jest zabawne, ale teraz to się zmieniło. Co o tym myślisz?

Andrej Karpathy popiera wprowadzenie nowego terminu związanego z "inżynierią kontekstu" w rozwoju oprogramowania AI przy użyciu LLM. I ten termin od dawna wydaje się bardzo potrzebny. Za każdym razem, gdy wyjaśniam ludziom, jak rozwijamy nasz Nethermind AuditAgent, jednym z kluczowych aspektów, oprócz wykorzystania wiedzy z dziedziny (bezpieczeństwo web3) i używania najlepszych dostępnych modeli AI (od OpenAI, Anthropic i Google) oraz narzędzi dla LLM, jest właśnie "inżynieria kontekstu". Czasami pojawia się wyrażenie "kontekst jest królem" i to naprawdę prawda. LLM, niezależnie od tego, czy są ogromne i zaawansowane, czy zoptymalizowane małe LLM, są potężnym narzędziem, ale jak każde narzędzie, jeśli jest w niewłaściwych rękach, uzyskasz znacznie mniej obiecujące wyniki, niż mógłbyś, gdybyś pracował z nimi poprawnie. A zarządzanie kontekstem (lub inżynieria) jest rzeczywiście złożonym i niezbyt dobrze opisanym obszarem, który nieustannie się rozwija, a naprawdę wyłonił się jako rozszerzenie koncepcji inżynierii podpowiedzi, która już ma pewne negatywne konotacje. Ogólnie rzecz biorąc, Andrej wymienił główne aspekty związane z inżynierią kontekstu (na drugim zrzucie ekranu), ale w każdym konkretnym zadaniu ludzie osiągają doskonałe wyniki w dużej mierze dzięki próbom i błędom, za każdym razem monotonnie próbując wybrać odpowiednie elementy kontekstu, które są naprawdę potrzebne na tym etapie rozwiązywania problemu, zbierając benchmarki dla każdego etapu, patrząc na metryki, dzieląc zbiory danych na testowe, walidacyjne i tak dalej. Co myślisz o "inżynierii kontekstu"?

Najlepsze

Ranking

Ulubione

Trendy onchain

Trendy na X

Niedawne największe finansowanie

Najbardziej godne uwagi