OpenAI罕見開源,低調發布的新研究,一出來就被碰瓷

2024-10-16 01:35:03 10

或許是前段時間風頭太盛,週末時,OpenAI靜悄悄釋出了新的研究作品:Swarm。一反之前的架勢,這個新作只在官網的Cookbook和Github釋出,官推都沒有多講。

除了非常安靜和低調,開發人員還反覆給自己疊甲:這只是一個實驗性質的框架,只作為分享和教育用途。官方不質保,實用需謹慎!

明明已經這麼低調,一出來還是被碰瓷了。

什麼是Swarm?

Swarm旨在探索輕量級、可擴充套件、可定製的多代理協作模式。OpenAI的研究人員,提出了「routine」和「handoffs」概念,用來表達agent之間的任務傳遞。

然而Swarm才釋出一天,麻煩就找上門來:一個二十多歲的開發者Kye Gomez發推稱,這個新作從名字到框架,全都是抄襲他的創業專案Swarms。

這條控訴吸引了超過20萬的圍觀,不過,圍觀群眾都很冷靜,要求Kye提供更明確的證據,並且質疑他提出的訴求:「除非OpenAI投資我們」,這什麼東西啊?

很快就有網友翻出他的碰瓷前科。而且,從兩邊在Github上釋出的README文件來看,顯然也是OpenAI更靠譜一點。

我把文件送進了ChatGPT,用最新的o1做了一下分析,OpenAI提出了更詳實和具體的想法。

至於說專案重名和一些常用指令重合,比如.run()——這就像是有人說自己的數學考卷被抄襲了,因為兩邊的答題框裡都有個「解」字。

OpenAI的Swarm框架裡,重點梳理了在多代理模式裡的各種成分,並且提出了兩個關鍵概念:例程(routines)和交接(handoffs),還提供了很多便於理解的例子。

例程可以把它理解為由不同步驟組成起來的一套「基本操作」,比如,你搭建了一個購物助理,那麼你就可以規定一套流程作為例程。

但是一個agent能做的事,再多也是有限的。更何況大語言模型本身,多多少少會出幻覺。所以需要不同的agent、不同的routine之間有所交接。

就像一場接力跑,一個選手跑完一段,就要交接到下一個選手手上,而且要保證平穩,不能掉在地上。

這些才是本次釋出裡OpenAI重點關注的部分。或許說不上是什麼驚為天人的大發現,但硬說抄襲,也是有點碰瓷了——非要追根溯源,那得倒回幾十年前。

多智慧體最擅長的,竟然是打遊戲

OpenAI並不是才開始對多智慧體協作發生興趣的,早在2018年,就有過不錯的表現——在Dota 2職業比賽上,擊敗了資深的人類玩家。

遊戲是一個天然適合用來測試多智慧體的土壤,不同的角色,有不同的技能;面對不同的對手,要有不同的策略,總之,想要贏下一局遊戲,勢必要協調各個角色,並且組織好它們之間的協作能力。

想想你打王者碰到豬隊友時有多氣,就知道這個難度了。

當時OpenAI Five涉及的技術構件包括神經網路、自訓練、強化學習等,沒有時下流行的大語言模型,主要是用來試驗多智慧體協作。

甚至,那個時候每個英雄各自背後的神經網路,並不互相溝通,而是有一個負責總控的超引數,來協調每一個英雄(主要是背後的神經網路)的表現。

再往深了講就有點太深了,總之,那幾年的經歷,讓OpenAI連續三年打贏了幾個Dota2的大賽,也在多智慧體協作方面頗有收穫。

到了2019年,DeepMind開發的AlphaStar在《星際爭霸2》中,水平超過了99.8%的人類玩家。

在星際裡,有人族、神族和蟲族三個派系,每個派系都有多個可供操作的建築、兵種,每局遊戲也都需要經歷資源採集、科技發展和實時戰鬥等幾個流程。

當時DeepMind發表論文時就提到,遊戲是一個多智慧體協作的任務,每個玩家需要控制許多單位,共同實現目標。

DeepMind所設計的agent,每分鐘運算元約為180次,大概等同於中級玩家。當時他們的想法是:智慧體要儘可能地學習人類玩家的遊戲操作,然後超越人類。

這樣的「類人」思路,甚至可以追溯到更久之前:早在1972年,卡爾·休伊特(Carl Hewitt)就提出了Actor Model(行動者模型),這是併發計算的概念模型。演員模型提出了獨立計算實體(agent)可以透過訊息傳遞進行通訊的概念,為智慧體之間的互動奠定了理論基礎。

到了九十年代和千禧年初,agent就更加明確地,被視為能夠自主行動、決策的「賽博實體」,並且有了基於智慧體信念、意圖進行決策和規劃的研究,BDI模型。

等到了大語言模型橫空出世之後,多智慧體的互動、決策溝通,從原來的黑盒,變得更容易轉化成自然語言。

智慧體之間,也可以透過語言來討論、協作,特別是在決策情境中,不同的智慧體之間能夠「有商有量」。

之前我們介紹過面壁智慧曾經做過的研究,也是在Minecraft,一款沙盒遊戲裡——不得不說,多智慧體實在是太擅長打遊戲了。

在遊戲裡,不同的智慧體可以直接對話來完成分工、資源互通和任務傳遞。大語言模型的推理和記憶能力,都能更有效地為多智慧體的行動提供支援。

而OpenAI不就在於有厲害的模型嗎——年初時,他們藉由ChatGPT灰度測試過,在對話方塊內,可以召喚其他GPT外掛,也算是一種多智慧體協作的「平替版」。

只是效果著實不咋地,嘗試了一下Capcut的外掛,一直鬼打牆地跳轉不成功(注:Capcut是剪映的海外版)。

可以說,這一次的Swarm是OpenAI探索充分調動自己的優勢——強大的基座模型——再進一步摸索出一個多智慧體的工作流程框架。

好訊息是,在從OpenAI變得越來越「吝嗇」之後。這次Swarm倒是開源出來了。大語言模型讓多智慧體系統能夠以更加自然的方式與人類互動。相信在未來,這種互動絕不僅限於簡單的對話,而是會更多地提高生產力。