簡化 Agent 構建過程且提供一些複雜功能組合的框架,在未來還是會佔據上風,由此會形成一種比 GPT Store 更有趣的 Web3 創意經濟。
- 作者:YBB Capital 研究員 Zeke
前言
在此前的文章中,我們已經多次探討了對於 AI Meme 現況及 AI Agent 未來發展的看法。然而,AI Agent 賽道的敘事發展之快、演變之劇,還是讓人有點應接不暇。自「真理終端」(Truth Terminal)開啟 Agent Summer 以來的短短兩個月內,AI 與 Crypto 結合的敘事幾乎每週都有新變化。近期,市場的注意力又開始聚焦於技術敘事主導的「框架類」項目中,這條細分賽道僅在過去幾週就已經跑出了多匹市值過億甚至是過十億的黑馬。而此類項目也衍生出了一種新的資產發行範式,即專案以 Github 代碼庫發幣,基於框架打造的 Agent 亦能再次發幣。以框架為底,Agent 為上。形似資產發行平台,事實上卻是一種獨屬於 AI 時代的基建模式正在浮現。我們該如何審視這種新趨勢?本文將從框架簡介開始結合自身思考去解讀 AI 框架對於 Crypto 究竟意味著什麼?
一、何謂框架?
從定義上來說,AI 框架是一種底層開發工具或平台,整合了一套預建置的模組、庫和工具,簡化了建構複雜 AI 模型的過程。這些框架通常也包含用於處理資料、訓練模型和進行預測的功能。簡而言之,你也可以把框架簡單理解為 AI 時代下的作業系統,如同桌面作業系統中的 Windows、Linux,又或是行動端中的 iOS 與 Android。每種框架都有其自身的優點和缺點,開發者可以依據具體的需求去自由選擇。
雖然「AI 框架」一詞在 Crypto 領域中仍屬新興概念,但從其起源來看,自 2010 年誕生的 Theano 算起,AI 框架的發展歷程其實已接近 14 年之久。在傳統 AI 圈無論是學界還是產業界都已經有非常成熟的框架可供選擇,例如谷歌的 TensorFlow、Meta 的 Pytorch、百度的飛槳、字節的 MagicAnimate,針對不同場景這些框架均有各自的優勢。
目前在 Crypto 中湧現出的框架項目,則是依據這波 AI 熱潮開端下大量 Agent 需求所打造的,而後又向 Crypto 其它賽道衍生,最終形成了不同細分領域下的 AI 框架。我們以當前圈內幾個主流框架為例,擴展一下這句話。
1.1 Eliza
首先以 ai16z 的 Eliza 為例,該框架是一個多 Agent 模擬框架,專門用於創建、部署和管理自主 AI Agent。基於 TypeScript 作為程式語言開發,其優點就是相容性更佳,更容易 API 整合。
依據官方文件所示,Eliza 主要針對的場景便是社交媒體,例如多平台的整合支持,該框架提供功能齊全的 Discord 整合且支援語音頻道、X/Twitter 平台的自動化帳戶、Telegram 的整合以及直接的 API 訪問。在對於媒體內容的處理上支援 PDF 文件的閱讀與分析、連結內容提取與摘要、音訊轉錄、視訊內容處理、影像分析與描述,對話摘要。
Eliza 當前支援的用例主要為四類:
- AI 助理類應用:客戶支援代理、社群管理員、個人助理;
- 社群媒體角色:自動內容創作者、互動機器人、品牌代表;
- 知識工作者:研究助理、內容分析師、文件處理器;
- 互動角色:角色扮演角色、教育輔導員,娛樂機器人。
Eliza 目前支援的模型:
- 開源模型本地推理:例如 Llama3、Qwen1.5、BERT;
- 使用 OpenAI 的 API 基於雲推理;
- 預設配置為 Nous Hermes Llama 3.1B;
- 與 Claude 整合以實現複雜查詢。
1.2 G.A.M.E
G.A.M.E(Generative Autonomous Multimodal Entities Framework)是 Virtual 推出的自動生成與管理的多模態 AI 框架,其針對場景主要是遊戲中的智能 NPC 設計,該框架還有一個特別之處在於低代碼甚至是無代碼基礎的用戶也可使用,根據其試用介面來看用戶只需修改參數便可參與 Agent 設計。
在項目架構上,G.A.M.E 的核心設計是透過多個子系統協同工作的模組化設計,詳細架構如下圖。
1. Agent Prompting Interface:開發者與 AI 框架互動的介面。透過這個接口,開發者可以初始化一個會話,並指定會話 ID、代理 ID、用戶 ID 等參數;
2. Perception Subsystem:感知子系統負責接收輸入訊息,並將其合成後傳送給策略規劃引擎。它還處理對話處理模組的回應;
3. Strategic Planning Engine:策略規劃引擎是整個架構的核心部分,分為高階規劃器(High Level Planner)和低階策略(Low Level Policy)。高階規劃器負責制定長期目標和計劃,而低階策略則將這些計劃轉化為具體的行動步驟;
4. World Context:世界上下文包含了環境資訊、世界狀態和遊戲狀態等數據,這些資訊用於幫助代理理解當前所處的情境;
5. Dialogue Processing Module:對話處理模組負責處理訊息和回應,它可以產生對話或反應作為輸出;
6. On Chain Wallet Operator:鏈上錢包操作員可能涉及到區塊鏈技術的應用場景,具體功能不明確;
7. Learning Module:學習模組從回饋中學習並更新代理的知識庫;
8. Working Memory:工作記憶儲存了代理最近的動作、結果以及當前計劃等短期資訊;
9. Long Term Memory Processor:長期記憶處理器負責提取關於代理及其工作記憶的重要訊息,並根據重要性評分、近期性和相關性等因素進行排序;
10. Agent Repository:代理倉庫保存了代理的目標、反射、經驗和個性等屬性;
11. Action Planner:動作規劃器根據低階策略產生具體的行動計畫;
12. Plan Executor:計畫執行器負責執行由動作規劃器產生的行動計畫。
工作流程:開發者透過 Agent 提示介面啟動 Agent,感知子系統接收輸入並將其傳遞給策略規劃引擎。戰略規劃引擎利用記憶系統、世界上下文和 Agent 庫中的信息,制定並執行行動計畫。學習模組則持續監控 Agent 的行動結果,並根據結果調整 Agent 的行為。
應用場景:從整個技術架構來看,該框架主要聚焦於 Agent 在虛擬環境中的決策、回饋、感知及個性,在用例上除了遊戲也適用於 Metaverse,在 Virtual 的下方列表中可以看到已經有大量項目採用了該框架進行建構。
1.3 Rig
Rig 是一款以 Rust 語言編寫的開源工具,專為簡化大型語言模型(LLM)應用程式的開發而設計。它透過提供一個統一的操作介面,使開發者能夠輕鬆地與多個 LLM 服務提供商(例如 OpenAI 和 Anthropic)以及多種向量資料庫(如 MongoDB 和 Neo4j)進行互動。
核心特點:
- 統一接口:無論是哪個LLM 提供商或哪種向量存儲,Rig 都能提供一致的訪問方式,極大地減少了整合工作的複雜性;
- 模組化架構:框架內部採用模組化設計,包含「提供商抽象層」、「向量儲存接口」和「智慧代理系統」等關鍵部分,確保了系統的靈活性和可擴展性;
- 類型安全:利用Rust 的特性實現了類型安全的嵌入操作,保障了代碼品質與執行時的安全性;
- 高效性能:支援異步編程模式,優化了並發處理能力;內建的日誌記錄和監控功能有助於維護和故障排查。
工作流程:當用戶要求進入 Rig 系統後,會首先經過「提供商抽象層」,這裡負責標準化不同提供商之間的差異,並確保錯誤處理的一致性。接下來,在核心層中,智慧代理可以調用各種工具或者查詢向量儲存來取得所需的資訊。最後,透過檢索增強生成(RAG)等高階機制,系統能夠結合文件檢索和上下文理解,產生精確且有意義的回應,再返回給用戶。
應用場景:Rig 不僅適用於建立需要快速準確回答的問題解答系統,還可以用於創建高效的文件搜尋工具、具備情境感知能力的聊天機器人或虛擬助手,甚至支援內容創作,根據現有的資料模式自動生成文字或其他形式的內容。
1.4 ZerePy
ZerePy 是一個基於 Python 的開源框架,旨在簡化在 X (前 Twitter) 平台上部署和管理 AI Agent的過程。它脫胎於 Zerebro 項目,繼承了其核心功能,但以更模組化、更易於擴展的方式進行設計 。其目標是讓開發者能夠輕鬆創建個人化的 AI Agent,並在 X 上實現各種自動化任務和內容創作。
ZerePy 提供了一個命令列介面(CLI),方便用戶管理和控制其部署的 AI Agent「1」。其核心架構基於模組化設計,允許開發者靈活地整合不同的功能模組,例如:
- LLM 整合:ZerePy 支援 OpenAI 和 Anthropic 的大型語言模型(LLM),開發者可以選擇最適合其應用場景的模型 。這使得 Agent 能夠產生高品質的文字內容;
- X 平台整合:框架直接整合 X 平台的 API,允許 Agent 進行發佈、回覆、按讚、轉發等操作 ;
- 模組化連接系統:該系統允許開發者輕鬆添加對其他社交平台或服務的支持,擴展框架的功能 ;
- 內存系統(未來規劃):雖然目前版本可能尚未完全實現,但 ZerePy 的設計目標包括整合內存系統,使 Agent 能夠記住先前的互動和上下文訊息,從而產生更連貫和個人化的內容 。
雖然 ZerePy 和 a16z 的 Eliza 專案都致力於建立和管理 AI Agent,但兩者在架構和目標上略有不同。 Eliza 比較著重於多智能體模擬和更廣泛的 AI 研究,而 ZerePy 則專注於簡化在特定社交平台(X)上部署 AI Agent 的過程,更偏向於實際應用中的簡化 。
二、BTC 生態的翻版
其實從發展路徑而言,AI Agent 與 23 年末、24 年初的 BTC 生態有著相當多異曲同工之處,BTC 生態的發展路徑可以簡單概括為:BRC20—Atomical/Rune 等多協議競爭—BTC L2—以 Babylon 為核心的 BTCFi。而AI Agent 在成熟的傳統 AI 技術棧基礎上則發展的更迅猛一些,但其整體發展路徑確實與 BTC 生態有許多相似之處,我將其簡單概括如下:GOAT/ACT—Social 類 Agent—分析類 AI Agent 框架競爭。從趨勢上來說,圍繞 Agent 去中心化、安全性做文章的基建項目大概率也將承接這波框架熱,成為下個階段的主旋律。
那麼這條賽道是否會同 BTC 生態一樣走向同質化、泡沫化?我認為其實不然,首先 AI Agent 的敘事不是為了重現智能合約鏈的歷史,其次現有的 AI 框架專案技術上無論是真有實力還是停滯於 PPT 階段或 ctrl c+ctrl v,至少它們提供了一種新的基建發展思維。許多文章將 AI 框架比作資產發行平台,Agent 比作資產,其實相較於 Memecoin Launchpad 和銘文協議,我個人覺得 AI 框架更像未來的公鏈,Agent 更像未來的 Dapp。
在現今的 Crypto 中我們擁有數千條公鏈,數以萬計的 Dapp。在通用鏈之中我們有 BTC、以太坊以及各種異構鏈,而應用鏈的形式則更多樣化,如遊戲鏈、儲存鏈、Dex 鏈。公鏈對應於 AI 框架其實兩者本來就非常形似,而 Dapp 也可以很好的對應 Agent。
在 AI 時代下的 Crypto,極有可能將朝著這種形態前進,未來的爭論也將從 EVM 與異構鏈的爭論轉為框架之爭,現在的問題更多的是怎麼去中心化或者說鏈化?這點我想後續的 AI 基建計畫會在這個基礎上展開,而另一點是在區塊鏈上做這件事有什麼意義?
三、上鏈的意義?
區塊鏈無論與什麼事物結合,終歸是要面對一個問題:有意義嗎?在去年的文章裡我批判過 GameFi 的本末倒置,Infra 發展的過渡超前,在前幾期關於AI的文章中我也表達了並不看好現階段下實用領域中 AI x Crypto 的組合。畢竟,敘事的推動力對於傳統項目而言已經越來越弱,去年少有的幾個幣價表現較好的傳統項目基本也得具備匹配幣價或超越幣價的實力。 AI 對於 Crypto 能有什麼用?我之前想到的是 Agent 代操作實現意圖,Metaverse、Agent 作為員工等相對較俗卻有需求的想法。但這些需求都沒有完全上鏈的必要,從商業邏輯上來講也無法閉環。上一期提到的 Agent 瀏覽器實現意圖,倒是能衍生出數據標記、推理算力等需求,但兩者的結合還是不夠緊密且算力部分綜合多方面而言依舊是中心化算力佔優。
重新思考 DeFi 的成功之道,DeFi 之所以能從傳統金融里分到一杯羹,是因為具備更高的可及性、更好的效率和更低的成本、無需信任中心化的安全性。如果依照這個思路思考,我覺得能支持 Agent 鏈化的理由也許還有幾個。
1. 降低成本:Agent 的鏈化是否能實現更低的使用成本,從而達到更高的可及性與可選擇性?最終使獨屬於 Web2 大廠的 AI「出租權」讓普通用戶也能參與;
2. 安全性:依據 Agent 最簡單的定義,一個能被稱為 Agent 的 AI 理應能與虛擬或現實世界產生交互,如果 Agent 能介入現實或是我的虛擬錢包,那麼基於區塊鏈的安全方案也算一種剛需;
3. 區塊鏈專有的金融玩法:Agent 能不能實現一套專屬於區塊鏈的金融玩法?例如 AMM 中的 LP,讓一般人也能參與自動做市,例如 Agent 需要算力、資料標記等,而用戶在看好的情況下以 U 的形式投入協議。又或者基於不同應用場景下的 Agent 能形成新的金融玩法;
4. DeFi 互操作性:DeFi 在目前不具備完美的互操作性,結合區塊鏈的 Agent 如果能實現透明、可追溯的推理也許能比上一篇文章說到的傳統互聯網巨頭提供的 agent 瀏覽器更具吸引力。
四、創意?
框架類項目在未來也將提供一次類似 GPT Store 的創業機會。雖然目前透過框架發布一個 Agent 對於普通用戶還是很複雜,但我認為簡化 Agent 構建過程且提供一些複雜功能組合的框架,在未來還是會佔據上風,由此會形成一種比 GPT Store 更有趣的 Web3 創意經濟。
目前的 GPT Store 還是偏向傳統領域的實用性且大部分熱門 App 都是由傳統 Web2 公司創建,而在收入上也是由創作者獨佔。依據 OpenAI 的官方解釋,該策略僅對美國地區部分傑出開發者提供資金支持,給予一定額度的補助。
Web3 從需求上來看還存在許多尚需填補的方面,而在經濟體系上也可使 Web2 巨頭不公平的政策更公平化,除此之外,我們自然也可以引入社區經濟來使 Agent 更加完善。 Agent 的創意經濟將是一般人也能參與的一次機會,而未來的 AI Meme 也將遠比 GOAT、Clanker 上發行的 Agent 要更為智慧、有趣。