架構 - BRICKS

BRICKS Buttress 清楚地分為四層 — 客戶端、伺服器、後端核心，以及共用的硬體 guardrails — 透過 JSON-RPC WebSocket 協定與 UDP 自動探索傳輸串接。下方圖示為目標架構；已實作與計劃中區段會標明目前已上線與仍在路線圖上的項目。

完整架構

橘色實線箭頭代表執行階段的資料路徑。綠色虛線箭頭表示 Hardware Guardrails 套件在客戶端與伺服器兩側共用 — 雙方執行同一份程式碼。灰色虛線節點（Thermal Printer、Future Backends）為路線圖上尚未推出的項目。

層	角色
Buttress Server	整合所有功能的完整伺服器 — WebSocket RPC、自動探索、檔案傳輸
Buttress Backend	不含自動探索的後端（用於嵌入情境）
Autodiscovery	UDP 廣播與 HTTP 端點探索
Buttress Client	Foundation 裝置用於連線伺服器的客戶端函式庫
Backend Core	generator 實作（LLM、STT、MLX，以及未來的熱感印表機）
Hardware Guardrails	共用的能力偵測與評分邏輯 — 客戶端與伺服器執行相同程式碼，因此採同一評分標準

當 Foundation 裝置啟動 generator 時，客戶端與伺服器會交換硬體資訊，讓系統選擇要在哪一側執行：

客戶端收集本機能力。 GPU／CPU 資訊、可用記憶體、模型 metadata（層數、embedding 大小、KV cache 需求）。
客戶端將能力資訊送至伺服器，並附帶模型識別子與要求的 context 長度。
伺服器同時評估雙方 — 將相同的 guardrails 程式碼套用於客戶端回報的能力與伺服器自身。雙方各取得 0-100 的效能評分與記憶體適配判定。
伺服器回傳建議 — local、buttress 或 either。
客戶端據此決定，依其策略（prefer-local、prefer-buttress、prefer-best）與建議結果做最終選擇。詳見從 Foundation 使用 Buttress。

由於客戶端與伺服器共用同一個 guardrails 套件，雙方分數可直接比較 — 不會有校準偏差。

工作區 JWT 認證 — 每個工作區擁有 Ed25519 核發者，短期 { k:'ba', w_id, … } access token。請參閱工作區繫結。
UDP 自動探索與簽署過的通告 — UDP 8089 上的 ANNOUNCE／QUERY／RESPONSE，通告中夾帶各後端的硬體能力。每台已繫結伺服器以登錄的 Ed25519 通告金鑰簽署所有封包，launcher 驗證簽章並套用 30 秒重放視窗。協定版本為 2.0。請參閱區域網路自動探索。
參考計數的 generator registry — 多個客戶端可共用同一已載入模型，refcount 歸零時伺服器自動清理。
佇列管理 — 針對 STT 的硬體感知請求排隊，平行 slot 狀態可於 /status 儀表板檢視。
GGML LLM、MLX LLM 與 GGML STT 後端。
能力偵測與評分 — 雙方執行相同的 guardrails 程式碼。
STT 檔案傳輸 — 裝置上傳音訊至 POST /buttress/upload。

JWT 認證如何融入此架構。

UDP 傳輸、通告酬載與能力評分。