Buttress 伺服器透過Documentation Index
Fetch the complete documentation index at: https://docs.bricks.tools/llms.txt
Use this file to discover all available pages before exploring further.
--config 讀取單一 TOML 檔案。每個區段皆為選填,省略時會使用預設值。
最小範例
[server]
| 鍵 | 型別 | 預設值 | 說明 |
|---|---|---|---|
port | number | 2080 | HTTP/WebSocket 連接埠 |
log_level | string | "info" | debug、info、warn 或 error |
id | string | buttress-<machineId> | 用於繫結與探索的穩定伺服器 id |
name | string | 自動生成 | 顯示於 BRICKS Controller 的友善名稱 |
max_body_size | number 或 string | 52428800(50 MB) | 最大上傳大小;接受 "50MB"、"1GB" 等寫法 |
session_timeout | number 或 string | 60000(1 分鐘) | WebSocket 閒置逾時;接受 "1m"、"30s" |
temp_file_dir | string | <os-tmpdir>/.buttress | STT 音訊上傳與其他暫存檔案的目錄 |
[runtime]
伺服器存放下載模型的位置。
| 鍵 | 預設值 | 說明 |
|---|---|---|
cache_dir | ~/.buttress/models | 下載模型檔案的存放位置 |
huggingface_token | "" | Hugging Face 認證 token;若為空會回退至 HF_TOKEN 環境變數 |
[runtime.session_cache]
針對 ggml-llm generator,伺服器可在請求之間保留 KV cache 狀態,讓共用相同 prompt 前綴的後續完成可省略 prompt 處理。
| 鍵 | 預設值 | 說明 |
|---|---|---|
enabled | true | 啟用持久化的 KV cache |
max_size_bytes | "10GB" | 磁碟總預算;接受 "500MB"、"50GB" 或數值 |
max_entries | 1000 | 最大快取項目數(採 LRU 淘汰) |
{cache_dir}/.session-state-cache/。
[[generators]]
每個 [[generators]] 區段宣告一組伺服器要提供的模型。可重複多次以提供多個模型。
LLM(llama.cpp / GGML)
LLM(MLX,僅限 Apple Silicon)
語音辨識(Whisper / GGML)
| 鍵 | 說明 |
|---|---|
type | ggml-llm、mlx-llm 或 ggml-stt 之一 |
backend.variant_preference | 後端變體的優先順序清單。LLM 接受 cuda、vulkan、snapdragon、default;STT 接受 coreml、default |
model.repo_id | Hugging Face repo id |
model.filename | repo 內的特定檔案(僅 STT) |
model.quantization | 對應 repo 的量化標籤(僅 LLM) |
model.n_ctx | 以 token 計算的 context window 長度(僅 LLM) |
[autodiscover]
伺服器會於 UDP 8089 廣播自己,以便相同區域網路上的 Foundation 裝置能找到。預設啟用自動探索。
[autodiscover] = false 可完全停用自動探索。協定細節請參閱自動探索參考。
[env]
啟動時套用的環境變數,但僅在系統環境中尚未設定時生效。系統變數與命令列匯出值的優先順序更高。
相容性端點
以下端點為實驗性功能,schema、錯誤格式與 CORS 預設值未來可能變動。
| 端點 | 設定旗標 |
|---|---|
POST /oai-compat/v1/chat/completions | [openai_compat] enabled = true |
GET /oai-compat/v1/models | [openai_compat] enabled = true |
POST /anthropic-messages/v1/messages | [anthropic_messages] enabled = true |
POST /anthropic-messages/v1/messages/count_tokens | [anthropic_messages] enabled = true |
ENABLE_OPENAI_COMPAT_ENDPOINT=1 或 ENABLE_ANTHROPIC_MESSAGES_ENDPOINT=1。
下一步
工作區繫結
將伺服器與 BRICKS 工作區配對並啟用認證。
區域網路自動探索
Foundation 裝置如何於區域網路上找到您的伺服器。