Personal AI Hub · Local Gateway · Multi-device

你的个人 AI 中枢,统一接入智能路由

本地网关透明代理所有 AI 请求,纳管常见 Agent 并追溯 Trace个人页统一管理订阅与按量多维度统计分析——就像 iOS 电量统计,所有 AI 应用自然纳入。

Agent 纳管 · Trace 订阅 / 按量管理 多维统计分析
请求链路
应用
Cursor
应用
Claude Desktop
应用
任意 AI 应用
OpenAI / Anthropic / ...
本地网关
Token Bank
格式桥接 Token 优化
智能路由
服务商
免费 free
服务商
P2P 共享 p2p
服务商
付费 paid
v0.4 · 三大能力

纳管 Agent、管理订阅、看懂每一分钱

不只是转发请求——Token Bank 把常见 AI Agent 纳入统一 Trace,在个人页维护订阅与按量账户,再在盘点页从多个维度拆解用量与费用。

01 / Agent
🧭

常见 Agent 纳管 · Trace

在网关登记 Cursor、Claude Code、Codex CLI、Cherry Studio 等应用。走网关的请求实时记录;直连官方的会话可补录导入——同一套应用维度统计。

网关实时 会话补录 按应用聚合
02 / 订阅
📋

个人订阅管理

APP 订阅(仅统计或可转 API)、API 订阅(如火山引擎)、按量付费(模型 + 刊例价)分栏维护。供给源页接入 Key,个人页决定计费口径与按量可用模型。

APP / API 按量刊例价 OAuth / Key
03 / 分析
📊

多维度统计分析

盘点页按应用、供给源、模型、路由层(免费/P2P/付费)、费用、设备与时间范围切片。订阅折算与按量估算同屏展示,一眼看清钱花在哪。

应用占比 模型排行 费用估算
应用 / Agent
Cursor · Claude Code · Codex
供给源 / 路由层
free · p2p · paid
模型
calls · tokens · cost
订阅 + 按量
amortized · list price
本地网关

多格式接入,无感代理

本地网关同时兼容主流 AI 接口格式,AI 应用无需任何改造,只需把 Base URL 指向 127.0.0.1:11430,请求自动流入并被路由到最优 Provider。

OpenAI 格式
/v1/chat/completions
Anthropic 格式
/v1/messages
本地模型 · Ollama
localhost:11434
更多格式
持续接入中…
01 / 代理

密钥不离本机

上游 API Key 仅保存在本机,不经过任何云端服务器。网关直连上游,全程本地处理。

02 / 路由

智能 Provider 路由

按模型、成本策略自动选择最优 Provider。免费额度用尽时,平滑切换 P2P 或付费 Provider。

03 / 管理

可视化管理

图形界面配置 Provider、查看路由日志、实时调试模型接口,告别手动 curl。

Token 优化

路由里内置降本策略

网关不只是转发,它在路由层内置 Token 优化策略,主动减少不必要的开销。

⚖️

任务分级路由

按场景规则自动把简单请求分流到低成本模型,复杂任务路由至高性能模型,效果与成本双优。

🔄

Provider 优先级

配置免费 → P2P → 付费的优先梯队,有更低成本的 Provider 可用时自动优先,付费调用降至最少。

🗝️

多 Key 轮询

同一 Provider 绑定多个 API Key,自动轮询使用,均摊速率限制,避免单 Key 触发限流。

📊

用量感知调度

实时感知各 Provider 当日用量,接近限额时自动切换,保持服务连续性。

用量统计

所有 AI 消耗
一屏看清

类比 iOS 电量统计——从应用、供给源、模型、费用、设备多个维度拆解。走网关的、会话补录的、Claude Code 的、Codex 的,全部汇聚到同一个盘点页。

💻
MacBook
设备 1
🖥
台式机
设备 2
Token Bank
统一归集
6
应用·源·模型·层·费·设备
2
网关实时 + 会话补录
1
订阅折算 + 按量估算
AI 用量 · 本月 2026-06
Claude Code
session-import · claude-cli
34%
Cursor
via gateway · gpt-4o
22%
Claude Desktop
via gateway · claude-3-5
18%
Cherry Studio
via gateway · deepseek-v3
14%
Codex CLI
session-import · codex-cli
12%
Provider 层级

三层 Provider,自动择优

路由按成本优先级自动选择,能用免费的绝不走付费,P2P 共享也能进一步降低成本。

01
免费 Provider free
公益节点、开源推理服务、厂商免费额度。成本最低,优先路由。
Ollama 本地 公益 API 厂商免费层
02
P2P 共享 Provider p2p
社区成员贡献闲置算力,消费者用积分兑换调用额度,往往比官方更实惠。
积分体系 闲置算力共享 多节点负载均衡
03
付费 Provider paid
OpenAI、Anthropic、国内厂商等官方 API,免费和 P2P 资源耗尽时兜底。
OpenAI Anthropic 国内大模型
P2P 共享 · 本项目特色

闲置算力变积分,跨模型自由流通

P2P 共享网络是本项目独有的特色——社区成员互相贡献闲置额度,积分在模型之间、时段之间自由兑换,让你的 AI 算力不再浪费,也让高级模型唾手可得。

跨模型兑换

贡献你有的模型额度,赚积分,消费你没有的模型。国内模型换境外高级模型,开源额度换 Claude / GPT-4o。

贡献 DeepSeek → 积分 → Claude Sonnet
Ollama 本地模型 → 积分 → GPT-4o

跨时段储值

现在闲置的额度变成积分存起来,以后随时取用。电脑开着没人用、API 套餐月底剩余,都能转化成未来的算力储备。

白天挂机贡献 → 晚上关机后继续调用
月底剩余额度 → 下月按需取用
🤝

透明互助网络

规则公开、代码开源、多方博弈。贡献率 > 消费率,激励持续在线;质量越高倍率越高,节点越稳赚越多。

密钥不离本机,上游 Key 不上云
Ctrl+C 即下线,无需解绑
贡献赚积分
积分 = (output_tokens / 1K) × 模型贡献率 × 质量系数 (0.5–1.5×)
在线时长
0.5–1.3×
首 Token 延迟
0.6–1.5×
请求成功率
0.5–1.2×
调用花积分
花费 = (total_tokens / 1K) × 模型消费率
贡献率 > 消费率——多贡献多获益,剩余积分可随时消费高级模型调用。汇率公开,规则透明。
下载

下载 Token Bank

图形界面桌面客户端,一键启动本地网关,管理 Provider 与积分账户。支持 macOS 和 Windows。

🍎
Token Bank for Mac
Apple Silicon & Intel · .dmg · 自动更新
加载中…
🪟
Token Bank for Windows
x86_64 · .exe · 自动更新
加载中…
🐳
Token Bank for Docker
命令行 / 服务器无界面部署
查看镜像
Docker 快速启动
docker run -d \
  -p 11430:11430 -p 11431:11431 \
  -v ./data:/data/.llm-agent \
  ghcr.io/wink-run/local-llm-proxy/gateway:latest
# LLM 入口: http://localhost:11430/v1
# Web UI:  http://localhost:11431
快速接入

快速上手

接入使用

客户端安装后自动启动本地网关,把 AI 应用的 Base URL 改为以下地址即可。

OpenAI 兼容应用

Cursor、Copilot、Cherry Studio、Open WebUI 等:

OPENAI_BASE_URL=http://127.0.0.1:11430/v1
OPENAI_API_KEY=你的 Token Bank Key
Anthropic 格式应用

Claude Desktop、Claude Code 等:

ANTHROPIC_BASE_URL=http://127.0.0.1:11430
# API Key 填写 Token Bank Key
加入 P2P 贡献

把闲置 API 额度贡献给社区,赚积分换其他模型:

桌面端贡献 · 最简单

已安装客户端后,三步开启贡献:

# ① 打开 Token Bank → 设置 → P2P 共享
# ② 添加 API Key(OpenAI / Claude / 国内模型均可)
# ③ 开启贡献开关,即刻开始赚积分

密钥仅在本机运行,Ctrl+C 即下线
每 1K token 贡献 → 积分 × 质量倍率(0.8×–1.5×)
积分可兑换任意模型额度
Docker 贡献 · 无界面 / 服务器

在服务器或无界面机器上运行,Web UI 配置 P2P:

docker run -d \
  -p 11430:11430 -p 11431:11431 \
  -v ./data:/data/.llm-agent \
  ghcr.io/wink-run/local-llm-proxy/gateway:latest

# 访问 http://<host>:11431 → 设置 → P2P 共享
# 添加 API Key,开启贡献开关
适合 24h 在线服务器,持续贡献积分更高
私有化部署

运营者在 VPS 上搭建独立后台,管理用户体系、Provider 接入与积分账本:

搭建运营服务后台

完整 FastAPI 后端:用户管理、P2P 协调、Provider 账本:

git clone github.com/wink-run/local-llm-proxy
cd server
cp .env.example .env
# 填写 ADMIN_KEY、SECRET_KEY、数据库连接等
docker compose up -d --build
# 管理后台:https://<your-vps>/admin/ui

本项目仅供学习与研究使用。部署、共享 token 或转发请求须自行遵守法律法规及上游服务条款;由此产生的任何后果由使用者自行承担。