Personal AI Hub · Local Gateway · Multi-device

你的个人 AI 中枢，统一接入智能路由

本地网关透明代理所有 AI 请求，纳管常见 Agent 并追溯 Trace，个人页统一管理订阅与按量，多维度统计分析——就像 iOS 电量统计，所有 AI 应用自然纳入。

Agent 纳管 · Trace 订阅 / 按量管理多维统计分析

请求链路

应用

Cursor

应用

Claude Desktop

应用

任意 AI 应用

OpenAI / Anthropic / ...

本地网关

Token Bank

格式桥接 Token 优化

智能路由

服务商

免费 free

服务商

P2P 共享 p2p

服务商

付费 paid

v0.4 · 三大能力

纳管 Agent、管理订阅、看懂每一分钱

不只是转发请求——Token Bank 把常见 AI Agent 纳入统一 Trace，在个人页维护订阅与按量账户，再在盘点页从多个维度拆解用量与费用。

01 / Agent

🧭

常见 Agent 纳管 · Trace

在网关登记 Cursor、Claude Code、Codex CLI、Cherry Studio 等应用。走网关的请求实时记录；直连官方的会话可补录导入——同一套应用维度统计。

网关实时会话补录按应用聚合

02 / 订阅

📋

个人订阅管理

APP 订阅（仅统计或可转 API）、API 订阅（如火山引擎）、按量付费（模型 + 刊例价）分栏维护。供给源页接入 Key，个人页决定计费口径与按量可用模型。

APP / API 按量刊例价 OAuth / Key

03 / 分析

📊

多维度统计分析

盘点页按应用、供给源、模型、路由层（免费/P2P/付费）、费用、设备与时间范围切片。订阅折算与按量估算同屏展示，一眼看清钱花在哪。

应用占比模型排行费用估算

应用 / Agent

Cursor · Claude Code · Codex

供给源 / 路由层

free · p2p · paid

模型

calls · tokens · cost

订阅 + 按量

amortized · list price

本地网关

多格式接入，无感代理

本地网关同时兼容主流 AI 接口格式，AI 应用无需任何改造，只需把 Base URL 指向 127.0.0.1:11430，请求自动流入并被路由到最优 Provider。

OpenAI 格式

/v1/chat/completions

Anthropic 格式

/v1/messages

本地模型 · Ollama

localhost:11434

更多格式

持续接入中…

01 / 代理

密钥不离本机

上游 API Key 仅保存在本机，不经过任何云端服务器。网关直连上游，全程本地处理。

02 / 路由

智能 Provider 路由

按模型、成本策略自动选择最优 Provider。免费额度用尽时，平滑切换 P2P 或付费 Provider。

03 / 管理

可视化管理

图形界面配置 Provider、查看路由日志、实时调试模型接口，告别手动 curl。

Token 优化

路由里内置降本策略

网关不只是转发，它在路由层内置 Token 优化策略，主动减少不必要的开销。

⚖️

任务分级路由

按场景规则自动把简单请求分流到低成本模型，复杂任务路由至高性能模型，效果与成本双优。

🔄

Provider 优先级

配置免费 → P2P → 付费的优先梯队，有更低成本的 Provider 可用时自动优先，付费调用降至最少。

🗝️

多 Key 轮询

同一 Provider 绑定多个 API Key，自动轮询使用，均摊速率限制，避免单 Key 触发限流。

📊

用量感知调度

实时感知各 Provider 当日用量，接近限额时自动切换，保持服务连续性。

用量统计

所有 AI 消耗
一屏看清

类比 iOS 电量统计——从应用、供给源、模型、费用、设备多个维度拆解。走网关的、会话补录的、Claude Code 的、Codex 的，全部汇聚到同一个盘点页。

💻

MacBook

设备 1

→

🖥

台式机

设备 2

→

Token Bank

统一归集

6维

应用·源·模型·层·费·设备

2源

网关实时 + 会话补录

1屏

订阅折算 + 按量估算

AI 用量 · 本月 2026-06

Claude Code

session-import · claude-cli

34%

Cursor

via gateway · gpt-4o

22%

Claude Desktop

via gateway · claude-3-5

18%

Cherry Studio

via gateway · deepseek-v3

14%

Codex CLI

session-import · codex-cli

12%

Provider 层级

三层 Provider，自动择优

路由按成本优先级自动选择，能用免费的绝不走付费，P2P 共享也能进一步降低成本。

免费 Provider free

公益节点、开源推理服务、厂商免费额度。成本最低，优先路由。

Ollama 本地公益 API 厂商免费层

P2P 共享 Provider p2p

社区成员贡献闲置算力，消费者用积分兑换调用额度，往往比官方更实惠。

积分体系闲置算力共享多节点负载均衡

付费 Provider paid

OpenAI、Anthropic、国内厂商等官方 API，免费和 P2P 资源耗尽时兜底。

OpenAI Anthropic 国内大模型

P2P 共享 · 本项目特色

闲置算力变积分，跨模型自由流通

P2P 共享网络是本项目独有的特色——社区成员互相贡献闲置额度，积分在模型之间、时段之间自由兑换，让你的 AI 算力不再浪费，也让高级模型唾手可得。

⇄

跨模型兑换

贡献你有的模型额度，赚积分，消费你没有的模型。国内模型换境外高级模型，开源额度换 Claude / GPT-4o。

贡献 DeepSeek → 积分 → Claude Sonnet

Ollama 本地模型 → 积分 → GPT-4o

◷

跨时段储值

现在闲置的额度变成积分存起来，以后随时取用。电脑开着没人用、API 套餐月底剩余，都能转化成未来的算力储备。

白天挂机贡献 → 晚上关机后继续调用

月底剩余额度 → 下月按需取用

🤝

透明互助网络

规则公开、代码开源、多方博弈。贡献率 > 消费率，激励持续在线；质量越高倍率越高，节点越稳赚越多。

密钥不离本机，上游 Key 不上云

Ctrl+C 即下线，无需解绑

贡献赚积分

积分 = (output_tokens / 1K) × 模型贡献率 × 质量系数 (0.5–1.5×)

在线时长

0.5–1.3×

首 Token 延迟

0.6–1.5×

请求成功率

0.5–1.2×

调用花积分

花费 = (total_tokens / 1K) × 模型消费率

贡献率 > 消费率——多贡献多获益，剩余积分可随时消费高级模型调用。汇率公开，规则透明。

查看当前积分汇率 →

下载

下载 Token Bank

图形界面桌面客户端，一键启动本地网关，管理 Provider 与积分账户。支持 macOS 和 Windows。

🍎

Token Bank for Mac

Apple Silicon & Intel · .dmg · 自动更新

加载中…

🪟

Token Bank for Windows

x86_64 · .exe · 自动更新

加载中…

🐳

Token Bank for Docker

命令行 / 服务器无界面部署

查看镜像

Docker 快速启动

docker run -d \
  -p 11430:11430 -p 11431:11431 \
  -v ./data:/data/.llm-agent \
  ghcr.io/wink-run/local-llm-proxy/gateway:latest
# LLM 入口: http://localhost:11430/v1
# Web UI:  http://localhost:11431

快速接入

快速上手

接入使用

客户端安装后自动启动本地网关，把 AI 应用的 Base URL 改为以下地址即可。

OpenAI 兼容应用

Cursor、Copilot、Cherry Studio、Open WebUI 等：

OPENAI_BASE_URL=http://127.0.0.1:11430/v1
OPENAI_API_KEY=你的 Token Bank Key

Anthropic 格式应用

Claude Desktop、Claude Code 等：

ANTHROPIC_BASE_URL=http://127.0.0.1:11430
# API Key 填写 Token Bank Key

加入 P2P 贡献

把闲置 API 额度贡献给社区，赚积分换其他模型：

桌面端贡献 · 最简单

已安装客户端后，三步开启贡献：

# ① 打开 Token Bank → 设置 → P2P 共享
# ② 添加 API Key（OpenAI / Claude / 国内模型均可）
# ③ 开启贡献开关，即刻开始赚积分

密钥仅在本机运行，Ctrl+C 即下线

每 1K token 贡献 → 积分 × 质量倍率（0.8×–1.5×）
积分可兑换任意模型额度

Docker 贡献 · 无界面 / 服务器

在服务器或无界面机器上运行，Web UI 配置 P2P：

docker run -d \
  -p 11430:11430 -p 11431:11431 \
  -v ./data:/data/.llm-agent \
  ghcr.io/wink-run/local-llm-proxy/gateway:latest

# 访问 http://<host>:11431 → 设置 → P2P 共享
# 添加 API Key，开启贡献开关

适合 24h 在线服务器，持续贡献积分更高

私有化部署

运营者在 VPS 上搭建独立后台，管理用户体系、Provider 接入与积分账本：

搭建运营服务后台

完整 FastAPI 后端：用户管理、P2P 协调、Provider 账本：

git clone github.com/wink-run/local-llm-proxy
cd server
cp .env.example .env
# 填写 ADMIN_KEY、SECRET_KEY、数据库连接等
docker compose up -d --build
# 管理后台：https://<your-vps>/admin/ui

本项目仅供学习与研究使用。部署、共享 token 或转发请求须自行遵守法律法规及上游服务条款；由此产生的任何后果由使用者自行承担。