常见 Agent 纳管 · Trace
在网关登记 Cursor、Claude Code、Codex CLI、Cherry Studio 等应用。走网关的请求实时记录;直连官方的会话可补录导入——同一套应用维度统计。
Personal AI Hub · Local Gateway · Multi-device
本地网关透明代理所有 AI 请求,纳管常见 Agent 并追溯 Trace,个人页统一管理订阅与按量,多维度统计分析——就像 iOS 电量统计,所有 AI 应用自然纳入。
不只是转发请求——Token Bank 把常见 AI Agent 纳入统一 Trace,在个人页维护订阅与按量账户,再在盘点页从多个维度拆解用量与费用。
在网关登记 Cursor、Claude Code、Codex CLI、Cherry Studio 等应用。走网关的请求实时记录;直连官方的会话可补录导入——同一套应用维度统计。
APP 订阅(仅统计或可转 API)、API 订阅(如火山引擎)、按量付费(模型 + 刊例价)分栏维护。供给源页接入 Key,个人页决定计费口径与按量可用模型。
盘点页按应用、供给源、模型、路由层(免费/P2P/付费)、费用、设备与时间范围切片。订阅折算与按量估算同屏展示,一眼看清钱花在哪。
本地网关同时兼容主流 AI 接口格式,AI 应用无需任何改造,只需把 Base URL 指向 127.0.0.1:11430,请求自动流入并被路由到最优 Provider。
上游 API Key 仅保存在本机,不经过任何云端服务器。网关直连上游,全程本地处理。
按模型、成本策略自动选择最优 Provider。免费额度用尽时,平滑切换 P2P 或付费 Provider。
图形界面配置 Provider、查看路由日志、实时调试模型接口,告别手动 curl。
网关不只是转发,它在路由层内置 Token 优化策略,主动减少不必要的开销。
按场景规则自动把简单请求分流到低成本模型,复杂任务路由至高性能模型,效果与成本双优。
配置免费 → P2P → 付费的优先梯队,有更低成本的 Provider 可用时自动优先,付费调用降至最少。
同一 Provider 绑定多个 API Key,自动轮询使用,均摊速率限制,避免单 Key 触发限流。
实时感知各 Provider 当日用量,接近限额时自动切换,保持服务连续性。
类比 iOS 电量统计——从应用、供给源、模型、费用、设备多个维度拆解。走网关的、会话补录的、Claude Code 的、Codex 的,全部汇聚到同一个盘点页。
路由按成本优先级自动选择,能用免费的绝不走付费,P2P 共享也能进一步降低成本。
P2P 共享网络是本项目独有的特色——社区成员互相贡献闲置额度,积分在模型之间、时段之间自由兑换,让你的 AI 算力不再浪费,也让高级模型唾手可得。
贡献你有的模型额度,赚积分,消费你没有的模型。国内模型换境外高级模型,开源额度换 Claude / GPT-4o。
现在闲置的额度变成积分存起来,以后随时取用。电脑开着没人用、API 套餐月底剩余,都能转化成未来的算力储备。
规则公开、代码开源、多方博弈。贡献率 > 消费率,激励持续在线;质量越高倍率越高,节点越稳赚越多。
图形界面桌面客户端,一键启动本地网关,管理 Provider 与积分账户。支持 macOS 和 Windows。
docker run -d \ -p 11430:11430 -p 11431:11431 \ -v ./data:/data/.llm-agent \ ghcr.io/wink-run/local-llm-proxy/gateway:latest # LLM 入口: http://localhost:11430/v1 # Web UI: http://localhost:11431
客户端安装后自动启动本地网关,把 AI 应用的 Base URL 改为以下地址即可。
Cursor、Copilot、Cherry Studio、Open WebUI 等:
OPENAI_BASE_URL=http://127.0.0.1:11430/v1 OPENAI_API_KEY=你的 Token Bank Key
Claude Desktop、Claude Code 等:
ANTHROPIC_BASE_URL=http://127.0.0.1:11430 # API Key 填写 Token Bank Key
把闲置 API 额度贡献给社区,赚积分换其他模型:
已安装客户端后,三步开启贡献:
# ① 打开 Token Bank → 设置 → P2P 共享 # ② 添加 API Key(OpenAI / Claude / 国内模型均可) # ③ 开启贡献开关,即刻开始赚积分 密钥仅在本机运行,Ctrl+C 即下线
在服务器或无界面机器上运行,Web UI 配置 P2P:
docker run -d \ -p 11430:11430 -p 11431:11431 \ -v ./data:/data/.llm-agent \ ghcr.io/wink-run/local-llm-proxy/gateway:latest # 访问 http://<host>:11431 → 设置 → P2P 共享 # 添加 API Key,开启贡献开关
运营者在 VPS 上搭建独立后台,管理用户体系、Provider 接入与积分账本:
完整 FastAPI 后端:用户管理、P2P 协调、Provider 账本:
git clone github.com/wink-run/local-llm-proxy cd server cp .env.example .env # 填写 ADMIN_KEY、SECRET_KEY、数据库连接等 docker compose up -d --build # 管理后台:https://<your-vps>/admin/ui
本项目仅供学习与研究使用。部署、共享 token 或转发请求须自行遵守法律法规及上游服务条款;由此产生的任何后果由使用者自行承担。