diff --git a/gpt-load/README.md b/gpt-load/README.md new file mode 100644 index 000000000..049996a22 --- /dev/null +++ b/gpt-load/README.md @@ -0,0 +1,461 @@ +# GPT-Load + +中文文档 | [English](README_EN.md) + +[![Release](https://img.shields.io/github/v/release/tbphp/gpt-load)](https://github.com/tbphp/gpt-load/releases) +![Go Version](https://img.shields.io/badge/Go-1.23+-blue.svg) +![License](https://img.shields.io/badge/license-MIT-green.svg) + +一个高性能、企业级的 AI 接口透明代理服务,专门为需要集成多种 AI 服务的企业和开发者设计。采用 Go 语言开发,具备智能密钥管理、负载均衡和完善的监控功能,专为高并发生产环境而设计。 + +详细请查看[官方文档](https://www.gpt-load.com/docs) + +Featured|HelloGitHub + +## 功能特性 + +- **透明代理**: 完全保留原生 API 格式,支持 OpenAI、Google Gemini 和 Anthropic Claude 等多种格式 +- **智能密钥管理**: 高性能密钥池,支持分组管理、自动轮换和故障恢复 +- **负载均衡**: 支持多上游端点的加权负载均衡,提升服务可用性 +- **智能故障处理**: 自动密钥黑名单管理和恢复机制,确保服务连续性 +- **动态配置**: 系统设置和分组配置支持热重载,无需重启即可生效 +- **企业级架构**: 分布式主从部署,支持水平扩展和高可用 +- **现代化管理**: 基于 Vue 3 的 Web 管理界面,直观易用 +- **全面监控**: 实时统计、健康检查、详细请求日志 +- **高性能设计**: 零拷贝流式传输、连接池复用、原子操作 +- **生产就绪**: 优雅关闭、错误恢复、完善的安全机制 +- **双重认证体系**: 管理端与代理端认证分离,代理认证支持全局和分组级别密钥 + +## 支持的 AI 服务 + +GPT-Load 作为透明代理服务,完整保留各 AI 服务商的原生 API 格式: + +- **OpenAI 格式**: 官方 OpenAI API、Azure OpenAI、以及其他 OpenAI 兼容服务 +- **Google Gemini 格式**: Gemini Pro、Gemini Pro Vision 等模型的原生 API +- **Anthropic Claude 格式**: Claude 系列模型,支持高质量的对话和文本生成 + +## 快速开始 + +### 环境要求 + +- Go 1.23+ (源码构建) +- Docker (容器化部署) +- MySQL, PostgreSQL, 或 SQLite (数据库存储) +- Redis (缓存和分布式协调,可选) + +### 方式一:Docker 快速开始 + +```bash +docker run -d --name gpt-load \ + -p 3001:3001 \ + -e AUTH_KEY=sk-123456 \ + -v "$(pwd)/data":/app/data \ + ghcr.io/tbphp/gpt-load:latest +``` + +> 使用 `sk-123456` 登录管理界面: + +### 方式二:使用 Docker Compose(推荐) + +**安装命令:** + +```bash +# 创建目录 +mkdir -p gpt-load && cd gpt-load + +# 下载配置文件 +wget https://raw.githubusercontent.com/tbphp/gpt-load/refs/heads/main/docker-compose.yml +wget -O .env https://raw.githubusercontent.com/tbphp/gpt-load/refs/heads/main/.env.example + +# 启动服务 +docker compose up -d +``` + +默认安装的是 SQLite 版本,适合轻量单机应用。 + +如需安装 MySQL, PostgreSQL 及 Redis,请在 `docker-compose.yml` 文件中取消所需服务的注释,并配置好对应的环境配置重启即可。 + +**其他命令:** + +```bash +# 查看服务状态 +docker compose ps + +# 查看日志 +docker compose logs -f + +# 重启服务 +docker compose down && docker compose up -d + +# 更新到最新版本 +docker compose pull && docker compose down && docker compose up -d +``` + +部署完成后: + +- 访问 Web 管理界面: +- API 代理地址: + +> 使用默认的认证 Key `sk-123456` 登录管理端,认证 Key 可以在 .env 中修改 AUTH_KEY。 + +### 方式三:源码构建 + +源码构建需要本地已安装数据库(SQLite、MySQL 或 PostgreSQL)和 Redis(可选)。 + +```bash +# 克隆并构建 +git clone https://github.com/tbphp/gpt-load.git +cd gpt-load +go mod tidy + +# 创建配置 +cp .env.example .env + +# 修改 .env 中 DATABASE_DSN 和 REDIS_DSN 配置 +# REDIS_DSN 为可选,如果不配置则启用内存存储 + +# 运行 +make run +``` + +部署完成后: + +- 访问 Web 管理界面: +- API 代理地址: + +> 使用默认的认证 Key `sk-123456` 登录管理端,认证 Key 可以在 .env 中修改 AUTH_KEY。 + +### 方式四:集群部署 + +集群部署需要所有节点都连接同一个 MySQL(或者 PostgreSQL) 和 Redis,并且 Redis 是必须要求。建议使用统一的分布式 MySQL 和 Redis 集群。 + +**部署要求:** + +- 所有节点必须配置相同的 `AUTH_KEY`、`DATABASE_DSN`、`REDIS_DSN` +- 一主多从架构,从节点必须配置环境变量:`IS_SLAVE=true` + +详细请参考[集群部署文档](https://www.gpt-load.com/docs/cluster) + +## 配置系统 + +### 配置架构概述 + +GPT-Load 采用双层配置架构: + +#### 1. 静态配置(环境变量) + +- **特点**:应用启动时读取,运行期间不可修改,需重启应用生效 +- **用途**:基础设施配置,如数据库连接、服务器端口、认证密钥等 +- **管理方式**:通过 `.env` 文件或系统环境变量设置 + +#### 2. 动态配置(热重载) + +- **系统设置**:存储在数据库中,为整个应用提供统一的行为基准 +- **分组配置**:为特定分组定制的行为参数,可覆盖系统设置 +- **配置优先级**:分组配置 > 系统设置 +- **特点**:支持热重载,修改后立即生效,无需重启应用 + +
+静态配置(环境变量) + +**服务器配置:** + +| 配置项 | 环境变量 | 默认值 | 说明 | +| ------------ | ---------------------------------- | --------------- | -------------------------- | +| 服务端口 | `PORT` | 3001 | HTTP 服务器监听端口 | +| 服务地址 | `HOST` | 0.0.0.0 | HTTP 服务器绑定地址 | +| 读取超时 | `SERVER_READ_TIMEOUT` | 60 | HTTP 服务器读取超时(秒) | +| 写入超时 | `SERVER_WRITE_TIMEOUT` | 600 | HTTP 服务器写入超时(秒) | +| 空闲超时 | `SERVER_IDLE_TIMEOUT` | 120 | HTTP 连接空闲超时(秒) | +| 优雅关闭超时 | `SERVER_GRACEFUL_SHUTDOWN_TIMEOUT` | 10 | 服务优雅关闭等待时间(秒) | +| 从节点模式 | `IS_SLAVE` | false | 集群部署时从节点标识 | +| 时区 | `TZ` | `Asia/Shanghai` | 指定时区 | + +**认证与数据库配置:** + +| 配置项 | 环境变量 | 默认值 | 说明 | +| ---------- | -------------- | ------------------ | ------------------------------------ | +| 管理密钥 | `AUTH_KEY` | `sk-123456` | **管理端**的访问认证密钥 | +| 数据库连接 | `DATABASE_DSN` | ./data/gpt-load.db | 数据库连接字符串 (DSN) 或文件路径 | +| Redis 连接 | `REDIS_DSN` | - | Redis 连接字符串,为空时使用内存存储 | + +**性能与跨域配置:** + +| 配置项 | 环境变量 | 默认值 | 说明 | +| ------------ | ------------------------- | ----------------------------- | ------------------------ | +| 最大并发请求 | `MAX_CONCURRENT_REQUESTS` | 100 | 系统允许的最大并发请求数 | +| 启用 CORS | `ENABLE_CORS` | true | 是否启用跨域资源共享 | +| 允许的来源 | `ALLOWED_ORIGINS` | `*` | 允许的来源,逗号分隔 | +| 允许的方法 | `ALLOWED_METHODS` | `GET,POST,PUT,DELETE,OPTIONS` | 允许的 HTTP 方法 | +| 允许的头部 | `ALLOWED_HEADERS` | `*` | 允许的请求头,逗号分隔 | +| 允许凭据 | `ALLOW_CREDENTIALS` | false | 是否允许发送凭据 | + +**日志配置:** + +| 配置项 | 环境变量 | 默认值 | 说明 | +| ------------ | ----------------- | --------------------- | ---------------------------------- | +| 日志级别 | `LOG_LEVEL` | `info` | 日志级别:debug, info, warn, error | +| 日志格式 | `LOG_FORMAT` | `text` | 日志格式:text, json | +| 启用文件日志 | `LOG_ENABLE_FILE` | false | 是否启用文件日志输出 | +| 日志文件路径 | `LOG_FILE_PATH` | `./data/logs/app.log` | 日志文件存储路径 | + +**代理配置:** + +GPT-Load 会自动从环境变量中读取代理设置,用于向上游 AI 服务商发起请求。 + +| 配置项 | 环境变量 | 默认值 | 说明 | +| ---------- | ------------- | ------ | ---------------------------------------- | +| HTTP 代理 | `HTTP_PROXY` | - | 用于 HTTP 请求的代理服务器地址 | +| HTTPS 代理 | `HTTPS_PROXY` | - | 用于 HTTPS 请求的代理服务器地址 | +| 无代理 | `NO_PROXY` | - | 不需要通过代理访问的主机或域名,逗号分隔 | + +支持的代理协议格式: + +- **HTTP**: `http://user:pass@host:port` +- **HTTPS**: `https://user:pass@host:port` +- **SOCKS5**: `socks5://user:pass@host:port` +
+ +
+动态配置(热重载) + +**基础设置:** + +| 配置项 | 字段名 | 默认值 | 分组可覆盖 | 说明 | +| ------------ | ------------------------------------ | --------------------------- | ---------- | -------------------------------------- | +| 项目地址 | `app_url` | `http://localhost:3001` | ❌ | 项目基础 URL | +| 日志保留天数 | `request_log_retention_days` | 7 | ❌ | 请求日志保留天数,0 为不清理 | +| 日志写入间隔 | `request_log_write_interval_minutes` | 1 | ❌ | 日志写入数据库周期(分钟) | +| 全局代理密钥 | `proxy_keys` | 初始值为环境配置的 AUTH_KEY | ❌ | 全局生效的代理认证密钥,多个用逗号分隔 | + +**请求设置:** + +| 配置项 | 字段名 | 默认值 | 分组可覆盖 | 说明 | +| -------------------- | ------------------------- | ------ | ---------- | ------------------------------ | +| 请求超时 | `request_timeout` | 600 | ✅ | 转发请求完整生命周期超时(秒) | +| 连接超时 | `connect_timeout` | 15 | ✅ | 与上游服务建立连接超时(秒) | +| 空闲连接超时 | `idle_conn_timeout` | 120 | ✅ | HTTP 客户端空闲连接超时(秒) | +| 响应头超时 | `response_header_timeout` | 600 | ✅ | 等待上游响应头超时(秒) | +| 最大空闲连接数 | `max_idle_conns` | 100 | ✅ | 连接池最大空闲连接总数 | +| 每主机最大空闲连接数 | `max_idle_conns_per_host` | 50 | ✅ | 每个上游主机最大空闲连接数 | + +**密钥配置:** + +| 配置项 | 字段名 | 默认值 | 分组可覆盖 | 说明 | +| -------------- | --------------------------------- | ------ | ---------- | ------------------------------------------------ | +| 最大重试次数 | `max_retries` | 3 | ✅ | 单个请求使用不同密钥的最大重试次数 | +| 黑名单阈值 | `blacklist_threshold` | 3 | ✅ | 密钥连续失败多少次后进入黑名单 | +| 密钥验证间隔 | `key_validation_interval_minutes` | 60 | ✅ | 后台定时验证密钥周期(分钟) | +| 密钥验证并发数 | `key_validation_concurrency` | 10 | ✅ | 后台定时验证无效 Key 时的并发数 | +| 密钥验证超时 | `key_validation_timeout_seconds` | 20 | ✅ | 后台定时验证单个 Key 时的 API 请求超时时间(秒) | + +
+ +## Web 管理界面 + +访问管理控制台:(默认地址) + +### 界面展示 + +仪表盘 + +
+ +密钥管理 + +
+ +Web 管理界面提供以下功能: + +- **仪表盘**: 实时统计信息和系统状态概览 +- **密钥管理**: 创建和配置 AI 服务商分组,添加、删除和监控 API 密钥 +- **请求日志**: 详细的请求历史记录和调试信息 +- **系统设置**: 全局配置管理和热重载 + +## API 使用说明 + +
+代理接口调用方式 + +GPT-Load 通过分组名称路由请求到不同的 AI 服务。使用方式如下: + +#### 1. 代理端点格式 + +```text +http://localhost:3001/proxy/{group_name}/{原始API路径} +``` + +- `{group_name}`: 在管理界面创建的分组名称 +- `{原始API路径}`: 保持与原始 AI 服务完全一致的路径 + +#### 2. 认证方式 + +在 Web 管理界面中配置**代理密钥** (`Proxy Keys`),可设置系统级别和分组级别的代理密钥。 + +- **认证方式**: 与原生 API 一致,但需将原始密钥替换为配置的代理密钥。 +- **密钥作用域**: 在系统设置配置的 **全局代理密钥** 可以在所有分组使用,在分组配置的 **分组代理密钥** 仅在当前分组有效。 +- **格式**: 多个密钥使用半角英文逗号分隔。 + +#### 3. OpenAI 接口调用示例 + +假设创建了名为 `openai` 的分组: + +**原始调用方式:** + +```bash +curl -X POST https://api.openai.com/v1/chat/completions \ + -H "Authorization: Bearer sk-your-openai-key" \ + -H "Content-Type: application/json" \ + -d '{"model": "gpt-4.1-mini", "messages": [{"role": "user", "content": "Hello"}]}' +``` + +**代理调用方式:** + +```bash +curl -X POST http://localhost:3001/proxy/openai/v1/chat/completions \ + -H "Authorization: Bearer your-proxy-key" \ + -H "Content-Type: application/json" \ + -d '{"model": "gpt-4.1-mini", "messages": [{"role": "user", "content": "Hello"}]}' +``` + +**变更说明:** + +- 将 `https://api.openai.com` 替换为 `http://localhost:3001/proxy/openai` +- 将原始 API Key 替换为**代理密钥** + +#### 4. Gemini 接口调用示例 + +假设创建了名为 `gemini` 的分组: + +**原始调用方式:** + +```bash +curl -X POST https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-pro:generateContent?key=your-gemini-key \ + -H "Content-Type: application/json" \ + -d '{"contents": [{"parts": [{"text": "Hello"}]}]}' +``` + +**代理调用方式:** + +```bash +curl -X POST http://localhost:3001/proxy/gemini/v1beta/models/gemini-2.5-pro:generateContent?key=your-proxy-key \ + -H "Content-Type: application/json" \ + -d '{"contents": [{"parts": [{"text": "Hello"}]}]}' +``` + +**变更说明:** + +- 将 `https://generativelanguage.googleapis.com` 替换为 `http://localhost:3001/proxy/gemini` +- 将 URL 参数中的 `key=your-gemini-key` 替换为**代理密钥** + +#### 5. Anthropic 接口调用示例 + +假设创建了名为 `anthropic` 的分组: + +**原始调用方式:** + +```bash +curl -X POST https://api.anthropic.com/v1/messages \ + -H "x-api-key: sk-ant-api03-your-anthropic-key" \ + -H "anthropic-version: 2023-06-01" \ + -H "Content-Type: application/json" \ + -d '{"model": "claude-sonnet-4-20250514", "messages": [{"role": "user", "content": "Hello"}]}' +``` + +**代理调用方式:** + +```bash +curl -X POST http://localhost:3001/proxy/anthropic/v1/messages \ + -H "x-api-key: your-proxy-key" \ + -H "anthropic-version: 2023-06-01" \ + -H "Content-Type: application/json" \ + -d '{"model": "claude-sonnet-4-20250514", "messages": [{"role": "user", "content": "Hello"}]}' +``` + +**变更说明:** + +- 将 `https://api.anthropic.com` 替换为 `http://localhost:3001/proxy/anthropic` +- 将 `x-api-key` 头部中的原始 API Key 替换为**代理密钥** + +#### 6. 支持的接口 + +**OpenAI 格式:** + +- `/v1/chat/completions` - 聊天对话 +- `/v1/completions` - 文本补全 +- `/v1/embeddings` - 文本嵌入 +- `/v1/models` - 模型列表 +- 以及其他所有 OpenAI 兼容接口 + +**Gemini 格式:** + +- `/v1beta/models/*/generateContent` - 内容生成 +- `/v1beta/models` - 模型列表 +- 以及其他所有 Gemini 原生接口 + +**Anthropic 格式:** + +- `/v1/messages` - 消息对话 +- `/v1/models` - 模型列表(如果可用) +- 以及其他所有 Anthropic 原生接口 + +#### 7. 客户端 SDK 配置 + +**OpenAI Python SDK:** + +```python +from openai import OpenAI + +client = OpenAI( + api_key="your-proxy-key", # 使用密钥 + base_url="http://localhost:3001/proxy/openai" # 使用代理端点 +) + +response = client.chat.completions.create( + model="gpt-4.1-mini", + messages=[{"role": "user", "content": "Hello"}] +) +``` + +**Google Gemini SDK (Python):** + +```python +import google.generativeai as genai + +# 配置 API 密钥和基础 URL +genai.configure( + api_key="your-proxy-key", # 使用代理密钥 + client_options={"api_endpoint": "http://localhost:3001/proxy/gemini"} +) + +model = genai.GenerativeModel('gemini-2.5-pro') +response = model.generate_content("Hello") +``` + +**Anthropic SDK (Python):** + +```python +from anthropic import Anthropic + +client = Anthropic( + api_key="your-proxy-key", # 使用代理密钥 + base_url="http://localhost:3001/proxy/anthropic" # 使用代理端点 +) + +response = client.messages.create( + model="claude-sonnet-4-20250514", + messages=[{"role": "user", "content": "Hello"}] +) +``` + +> **重要提示**:作为透明代理服务,GPT-Load 完全保留各 AI 服务的原生 API 格式和认证方式,仅需要替换端点地址并使用在管理端配置的**代理密钥**即可无缝迁移。 + +
+ +## 许可证 + +MIT 许可证 - 详情请参阅 [LICENSE](LICENSE) 文件。 + +## Star History + +[![Stargazers over time](https://starchart.cc/tbphp/gpt-load.svg?variant=adaptive)](https://starchart.cc/tbphp/gpt-load) diff --git a/gpt-load/data.yml b/gpt-load/data.yml new file mode 100644 index 000000000..50b406385 --- /dev/null +++ b/gpt-load/data.yml @@ -0,0 +1,19 @@ +name: gpt-load +tags: +- AI / 大模型 +title: 智能密钥轮询的多渠道 AI 代理 +description: 智能密钥轮询的多渠道 AI 代理 +additionalProperties: + key: gpt-load + name: gpt-load + tags: + - AI + shortDescZh: 一个高性能、企业级的 AI 接口透明代理服务,专门为需要集成多种 AI 服务的企业和开发者设计。采用 Go 语言开发,具备智能密钥管理、负载均衡和完善的监控功能,专为高并发生产环境而设计。 + shortDescEn: A high-performance, enterprise-grade AI API transparent proxy service designed specifically for enterprises and developers who need to integrate multiple AI services. Built with Go, featuring intelligent key management, load balancing, 和 comprehensive monitoring capabilities, designed for high-concurrency production environments. + type: tool + crossVersionUpdate: true + limit: 0 + recommend: 0 + website: https://github.com/tbphp/gpt-load + github: https://github.com/tbphp/gpt-load + document: https://github.com/tbphp/gpt-load/blob/main/README.md diff --git a/gpt-load/logo.png b/gpt-load/logo.png new file mode 100644 index 000000000..152beced4 Binary files /dev/null and b/gpt-load/logo.png differ diff --git a/gpt-load/sqllite/.env.sample b/gpt-load/sqllite/.env.sample new file mode 100644 index 000000000..26189eedb --- /dev/null +++ b/gpt-load/sqllite/.env.sample @@ -0,0 +1,43 @@ +# 服务器配置 +PORT=3001 +HOST=0.0.0.0 + +# 服务器读取、写入和空闲连接的超时时间(秒) +SERVER_READ_TIMEOUT=60 +SERVER_WRITE_TIMEOUT=600 +SERVER_IDLE_TIMEOUT=120 +SERVER_GRACEFUL_SHUTDOWN_TIMEOUT=10 + +# 从节点标识 +IS_SLAVE=false + +# 时区 +TZ=Asia/Shanghai + +# 认证配置 是必需的,用于保护管理 API 和 UI 界面 +AUTH_KEY=sk-123456 + +# 数据库配置 默认不填写,使用./data/gpt-load.db的SQLite +# MySQL 示例: +# DATABASE_DSN=root:123456@tcp(mysql:3306)/gpt-load?charset=utf8mb4&parseTime=True&loc=Local +# PostgreSQL 示例: +# DATABASE_DSN=postgres://postgres:123456@postgres:5432/gpt-load?sslmode=disable + +# Redis配置 默认不填写,使用内存存储 +# REDIS_DSN=redis://redis:6379/0 + +# 并发数量 +MAX_CONCURRENT_REQUESTS=100 + +# CORS配置 +ENABLE_CORS=true +ALLOWED_ORIGINS=* +ALLOWED_METHODS=GET,POST,PUT,DELETE,OPTIONS +ALLOWED_HEADERS=* +ALLOW_CREDENTIALS=false + +# 日志配置 +LOG_LEVEL=info +LOG_FORMAT=text +LOG_ENABLE_FILE=true +LOG_FILE_PATH=./data/logs/app.log diff --git a/gpt-load/sqllite/data.yml b/gpt-load/sqllite/data.yml new file mode 100644 index 000000000..140b5d714 --- /dev/null +++ b/gpt-load/sqllite/data.yml @@ -0,0 +1,10 @@ +additionalProperties: + formFields: + - default: 3001 + edit: true + envKey: PANEL_APP_PORT_HTTP + labelEn: Port + labelZh: 端口 + required: true + rule: paramPort + type: number diff --git a/gpt-load/sqllite/docker-compose.yml b/gpt-load/sqllite/docker-compose.yml new file mode 100644 index 000000000..81c87273d --- /dev/null +++ b/gpt-load/sqllite/docker-compose.yml @@ -0,0 +1,18 @@ +services: + gpt-load: + image: ghcr.io/tbphp/gpt-load:latest + container_name: ${CONTAINER_NAME} + restart: always + ports: + - ${PANEL_APP_PORT_HTTP}:3001 + networks: + - 1panel-network + volumes: + - ./data:/app/data + env_file: + - .env + labels: + createdBy: "Apps" +networks: + 1panel-network: + external: true