Node.js实现Claude API本地代理与流式响应转换-代码聚汇网

Node.js实现Claude API本地代理与流式响应转换

暗暗yu

1. 项目概述：本地Node接口代理请求Claude API的实现方案

在开发AI应用时，我们经常需要对接国外的AI服务接口，但由于网络环境限制，直接访问可能会遇到连接不稳定或速度慢的问题。本文介绍的openclaw（龙虾）项目提供了一种解决方案：通过本地Node.js服务作为中间层，将请求转发到国外服务器，再由国外服务器实际调用Claude API。这种架构既保证了开发便利性，又解决了直接访问的稳定性问题。

核心思路是通过本地Node服务接收前端请求，进行身份验证和限流控制后，将请求转发到部署在国外的代理服务器，最终由代理服务器调用Claude官方API。返回结果则通过反向路径传回前端。整个过程实现了：

本地开发环境与生产环境API调用方式统一
敏感API密钥不暴露在前端
请求频率控制和用户配额管理
非流式API到流式响应的转换

2. 核心架构解析

2.1 系统组件与数据流

整个系统由以下几个关键组件构成：

前端应用：发起对话请求的客户端，可以是Web、桌面或移动应用
本地Node服务：运行在开发者本地的中间层，处理认证、限流等逻辑
国外代理服务器：部署在可稳定访问Claude API区域的服务器
Claude API：Anthropic提供的官方接口

数据流向为：

code复制前端 → 本地Node服务 → 国外代理服务器 → Claude API
响应则沿相反路径返回

2.2 配置文件解析（openclaw.json）

项目的核心配置集中在openclaw.json文件中，几个关键配置项：

json复制{
  "models": {
    "providers": {
      "anthropic": {
        "baseUrl": "http://localhost:85/api/light/chat/claudeCodeNew",
        "apiKey": "sk-xxx",
        "api": "anthropic-messages",
        "models": [
          {
            "id": "claude-sonnet-4-5",
            "name": "Claude Sonnet 4.5",
            "reasoning": true,
            "input": ["text", "image"],
            "contextWindow": 200000,
            "maxTokens": 8192
          }
        ]
      }
    }
  }
}

baseUrl：配置本地服务的接口地址
apiKey：用于验证的密钥（实际项目中应使用环境变量）
models：定义可用的模型及其能力参数

3. 核心实现细节

3.1 认证与限流机制

本地服务通过以下方式保证安全性：

javascript复制const chatClaudeCodeV1Completions = async (req, res) => {
  let token = req.headers['authorization']
  if (token) {
    token = token.replace('Bearer ', '')
    const userRedis = await redisClient.get('user')
    let userList = JSON.parse(userRedis)
    // 验证token有效性
    let resultIndex = userList.findIndex((item) => {
      let info = {}
      try {
        if (item.info) {
          info = JSON.parse(item.info)
        }
      } catch (error) {
        console.log(error)
      }
      return info.token === token
    })
    
    // 每日调用次数检查
    if (info.apiDate !== apiDate || info.numOfOneDayAlreadyCallApi < count) {
      // 允许请求
    } else {
      // 返回限额已满错误
    }
  }
}

认证流程：

从Authorization头获取token
查询Redis中的用户数据验证token有效性
检查当日API调用次数是否超限
通过验证后才转发请求

3.2 请求转发与响应处理

核心转发逻辑：

javascript复制completionRes = await axios.post(
  `${baseURL}/api/light/chat/claudeCodeOnAzure`,
  {
    apiKey: process.env.apiKeyOnServer,
    ...req.body
  }
)

国外服务器接收到请求后，会使用配置的API Key实际调用Claude接口。这里使用了环境变量apiKeyOnServer来存储真实的Claude API密钥，避免硬编码在代码中。

3.3 非流式到流式的转换

Claude API原生返回是非流式响应，但前端通常需要流式体验。代码实现了两种流式协议转换：

Anthropic流式格式：

javascript复制// 1. message_start 事件
const messageStart = {
  type: 'message_start',
  message: {
    id: messageId,
    type: 'message',
    role: 'assistant',
    content: [],
    model: modelName,
    stop_reason: null,
    stop_sequence: null,
    usage: {
      input_tokens: 0,
      output_tokens: 0
    }
  }
}
res.write(`event: message_start\ndata: ${JSON.stringify(messageStart)}\n\n`)

// 后续发送content_block_start、content_block_delta等事件...

OpenAI流式格式：

javascript复制const chunk = {
  id: messageId,
  object: 'chat.completion.chunk',
  created: Math.floor(Date.now() / 1000),
  model: modelName,
  choices: [{
    index: 0,
    delta: {
      content: content
    },
    finish_reason: null
  }]
}
res.write(`data: ${JSON.stringify(chunk)}\n\n`)

转换器通过设置Content-Type: text/event-stream头部，并按照SSE(Server-Sent Events)协议分块发送数据，实现了伪流式效果。

4. 数据持久化与状态管理

4.1 用户调用计数

使用Redis + 数据库双重存储保证计数准确性：

javascript复制userCountQueue.enqueue(async () => {
  // 刷新Redis中的数据
  await refreshRedisUser()
  
  // 获取最新用户数据
  let userRedisLatest = await redisClient.get('user')
  let userListLatest = JSON.parse(userRedisLatest)
  
  // 更新调用计数
  if (apiDate === infoLatest.apiDate) {
    infoLatest.numOfOneDayAlreadyCallApi += 1
  } else {
    infoLatest.apiDate = apiDate
    infoLatest.numOfOneDayAlreadyCallApi = 1
  }
  
  // 保存到数据库
  await editUserCount({
    user: userLatest,
    gptVersion,
    info: JSON.stringify(infoLatest),
  })
})

关键设计：

使用队列处理计数更新，避免阻塞主请求
先刷新Redis数据，防止并发导致计数不准
日期变更时重置计数器

4.2 对话记录存储

消息保存到数据库的流程：

javascript复制addMessageToDbV2025({
  robotMessage,      // AI回复内容
  userDb,            // 用户信息
  gptVersion: 'claude3',
  uid,               // 消息ID
  now,               // 时间戳
  message,           // 用户消息
  req,               // 请求对象
  platform: 'anthropicAi'
})

存储的信息包括完整的对话上下文、时间戳、用户标识等，便于后续分析和审计。

5. 错误处理与调试

5.1 常见错误场景

代码中处理了多种错误情况：

认证失败：

javascript复制res.send({
  type: 'message',
  content: [{
    text: `失败，需要环境变量里配置ANTHROPIC_AUTH_TOKEN`
  }]
})

调用次数超限：

javascript复制res.send({
  content: [{
    text: `api调用次数已经达到上限。如需增加调用次数，请联系管理员`
  }]
})

服务器错误：

javascript复制} catch (error) {
  console.error('更新用户计数失败:', error)
}

5.2 调试技巧

本地模拟模式：

javascript复制if (global.isLocal && false) {
  completionRes = {
    data: {
      id: 'd254213e-dd1d-43a2-948d-5178fe2ffb75',
      content: [{
        text: '【模拟数据】Hello! 👋 How can I help you today?'
      }]
    }
  }
}

通过开关控制是否使用模拟数据，方便本地开发测试。

日志记录：

关键操作都包含console.log输出
使用try-catch捕获异步错误
记录了完整的请求参数和响应

6. 性能优化实践

6.1 流式响应优化

实现真正的流式体验需要注意：

设置正确的响应头：

javascript复制res.setHeader('Content-Type', 'text/event-stream; charset=utf-8')
res.setHeader('Cache-Control', 'no-cache')
res.setHeader('Connection', 'keep-alive')

避免不必要的缓冲：

直接使用res.write分块发送
及时调用res.end()关闭连接

根据前端能力选择合适的流式格式（Anthropic/OpenAI）

6.2 Redis缓存策略

用户数据缓存方案：

主要数据存储在数据库中
Redis作为高速缓存
关键操作前刷新缓存保证一致性
使用队列序列化写操作

javascript复制await refreshRedisUser()  // 操作前刷新
let userRedisLatest = await redisClient.get('user')  // 读取最新
await editUserCount(...)  // 更新数据库

7. 安全加固建议

7.1 敏感信息保护

API密钥不应出现在配置文件中：

javascript复制apiKey: process.env.apiKeyOnServer  // 使用环境变量

Token验证：

javascript复制let info = JSON.parse(item.info)
return info.token === token  // 验证客户端token

生产环境应禁用调试信息

7.2 请求验证

检查消息体结构：

javascript复制if (Array.isArray(req.body.messages) && req.body.messages.length > 0) {
  message = req.body.messages[0]?.content[0]?.text
}

限制输入长度：

javascript复制"contextWindow": 200000  // 模型配置中限制上下文长度

内容过滤：

应在代理服务器端对输入输出内容进行安全检查
防止注入攻击和恶意内容

8. 扩展与定制

8.1 多模型支持

配置支持轻松扩展新模型：

json复制"models": [
  {
    "id": "claude-sonnet-4-5",
    "name": "Claude Sonnet 4.5",
    "reasoning": true,
    "input": ["text", "image"]
  }
  // 可添加其他模型
]

8.2 协议适配器

通过streamFormat参数支持不同流式协议：

javascript复制const streamFormat = 'anthropic'  // 或 'openai'

if (streamFormat === 'anthropic') {
  // Anthropic格式事件流
} else {
  // OpenAI格式事件流
}

8.3 部署选项

配置文件支持多种部署模式：

json复制"gateway": {
  "port": 18789,
  "mode": "local",  // 可改为remote
  "bind": "loopback"
}

可根据需要切换本地开发或远程服务器模式。

9. 实际应用中的经验总结

在实现这类代理服务时，有几个关键点需要注意：

连接超时处理：在网络状况不稳定的情况下，需要合理设置axios的超时参数，并实现重试机制。
错误重试策略：对于可重试的错误（如网络抖动），应该实现指数退避重试：

javascript复制const retry = async (fn, retries = 3, delay = 1000) => {
  try {
    return await fn()
  } catch (error) {
    if (retries <= 0) throw error
    await new Promise(res => setTimeout(res, delay))
    return retry(fn, retries - 1, delay * 2)
  }
}

监控与日志：完整的日志应包括：

请求到达时间
转发耗时
响应状态
错误详情
用户标识

性能基准测试：在部署前应该测试：

单节点并发能力
平均响应延迟
资源占用情况
长时间运行的稳定性

缓存策略优化：对于常见问题，可以在代理层实现回答缓存，减少对Claude API的调用：

javascript复制const cacheKey = `response:${md5(userMessage)}`
const cached = await redisClient.get(cacheKey)
if (cached) return JSON.parse(cached)

10. 项目演进建议

基于当前实现，未来可以考虑的改进方向：

负载均衡：支持配置多个国外代理节点，自动选择最优线路
协议扩展：增加对WebSocket等实时协议的支持
智能路由：根据请求内容自动选择最合适的模型和代理节点
使用量分析：增加Dashboard展示各用户/模型的API使用情况
自动扩缩容：根据负载自动调整代理服务器数量
配置热更新：支持不重启服务更新配置和路由规则
客户端SDK：封装统一的客户端库，简化各平台集成

这种架构不仅适用于Claude API代理，经过适当改造也可以用于其他国际AI服务的本地化接入，为开发者提供一致的开发体验，同时解决网络访问的痛点问题。