统一接口,快速接入多个模型

APIcoud 提供统一的 AI API 接入方式。你可以用同一个请求格式调用不同模型,按需切换能力,并在控制台查看余额、用量和调用记录。

OpenAI 风格接口 多模型接入 Token 用量可见 支持终端调用
接入方式Base URL + API Key
常用接口POST /v1/chat/completions
查看内容模型、余额、token
排错重点401 / 429 / 500

1. 快速开始 最先要看

开始使用

先登录 https://apicoud.com,进入“令牌管理”,点击“生成”,创建并复制自己的 API Key,再把请求地址改成 base_url。base_url 是接口的基础地址,只需要把程序中的请求目标改成这个地址。

终端模板

把 `YOUR_API_KEY` 和 `model` 替换为实际值即可完成首次调用。终端接入时,通常只需要确认 `API Key`、`base_url` 和 `model` 三项。

命令说明

`API Key` 用于鉴权,`base_url` 指定请求入口,`stream=true` 表示使用流式返回。

常见检查项

请优先核对请求路径、API Key、模型名以及 `Authorization` 请求头。

curl 调用

curl -X POST https://apicoud.com/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
  "model": "gpt-4",
  "messages": [
    {"role": "user", "content": "你好,帮我写一段介绍文案"}
  ]
}'

接口返回模式

关闭流式返回时,接口一次返回完整内容;开启流式返回时,内容会分段返回。

流式返回

适合需要边生成边展示结果的场景。

{
  "model": "gpt-4",
  "stream": true,
  "messages": [
    {"role": "user", "content": "帮我写一段产品介绍"}
  ]
}

Python 调用

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://apicoud.com/v1"
)

resp = client.chat.completions.create(
    model="gpt-4",
    messages=[
        {"role": "user", "content": "你好,帮我写一段介绍文案"}
    ]
)

print(resp.choices[0].message.content)

Node.js 调用

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: "YOUR_API_KEY",
  baseURL: "https://apicoud.com/v1"
});

const resp = await client.chat.completions.create({
  model: "gpt-4",
  messages: [
    { role: "user", content: "你好,帮我写一段介绍文案" }
  ]
});

console.log(resp.choices[0].message.content);

2. 常见软件怎么填 配置方式

Codex / 类 Codex 工具

通常在“设置”“自定义接口”“OpenAI-compatible”一类入口中配置 `API Key`、`Base URL` 和模型名称。

VS Code / IDE 插件

通常在插件设置页填写 `API Key`、`Base URL`、模型名,并选择对应的提供商或接口类型。

桌面聊天客户端

一般在“模型服务”“API 设置”或“连接器”中配置,填写 `API Key`、`Base URL` 和模型名。

自动化 / Agent 工具

一般在连接器、工作流节点或服务配置中填写,并补充模型、温度、上下文长度等参数。

API Key Base URL Model Provider OpenAI-compatible

3. 测试工具怎么配 先测通路

Postman / Apifox / Insomnia

在环境变量中保存 `API Key`,在请求地址中填写 `Base URL`,在请求头中设置 `Authorization`。

最常填的几个位置

常见位置包括 `URL`、`Headers`、`Body` 和 `Environment`,其中 `Body` 通常填写 `model`、`messages`、`stream` 等参数。

{
  "base_url": "https://apicoud.com/v1",
  "headers": {
    "Authorization": "Bearer YOUR_API_KEY",
    "Content-Type": "application/json"
  },
  "body": {
    "model": "gpt-4",
    "messages": [
      {"role": "user", "content": "你好"}
    ],
    "stream": false
  }
}

建议先测什么

建议先验证一条最基础的对话请求,再扩展到流式、多轮对话和长文本场景。

如果没通

优先检查 `API Key`、`Base URL`、模型名、请求体格式以及是否包含 `/v1`。

4. 模型与能力 可选模型

通用对话

适合问答、写作、总结、内容生成。

适合作为基础接入模型。

长文本与分析

适合阅读长文、改写内容、提取重点。

适合处理更长的上下文内容。

多模态

适合图文理解、截图分析、图像问答。

支持图片输入的多模态模型。
模型名 适合场景 是否支持多模态 上下文长度

5. 账户与计费 余额与用量

账单信息

余额、调用记录、token 消耗、模型单价。这些信息用于查看剩余额度和本次调用成本。

费用说明

输入越长、输出越长,token 消耗越高。不同模型单价不同,具体以控制台显示为准。

字段 含义
prompt_tokens 输入内容消耗的 token
completion_tokens 模型输出消耗的 token
total_tokens 总消耗 token
{
  "usage": {
    "prompt_tokens": 12,
    "completion_tokens": 48,
    "total_tokens": 60
  },
  "billing": {
    "estimated_cost": "0.0023"
  }
}

6. 错误码与排错 常见问题

错误码 说明 处理方式
400 参数格式不对或缺少必填项 检查请求体里的字段名和内容格式
401 API Key 无效或未携带 检查 Authorization 是否正确
403 没有权限访问该模型或功能 确认账号权限和模型开通情况
429 请求过快,触发限流 降低频率,稍后重试
500 上游服务或网关异常 查看状态页,必要时联系支持
502 上游返回异常 稍后重试,通常是上游临时波动
503 服务暂时不可用 等待恢复后再试
504 请求超时 稍后重试,必要时调整超时设置

7. 公告与客服 最新消息

公告

接口更新、维护通知、模型上下线说明。

客服入口

工单、邮件、在线客服或群入口,遇到问题时从这里联系。

接口调用 调用说明

字段 / 英文 中文意思
POST /v1/chat/completions 标准对话接口,意思是“发一句话,模型回一句话”。
model 要调用的模型名称。
messages 聊天内容,也就是发给模型的话。
temperature 控制回答风格,数值越高越灵活,数值越低越稳定。