1. 聊天模型
apiqik
  • 必读
    • 欢迎来到 APIQIK - 您的 AI 模型聚合平台
    • API代理商招募&使用教程(无需技术)
    • 音频模型
  • 客户端应用教程
    • Cherry Studio使用指南
    • Chatbox 使用指南
    • Cherry Studio sora/veo视频生成教程
    • 令牌分组(Token Group)使用教程
    • Vscode claude code
    • vscode配置教程(Cline)
    • 沉浸式翻译配置教程
    • 💬 SillyTavern 配置
    • Codex 配置使用教程
    • Gemini CLI 新手 · 自定义配置完整教程
    • opencode配置使用教程
    • ClawDBot 新手配置文档
    • Claude Code 自定义 API(中转站)配置教程
    • Openclaw龙虾凭啥火,以及必知三大风险!
    • openClaw的部署教程(部署安装教程)
    • openClaw 配置飞书教程(小白版)
    • OpenClaw Skills 实战篇
  • 聊天模型
    • Chat-Completions API 使用指南
    • chat模型接口
      POST
    • 数据模型
      • 示例数据模型
        • Pet
        • Category
        • Tag
  • openai
    • 图像(Images)
      • 创建图像
      • 创建图片编辑
    • 音频(Audio)
      • 创建语音
      • 创建音频转文本
    • 自动补全(Completions)
      • 创建完成
    • 模型(Models)
      • 列出模型
      • 检索模型
  • gemini
    • 聊天(chat)
      • gemini格式聊天接口
      • 分析视频
      • 流式响应
      • 多轮对话
    • 绘画模型
      • gemini-3-pro-image-preview(文生图)
      • gemini-3-pro-image-preview(图生图)
  • 音乐模型
    • Suno 音乐生成 API
  • 绘画模型
    • Chat 格式生图 (gpt-4o)
    • 专用生图接口 (DALL-E 格式)
    • gemini-2.5-flash-image接口文档(chat)
    • gemini-2.5-flash-image图像生成接口(支持比例)
    • 即梦(seedream)
      • 创建图片
      • 编辑图片
    • nano banana
      • gemini-2.5-flash-image图像生成接口(gemini格式)
      • gemini-3-pro-image-preview(banana pro)图像生成接口(gemini格式)
      • gemini-3.1-flash-image-preview(nano banana 2) (文生图)模型接口
      • gemini-3.1-flash-image-preview(nano banana 2) (图生图)模型接口
      • gemini-3.1-flash-image-preview(nano banana 2) (多图生图)模型接口
    • Qwen千问
      • 生成图片(qwen-image)
      • 编辑图像(qwen-image-edit)
    • gpt-image-1.5
      • chat 格式
        • 生成图片 (传图)
        • 生成图片
      • image/generations 格式(dalle 格式)
        • 创建图像
        • 创建图片编辑
    • 豆包
      • doubao-seedream-5-0-260128 模型(文生图)
      • doubao-seedream-5-0-260128 模型(图生图)
      • doubao-seedream-5-0-260128 模型(多图生图)
    • gpt imag 图像编辑接口
  • 视频模型
    • veo
      • Veo3 视频生成 API
      • 查询视频详情
      • veo3(veo3.1)视频生成(异步)
    • sora-2
      • sora2 生成视频(chat格式)
      • sora2 异步文档
      • sora-2官方格式(异步,失败不扣分)
        • sora-2创建视频
        • 检索视频
        • 编辑视频接口(暂时不能使用)
        • 获取视频内容
        • 使用故事板创建视频
    • grok
      • 获取视频内容
      • grok 视频生成
    • wan
      • wan视频创建
      • 检索视频
      • 获取视频内容
  • 音频模型
    • minimax
      • 上传复刻音频(purpose=voice_clone)
      • 上传示例音频(purpose=prompt_audio)
      • 音色快速复刻
    • 原生Gemini格式
    • 获取令牌使用情况
  • 代理接口调用
    • 创建令牌(需要登录)
    • 用户登录(用于获取其他接口需要的认证信息)
    • 获取令牌余额信息
    • 获取使用量统计
    • 获取令牌调用日志
  • 嵌入(Embeddings)
    • text-embedding-3-large模型
  1. 聊天模型

Chat-Completions API 使用指南

本文档详细说明了如何使用 Chat-Completions API 进行各种 AI 对话和文本生成任务。该 API 兼容 OpenAI 格式,支持多种模型,包括 GPT、Claude、Gemini 等主流 AI 模型。
官方文档:https://platform.openai.com/docs/api-reference/chat

📝 简介#

Chat-Completions API 是一个强大且灵活的接口,提供了访问最先进的 AI 模型的简单方式,支持:
💬 文本对话:自然语言问答和对话
🖼️ 图像分析:多模态内容理解
🔄 流式响应:实时流式输出
🛠️ 函数调用:工具集成和自动化
📊 结构化输出:JSON 格式输出
🎯 多种模型:支持各大厂商的主流模型

🔧 接口定义#

端点:/v1/chat/completions
方法:POST
认证:Bearer Token
格式:application/json

🔐 鉴权方法#

所有请求都需要在 HTTP Header 中包含 Authorization 字段:
请将 YOUR_API_KEY 替换为您在平台生成的有效 API 密钥。

💡 请求示例#

基础文本对话 ✅#

最简单的文本问答场景:
{
    "model": "gpt-4o",
    "messages": [
        {
            "role": "user",
            "content": "你好,请介绍一下人工智能的发展历史"
        }
    ],
    "max_tokens": 1000,
    "temperature": 0.7
}

图像分析对话 ✅#

支持图像输入的多模态对话:
{
    "model": "gemini-2.5-flash-all",
    "messages": [
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "请描述这张图片中的内容"
                },
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "data:image/jpeg;base64,/9j/4AAQSkZJRgABAQAAAQABAAD..."
                    }
                }
            ]
        }
    ],
    "max_tokens": 500
}

流式响应 ✅#

实现实时流式输出:
{
    "model": "gpt-4o",
    "messages": [
        {
            "role": "user",
            "content": "请写一首关于春天的诗"
        }
    ],
    "stream": true,
    "stream_options": {
        "include_usage": true
    }
}

函数调用 ✅#

集成外部工具和函数:
{
    "model": "gpt-4o",
    "messages": [
        {
            "role": "user",
            "content": "今天北京的天气怎么样?"
        }
    ],
    "tools": [
        {
            "type": "function",
            "function": {
                "name": "get_weather",
                "description": "获取指定城市的天气信息",
                "parameters": {
                    "type": "object",
                    "properties": {
                        "city": {
                            "type": "string",
                            "description": "城市名称"
                        }
                    },
                    "required": ["city"]
                }
            }
        }
    ],
    "tool_choice": "auto"
}

JSON 模式输出 ✅#

强制模型输出结构化 JSON:
{
    "model": "gpt-4o",
    "messages": [
        {
            "role": "system",
            "content": "你是一个数据提取助手,请将用户输入的信息提取为JSON格式"
        },
        {
            "role": "user",
            "content": "张三,男,25岁,软件工程师,住在北京市朝阳区"
        }
    ],
    "response_format": {
        "type": "json_object"
    }
}

📮 请求参数详解#

核心参数#

参数类型必需默认值描述
modelstring是-指定使用的模型名称
messagesarray是-对话消息列表
max_tokensinteger否-生成内容的最大 Token 数
temperaturenumber否1控制输出随机性 (0-2)
top_pnumber否1核采样参数 (0-1)
ninteger否1生成响应的数量
streamboolean否false是否启用流式输出

messages 参数详解#

消息数组中每个对象的结构:
{
    "role": "user|assistant|system|tool",
    "content": "消息内容",
    "name": "可选的发送者名称",
    "tool_calls": "工具调用信息",
    "tool_call_id": "工具调用ID"
}
角色说明:
system:系统提示,定义 AI 的行为和角色
user:用户输入的消息
assistant:AI 助手的回复
tool:工具调用的返回结果

高级参数#

参数类型描述
stopstring/array停止生成的序列
presence_penaltynumber存在惩罚 (-2.0 到 2.0)
frequency_penaltynumber频率惩罚 (-2.0 到 2.0)
logit_biasobjectToken 生成偏置
userstring最终用户标识符
seedinteger确定性采样种子
response_formatobject输出格式控制
toolsarray可用工具列表
tool_choicestring/object工具选择策略

📥 响应格式#

标准响应#

{
    "id": "chatcmpl-8XYZ123",
    "object": "chat.completion",
    "created": 1699000000,
    "model": "gpt-4o-2024-05-13",
    "choices": [
        {
            "index": 0,
            "message": {
                "role": "assistant",
                "content": "这是 AI 的回复内容"
            },
            "logprobs": null,
            "finish_reason": "stop"
        }
    ],
    "usage": {
        "prompt_tokens": 15,
        "completion_tokens": 25,
        "total_tokens": 40,
        "completion_tokens_details": {
            "reasoning_tokens": 0
        }
    },
    "system_fingerprint": "fp_abc123"
}

流式响应#

data: {"id":"chatcmpl-8XYZ123","object":"chat.completion.chunk","created":1699000000,"model":"gpt-4o","choices":[{"index":0,"delta":{"role":"assistant","content":"你好"},"logprobs":null,"finish_reason":null}]}

data: {"id":"chatcmpl-8XYZ123","object":"chat.completion.chunk","created":1699000000,"model":"gpt-4o","choices":[{"index":0,"delta":{"content":"!"},"logprobs":null,"finish_reason":null}]}

data: {"id":"chatcmpl-8XYZ123","object":"chat.completion.chunk","created":1699000000,"model":"gpt-4o","choices":[{"index":0,"delta":{},"logprobs":null,"finish_reason":"stop"}]}

data: [DONE]

finish_reason 说明#

值描述
stop模型自然停止或遇到停止序列
length达到最大 Token 限制
tool_calls模型调用了工具
content_filter内容被过滤

💻 代码示例#

Python 示例#

基础对话#

图像分析#

流式输出#

Node.js 示例#

基础对话#

函数调用#

cURL 示例#

基础请求#

流式请求#

Go 示例#


🚀 使用场景详解#

1. 智能客服#

2. 内容创作#

3. 代码助手#

4. 文档分析#


⚙️ 最佳实践#

1. 系统提示优化#

好的系统提示示例:
{
    "role": "system",
    "content": "你是一个专业的Python编程导师。请遵循以下原则:\n1. 提供清晰、可执行的代码示例\n2. 解释代码的工作原理\n3. 指出潜在的问题和改进建议\n4. 使用简洁明了的语言"
}

2. 温度参数调优#

场景推荐温度说明
事实问答0.1-0.3需要准确性
创意写作0.7-0.9需要创造性
代码生成0.2-0.4平衡准确性和灵活性
翻译任务0.1-0.2需要一致性

3. Token 使用优化#

4. 错误处理#

5. 流式输出处理#


🔍 模型选择指南#

主流模型对比#

模型特点适用场景成本
GPT-4o多模态,性能强复杂推理,图像分析高
GPT-3.5-turbo平衡性能和成本一般对话,内容生成中
Claude-3长文本处理强文档分析,长对话中高
Gemini ProGoogle 生态多模态任务中

模型选择建议#


🚨 常见错误和解决方案#

1. 认证错误 (401)#

{
    "error": {
        "message": "Invalid API key provided",
        "type": "invalid_request_error",
        "code": "invalid_api_key"
    }
}
解决方案:
检查 API 密钥是否正确
确认密钥格式:Bearer sk-xxxxx
验证密钥是否过期

2. 请求过大 (413)#

{
    "error": {
        "message": "Request too large",
        "type": "invalid_request_error",
        "code": "request_too_large"
    }
}
解决方案:
减少输入文本长度
优化图像大小
分批处理长文档

3. 速率限制 (429)#

{
    "error": {
        "message": "Rate limit exceeded",
        "type": "rate_limit_error", 
        "code": "rate_limit_exceeded"
    }
}
解决方案:
实现指数退避重试
控制并发请求数
升级到更高级别的套餐

4. 模型不可用 (404)#

{
    "error": {
        "message": "Model not found",
        "type": "invalid_request_error",
        "code": "model_not_found"
    }
}
解决方案:
检查模型名称拼写
确认模型是否支持
使用备用模型

📊 性能监控#

1. Token 使用统计#

2. 响应时间监控#


🔒 安全注意事项#

1. API 密钥安全#

2. 输入验证#

3. 内容过滤#


📚 相关资源#

官方文档#

🔧 模型列表和定价
📊 使用统计面板

💡 高级技巧#

1. 对话上下文管理#

2. 批量处理#

3. 智能重试机制#


🎯 总结#

Chat-Completions API 是一个功能强大且灵活的接口,支持多种 AI 模型和使用场景。通过本指南,您可以:
✅ 掌握基础用法 - 了解接口调用方法和参数配置
✅ 实现高级功能 - 支持多模态、流式输出、函数调用等
✅ 优化性能 - 合理选择模型、管理 Token、处理错误
✅ 确保安全 - 保护 API 密钥、验证输入、过滤内容
✅ 监控使用 - 跟踪性能指标、统计使用情况
遵循本指南的最佳实践,您将能够构建稳定、高效的 AI 应用程序。如有任何问题,请参考相关资源或联系技术支持。
修改于 2025-08-28 14:23:40
上一页
OpenClaw Skills 实战篇
下一页
chat模型接口
Built with