切换主题
常见问题
本页是排错页。
如果你遇到非预期行为,先按下面的顺序排查。很多问题不是“模型坏了”,而是接入方式、参数、上下文本身或线路状态出了问题。
快速诊断
- 确认接入方式:确认你当前使用的是官方模型、OpenRouter,还是自定义 API
- 检查基础状态:确认账户余额、模型权限和当前线路是否正常
- 查看消息详情:确认完成原因,相关概念见 模型概念
- 减少变量:尝试切换 [流式输出] 开关,或新开一轮纯文本短对话测试
- 复验配置:如果使用自定义 API,检查 Base URL、API Key、模型 ID、上下文长度是否正确
提示
排查时,尽量不要同时改模型、参数、提示词和接入方式。一次只改一个变量,更容易定位问题。
症状解析
1. 等待回复时间长(Latency)
等待时间长,不一定代表模型异常。很多时候,只是当前请求本身更“重”。
常见原因:
- 模型特性:推理模型通常需要更长的内部推导时间,首字延迟天然更高
- 上下文负载:历史消息过长,或系统提示词、角色卡、世界书过重
- 线路拥堵:高峰时段或特定上游线路波动时,整体响应会变慢
- 输出上限过高:
Max Tokens设得过大时,模型往往需要更久才能完成生成
优先排查:
- 先发一句纯文本短消息,确认是不是所有请求都变慢
- 查看当前对话是否已经积累了很长的历史消息
- 适当降低
Max Tokens,观察体感是否改善 - 如果只是某个模型变慢,先换同类模型或其他来源测试
2. 回复中途截断(Truncated)
回复说到一半停住,通常不是“模型突然坏了”,而是碰到了输出边界,或中途被拦截。
常见原因:
- 输出上限过小:
Max Tokens设得太低,模型还没说完就被截断 - 完成原因是
length:说明这次生成已经碰到输出长度限制 - 完成原因是
content_filter:说明生成过程中被上游策略或安全规则中断
优先排查:
- 先点开消息详情,确认
Finish Reason - 如果是
length,优先适度调大Max Tokens - 如果是
content_filter,检查当前输入、上下文和提示词是否存在明显冲突 - 切换一次流式输出开关,再重新生成,对比结果
3. “敏感”空回复(content_filter)
逻辑自查建议
不要第一时间归咎于“敏感词”。很多空回复的根本原因,其实是上下文混乱、代词指代不清,或者提示词之间互相冲突,最终让模型无法稳定生成。
更常见的原因:
- 代词过多:满篇的“他、她、它、TA”,会让模型在长上下文里失去指代目标
- 语义冲突:系统提示词、角色设定和当前输入之间存在逻辑矛盾
- 上下文过长:一轮请求里同时塞入了太多彼此冲突的信息
- 任务跳步过大:当前输入省略了太多前提,模型无法顺畅接上
修复建议:
- 先用一句更短、更直接的话重新测试
- 把模糊代词替换成明确的人名或主语
- 切换一次流式输出开关后再试
- 把复杂任务拆成单步指令,减少一次跨越过多逻辑层级
- 如果仍然无效,换一个模型再测一句,判断是不是当前模型或线路问题
错误码对照
| 代码 | 常见含义 | 更常见的原因 | 先做什么 |
|---|---|---|---|
301 | 网络异常 | 浏览器休眠或网络环境切换 | 刷新页面,重新连接后查看最新消息 |
400 | 请求错误 | 参数格式不匹配或模型名输入错误 | 检查请求方式、模型名和参数 |
401 | 授权失败 | API Key 填错、过期或被撤销 | 检查并填入有效的 Key |
402 | 余额不足 | 账户余额耗尽 | 检查账户余额 |
403 | 权限拒绝 | 模型未开通、账号无权限或地区限制 | 换模型测试,并检查账号权限和网络环境 |
404 | 资源未找到 | Base URL 路径错误或模型已下架 | 核对接口地址,确认模型名称 |
405 | 请求方法不兼容 | 提供商不支持当前请求方式 | 切换流式开关,或换同类模型测试 |
413 | 请求过大 | 上下文或单次提问超过上游限制 | 缩短历史、减少设定,或新开对话测试 |
429 | 请求过多 | 触发频率限制、限流或并发超额 | 降低请求频率,稍后再试 |
500 | 服务端内部错误 | 上游服务临时异常 | 稍后重试,观察是否持续发生 |
502 | 网关错误 | 中间转发链路异常 | 检查地址是否正确,或换线路测试 |
503 | 服务不可用 | 上游高负载或维护中 | 稍后重试,优先换模型或换来源 |
504 | 超时 | 上游响应太慢或网络不稳 | 重试、缩短上下文,切换对话或模型测试 |
604 | 服务异常 | 握手成功但模型未返回可用信息 | 开启新对话测试,或切换更稳定的模型 |
技术支持
如果你已经完成上述排查,问题仍未解决,联系客服时请提供以下信息:
- 接入方式
- 模型名称
- 是否开启流式输出
- 对话内容和上下文长度
- 完整错误信息或截图
- 发生时间
- 你已经尝试过的排查步骤