Gateway Prober 详细说明
1. 现在默认会测什么
默认顺序是 Models、Chat、Tools、Responses、Embeddings。Images 默认关闭,目的是让第一次探测更快,也更适合先判断“这个网关到底能不能正常接文本场景”。
即使你不勾 Capabilities,结果页也会先给一版尽量全面但简短的整体总结,帮你快速判断这个网关更适合接哪类客户端、哪类工作流。
2. Capabilities 为什么更值得开
Capabilities 不是简单再多测几个请求,而是按模型和端点做更细的扫描。它会回答的不只是“接口通不通”,而是“哪些模型在这些接口上真的能用”。
- 适合排查“模型名能列出来,但实际一调用就失败”的兼容问题。
- 适合在准备正式接入 IDE、Agent、RAG 或自动化工作流前做最终判断。
- 开启后页面会额外生成更完整的接入建议、模型判断和可复制报告。
3. 为什么很多时候 Base URL 要写到 /v1
不少兼容网关实际上只在 /v1 下暴露接口。理论上工具会尝试根地址和 /v1,但有些网关的转发、重写或防火墙规则只允许 /v1/*。遇到这种情况,直接把 Base URL 写成到 /v1 为止通常更稳。
4. Quick / Deep 是什么
Quick 只测更常见的前缀,速度优先。Deep 会增加更多前缀变体,例如 /openai/v1、/api/v1、/api/openai/v1,兼容更广,但会更慢。
5. Endpoint Strategy 是什么
Append 表示保留默认候选端点,再追加你手填的 Endpoint Paths 和高级预设。Custom Only 表示只测你手填和预设里的路径,不再测默认端点。
6. 如果 Embeddings 不可用,会影响什么
/v1/embeddings 不是聊天接口,而是把文本转成向量。它做不了时,普通聊天、代码问答、工具调用通常仍然可以用,但依赖“向量检索”的功能会明显变弱,甚至直接不可用。
- 通常还能做:普通对话、代码补全、代码解释、Agent 调工具、基于
/chat/completions或/responses的常规 IDE 助手。 - 通常会受影响:知识库问答、RAG、项目语义搜索、文档召回、相似内容匹配、先检索再回答的工作流。
7. 常见后缀分别是干什么的
| 后缀 | 用途 | 请求形态 | 说明 |
|---|---|---|---|
/v1/chat/completions | 传统聊天接口 | messages[] | 很多旧客户端、编辑器插件、网关都还在用它。 |
/v1/responses | 新式统一响应接口 | input | 新版 SDK 更常见,文本和多模态能力通常会往这里集中。 |
/v1/responses/compact | Responses 变体 | input | 有些兼容层只实现 compact 版本。 |
/v1/embeddings | 向量生成 | input text | 用于知识库、检索、RAG,通常需要专用 embedding 模型。 |
/v1/images/generations | 图片生成 | prompt | 返回 url 或 base64 图像数据。 |
/v1/images/edits | 图片编辑 | image + prompt | 通常要求上传原图或遮罩。 |
/v1/images/variations | 图片变体 | image | 基于原图生成相近版本。 |
/v1/audio/transcriptions | 语音转文字 | audio file | 常见于 Whisper 兼容接口。 |
/v1/audio/translations | 语音翻译 | audio file | 把音频转成另一种语言文本。 |
/v1/audio/speech | 文字转语音 | text | 有的网关会单独实现。 |
/v1/moderations | 内容审核 | text or image | 检测违规、敏感内容。 |
/v1/assistants | Assistants API | assistant config | 较重,很多兼容网关并不实现。 |
/v1/threads | Assistants 会话线程 | thread messages | 通常和 assistants 配套。 |
/v1/threads/runs | Assistants 执行 | assistant + thread | 把 thread 跑起来。 |
/v1/files | 文件上传/管理 | multipart file | 常见于 fine-tuning、assistants、batch。 |
/v1/uploads | 分段上传 | multipart or chunk | 部分新式 OpenAI API 会用。 |
/v1/batches | 批处理任务 | batch config | 适合异步大批量请求。 |
/v1/realtime | 实时音视频/双向流 | websocket or session | 通常不是简单的 HTTP POST。 |
/v1/fine_tuning/jobs | 微调任务 | training job | 很多代理层只暴露模型调用,不暴露微调。 |
8. 高级预设里包含什么
- 图片编辑相关:测
/v1/images/edits和/v1/images/variations - 音频相关:测
/v1/audio/transcriptions、/v1/audio/translations、/v1/audio/speech - 审核相关:测
/v1/moderations - 旧版文本编辑:测
/v1/edits - Assistants 相关:测
/v1/assistants、/v1/threads、/v1/threads/runs - 文件与批处理:测
/v1/files、/v1/uploads、/v1/batches - Realtime 相关:测
/v1/realtime - 微调相关:测
/v1/fine_tuning/jobs
9. 页面结果怎么看
结果页会先给你一段“整体总结”,即使没开 Capabilities,也会尽量把文本兼容性、工具调用、Embeddings、图片、推荐模型和补充端点情况压缩成一段能快速决策的结论。
如果开了 Capabilities,页面还会额外给一份完整报告,适合你发给团队、客户,或者作为后续接入决策依据。
10. 推荐使用顺序
第一次排查: 保持默认勾选,先看整体总结 准备正式接入: 把 Base URL 尽量写到 /v1 按需要切到 Deep 再勾上 Capabilities 如果你要测特殊接口: 填写 Endpoint Paths 或者勾高级预设