Gateway Prober 详细说明

1. 现在默认会测什么

默认顺序是 Models、Chat、Tools、Responses、Embeddings。Images 默认关闭,目的是让第一次探测更快,也更适合先判断“这个网关到底能不能正常接文本场景”。

即使你不勾 Capabilities,结果页也会先给一版尽量全面但简短的整体总结,帮你快速判断这个网关更适合接哪类客户端、哪类工作流。

2. Capabilities 为什么更值得开

Capabilities 不是简单再多测几个请求,而是按模型和端点做更细的扫描。它会回答的不只是“接口通不通”,而是“哪些模型在这些接口上真的能用”。

3. 为什么很多时候 Base URL 要写到 /v1

不少兼容网关实际上只在 /v1 下暴露接口。理论上工具会尝试根地址和 /v1,但有些网关的转发、重写或防火墙规则只允许 /v1/*。遇到这种情况,直接把 Base URL 写成到 /v1 为止通常更稳。

4. Quick / Deep 是什么

Quick 只测更常见的前缀,速度优先。Deep 会增加更多前缀变体,例如 /openai/v1/api/v1/api/openai/v1,兼容更广,但会更慢。

5. Endpoint Strategy 是什么

Append 表示保留默认候选端点,再追加你手填的 Endpoint Paths 和高级预设。Custom Only 表示只测你手填和预设里的路径,不再测默认端点。

6. 如果 Embeddings 不可用,会影响什么

/v1/embeddings 不是聊天接口,而是把文本转成向量。它做不了时,普通聊天、代码问答、工具调用通常仍然可以用,但依赖“向量检索”的功能会明显变弱,甚至直接不可用。

7. 常见后缀分别是干什么的

后缀用途请求形态说明
/v1/chat/completions传统聊天接口messages[]很多旧客户端、编辑器插件、网关都还在用它。
/v1/responses新式统一响应接口input新版 SDK 更常见,文本和多模态能力通常会往这里集中。
/v1/responses/compactResponses 变体input有些兼容层只实现 compact 版本。
/v1/embeddings向量生成input text用于知识库、检索、RAG,通常需要专用 embedding 模型。
/v1/images/generations图片生成prompt返回 url 或 base64 图像数据。
/v1/images/edits图片编辑image + prompt通常要求上传原图或遮罩。
/v1/images/variations图片变体image基于原图生成相近版本。
/v1/audio/transcriptions语音转文字audio file常见于 Whisper 兼容接口。
/v1/audio/translations语音翻译audio file把音频转成另一种语言文本。
/v1/audio/speech文字转语音text有的网关会单独实现。
/v1/moderations内容审核text or image检测违规、敏感内容。
/v1/assistantsAssistants APIassistant config较重,很多兼容网关并不实现。
/v1/threadsAssistants 会话线程thread messages通常和 assistants 配套。
/v1/threads/runsAssistants 执行assistant + thread把 thread 跑起来。
/v1/files文件上传/管理multipart file常见于 fine-tuning、assistants、batch。
/v1/uploads分段上传multipart or chunk部分新式 OpenAI API 会用。
/v1/batches批处理任务batch config适合异步大批量请求。
/v1/realtime实时音视频/双向流websocket or session通常不是简单的 HTTP POST。
/v1/fine_tuning/jobs微调任务training job很多代理层只暴露模型调用,不暴露微调。

8. 高级预设里包含什么

9. 页面结果怎么看

结果页会先给你一段“整体总结”,即使没开 Capabilities,也会尽量把文本兼容性、工具调用、Embeddings、图片、推荐模型和补充端点情况压缩成一段能快速决策的结论。

如果开了 Capabilities,页面还会额外给一份完整报告,适合你发给团队、客户,或者作为后续接入决策依据。

10. 推荐使用顺序

第一次排查:
保持默认勾选,先看整体总结

准备正式接入:
把 Base URL 尽量写到 /v1
按需要切到 Deep
再勾上 Capabilities

如果你要测特殊接口:
填写 Endpoint Paths
或者勾高级预设