Gateway Prober 详细说明

返回检测页 GitHub 项目

1. 现在默认会测什么

默认顺序是 Models、Chat、Tools、Responses、Embeddings。Images 默认关闭，目的是让第一次探测更快，也更适合先判断“这个网关到底能不能正常接文本场景”。

即使你不勾 Capabilities，结果页也会先给一版尽量全面但简短的整体总结，帮你快速判断这个网关更适合接哪类客户端、哪类工作流。

2. Capabilities 为什么更值得开

Capabilities 不是简单再多测几个请求，而是按模型和端点做更细的扫描。它会回答的不只是“接口通不通”，而是“哪些模型在这些接口上真的能用”。

适合排查“模型名能列出来，但实际一调用就失败”的兼容问题。
适合在准备正式接入 IDE、Agent、RAG 或自动化工作流前做最终判断。
开启后页面会额外生成更完整的接入建议、模型判断和可复制报告。

3. 为什么很多时候 Base URL 要写到 /v1

不少兼容网关实际上只在 /v1 下暴露接口。理论上工具会尝试根地址和 /v1，但有些网关的转发、重写或防火墙规则只允许 /v1/*。遇到这种情况，直接把 Base URL 写成到 /v1 为止通常更稳。

4. Quick / Deep 是什么

Quick 只测更常见的前缀，速度优先。Deep 会增加更多前缀变体，例如 /openai/v1、/api/v1、/api/openai/v1，兼容更广，但会更慢。

5. Endpoint Strategy 是什么

Append 表示保留默认候选端点，再追加你手填的 Endpoint Paths 和高级预设。Custom Only 表示只测你手填和预设里的路径，不再测默认端点。

6. 如果 Embeddings 不可用，会影响什么

/v1/embeddings 不是聊天接口，而是把文本转成向量。它做不了时，普通聊天、代码问答、工具调用通常仍然可以用，但依赖“向量检索”的功能会明显变弱，甚至直接不可用。

通常还能做：普通对话、代码补全、代码解释、Agent 调工具、基于 /chat/completions 或 /responses 的常规 IDE 助手。
通常会受影响：知识库问答、RAG、项目语义搜索、文档召回、相似内容匹配、先检索再回答的工作流。

7. 常见后缀分别是干什么的

后缀	用途	请求形态	说明
`/v1/chat/completions`	传统聊天接口	messages[]	很多旧客户端、编辑器插件、网关都还在用它。
`/v1/responses`	新式统一响应接口	input	新版 SDK 更常见，文本和多模态能力通常会往这里集中。
`/v1/responses/compact`	Responses 变体	input	有些兼容层只实现 compact 版本。
`/v1/embeddings`	向量生成	input text	用于知识库、检索、RAG，通常需要专用 embedding 模型。
`/v1/images/generations`	图片生成	prompt	返回 url 或 base64 图像数据。
`/v1/images/edits`	图片编辑	image + prompt	通常要求上传原图或遮罩。
`/v1/images/variations`	图片变体	image	基于原图生成相近版本。
`/v1/audio/transcriptions`	语音转文字	audio file	常见于 Whisper 兼容接口。
`/v1/audio/translations`	语音翻译	audio file	把音频转成另一种语言文本。
`/v1/audio/speech`	文字转语音	text	有的网关会单独实现。
`/v1/moderations`	内容审核	text or image	检测违规、敏感内容。
`/v1/assistants`	Assistants API	assistant config	较重，很多兼容网关并不实现。
`/v1/threads`	Assistants 会话线程	thread messages	通常和 assistants 配套。
`/v1/threads/runs`	Assistants 执行	assistant + thread	把 thread 跑起来。
`/v1/files`	文件上传/管理	multipart file	常见于 fine-tuning、assistants、batch。
`/v1/uploads`	分段上传	multipart or chunk	部分新式 OpenAI API 会用。
`/v1/batches`	批处理任务	batch config	适合异步大批量请求。
`/v1/realtime`	实时音视频/双向流	websocket or session	通常不是简单的 HTTP POST。
`/v1/fine_tuning/jobs`	微调任务	training job	很多代理层只暴露模型调用，不暴露微调。

8. 高级预设里包含什么

图片编辑相关：测 /v1/images/edits 和 /v1/images/variations
音频相关：测 /v1/audio/transcriptions、/v1/audio/translations、/v1/audio/speech
审核相关：测 /v1/moderations
旧版文本编辑：测 /v1/edits
Assistants 相关：测 /v1/assistants、/v1/threads、/v1/threads/runs
文件与批处理：测 /v1/files、/v1/uploads、/v1/batches
Realtime 相关：测 /v1/realtime
微调相关：测 /v1/fine_tuning/jobs

9. 页面结果怎么看

结果页会先给你一段“整体总结”，即使没开 Capabilities，也会尽量把文本兼容性、工具调用、Embeddings、图片、推荐模型和补充端点情况压缩成一段能快速决策的结论。

如果开了 Capabilities，页面还会额外给一份完整报告，适合你发给团队、客户，或者作为后续接入决策依据。

10. 推荐使用顺序

第一次排查：
保持默认勾选，先看整体总结

准备正式接入：
把 Base URL 尽量写到 /v1
按需要切到 Deep
再勾上 Capabilities

如果你要测特殊接口：
填写 Endpoint Paths
或者勾高级预设