type
Post
status
Published
date
Sep 14, 2025
slug
summary
deepseek更加谨慎,用户友好
tags
category
icon
password
为什么在dify中使用同一个12306-mcp服务,两个不同的模型(qwen3和deepseek-chat)会有调用上的区别
主要区别分析:
1. Qwen3的处理方式
- Qwen3 直接尝试调用用户请求中提到的工具
get_trains
- 它假设这个工具存在于MCP服务中
- 当工具不存在时,MCP服务器直接返回错误
2. DeepSeek-Chat的处理方式
- DeepSeek-Chat采用了更谨慎的策略
- 首先调用
mcp_sse_list_tools获取可用工具列表
- 发现没有
get_trains工具,于是不尝试调用
- 正常调用其他存在的工具(如
get-stations-code-in-city等)
为什么会出现这种差异?
模型推理逻辑不同
- Qwen3可能:"用户说要查询火车票,我应该直接调用get_trains工具"
- DeepSeek-Chat可能:"用户要查询火车票,但我不确定有哪些可用工具,先查看一下工具列表"
训练数据和行为模式的差异
不同的模型在工具使用上可能有不同的默认策略:
- 有些模型更倾向于"假设工具存在并直接调用"
- 有些模型更倾向于"先验证工具存在性再调用"
解决办法:
- Author:guderain
- URL:https://wangguanxi.space/article/2d22b727-a3a3-8051-a406-ead7f2a2ace5
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!



.webp?table=collection&id=92be88af-5f71-4631-9d3e-ee3bd53dcced&t=92be88af-5f71-4631-9d3e-ee3bd53dcced&width=1080&cache=v2)