type
Post
status
Published
date
Sep 14, 2025
slug
summary
deepseek更加谨慎,用户友好
tags
category
icon
password
为什么在dify中使用同一个12306-mcp服务,两个不同的模型(qwen3和deepseek-chat)会有调用上的区别
 

主要区别分析:

1. Qwen3的处理方式

  • Qwen3 直接尝试调用用户请求中提到的工具 get_trains
  • 它假设这个工具存在于MCP服务中
  • 当工具不存在时,MCP服务器直接返回错误

2. DeepSeek-Chat的处理方式

  • DeepSeek-Chat采用了更谨慎的策略
  • 首先调用 mcp_sse_list_tools 获取可用工具列表
  • 发现没有 get_trains 工具,于是不尝试调用
  • 正常调用其他存在的工具(如 get-stations-code-in-city 等)

为什么会出现这种差异?

模型推理逻辑不同

  • Qwen3可能:"用户说要查询火车票,我应该直接调用get_trains工具"
  • DeepSeek-Chat可能:"用户要查询火车票,但我不确定有哪些可用工具,先查看一下工具列表"

训练数据和行为模式的差异

不同的模型在工具使用上可能有不同的默认策略:
  • 有些模型更倾向于"假设工具存在并直接调用"
  • 有些模型更倾向于"先验证工具存在性再调用"
 
解决办法:
通俗理解Chunk与Retrieval及最佳实践(分段与检索)Dify不同模型接入mcp注意点(deepseek与qwen3)
Loading...