deepseek-v3在阿里云和腾讯云的使用中的差异

随着deepseek在各大云商上线,试用了下阿里云和腾讯云的deepseek服务,在回答经典数学问题9.9和9.11谁大时,发现还是有差异的。将相关的问题记录如下。

1、问题表现

笔者使用的openai的官方sdk go-openai。

因本文中测验主要使用阿里云和腾讯云。

在阿里云官网页面上时,回答正确:

通过api调用,不设置system提示词时,回答问题时每次都会出错:

代码如下:

package mainimport ("context""fmt""github.com/openai/openai-go""github.com/openai/openai-go/option"
)func main() {client := openai.NewClient(option.WithAPIKey("sk-xxxxxxxxxxxxxxxxx"), // defaults to os.LookupEnv("OPENAI_API_KEY")option.WithBaseURL("https://dashscope.aliyuncs.com/compatible-mode/v1/"),)chatCompletion, err := client.Chat.Completions.New(context.TODO(), openai.ChatCompletionNewParams{Messages: openai.F([]openai.ChatCompletionMessageParamUnion{openai.UserMessage("9.9和9.11谁大"),}),Model: openai.F("deepseek-v3"),})if err != nil {panic(err.Error())}println(chatCompletion.Choices[0].Message.Content)
}

若是发往腾讯云:

回答正确:

"要比较 \\(9.9\\) 和 \\(9.11\\) 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   \\[\n   9.9 = 9.90\n   \\]\n   \\[\n   9.11 = 9.11\n   \\]\n\n2. **逐位比较**:\n   - **个位数**:两者都是 \\(9\\),相等。\n   - **十分位**:\\(9.90\\) 的十分位是 \\(9\\),\\(9.11\\) 的十分位是 \\(1\\)。\n   \n   由于 \\(9 > 1\\),因此 \\(9.90 > 9.11\\)。\n\n**最终结论**:\n\\[\n\\boxed{9.9 \\text{ 大于 } 9.11}\n\\]"
"要比较 \\(9.9\\) 和 \\(9.11\\) 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   \\[\n   9.9 = 9.90\n   \\]\n   \\[\n   9.11 = 9.11\n   \\]\n\n2. **逐位比较**:\n   - **个位数**:两者都是 \\(9\\),相等。\n   - **十分位**:\\(9.90\\) 的十分位是 \\(9\\),\\(9.11\\) 的十分位是 \\(1\\)。\n   \n   由于 \\(9 > 1\\),所以 \\(9.90 > 9.11\\)。\n\n因此,\\(9.9\\) 大于 \\(9.11\\)。\n\n\\[\n\\boxed{9.9 > 9.11}\n\\]"
"要比较 \\(9.9\\) 和 \\(9.11\\) 的大小,可以按照以下步骤进行:\n\n1. **比较整数部分**:\n   - 两个数的整数部分都是 \\(9\\),所以需要比较小数部分。\n\n2. **比较小数部分**:\n   - \\(9.9\\) 的小数部分是 \\(0.9\\)。\n   - \\(9.11\\) 的小数部分是 \\(0.11\\)。\n\n3. **转换为相同小数位数**:\n   - 将 \\(0.9\\) 转换为 \\(0.90\\),以便与 \\(0.11\\) 比较。\n   \n4. **进行大小比较**:\n   - \\(0.90 > 0.11\\),因此 \\(9.9 > 9.11\\)。\n\n**最终答案**:\n\\[\n\\boxed{9.9}\n\\]"

如果通过curl直接调用api时,不设置任何提示词时,

发往阿里云时,回答有时会错误:

输入命令:

curl -X POST https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions -H "Authorization: Bearer sk-xxxxxxxxxxxxxxx" -H "Content-Type: application/json" -d '{"model": "deepseek-v3","messages": [{"role": "user", "content": "9.9和9.11谁大?"}]
}'

第一次答案:

9.9比9.11大,详细报文如下:

{"choices":[{"message":{"content":"要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   - 将 **9.9** 写成 **9.90**,以便于比较。\n   \n2. **逐位比较**:\n   - **整数部分**:两数的整数部分都是 **9**,相等。\n   - **小数部分**:\n     - 第一位小数:**9.90** 的第一位小数是 **9**,**9.11** 的第一位小数是 **1**。\n     - 由于 **9 > 1**,所以 **9.90 > 9.11**。\n\n因此,**9.9** 大于 **9.11**。\n\n最终答案:\\boxed{9.9 > 9.11}","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":13,"completion_tokens":175,"total_tokens":188},"created":1739847540,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-581f773a-f1ed-92f6-981d-00408259761d"}

第二次答案:是9.11比9.9大,详细报文如下:

{"choices":[{"message":{"content":"要比较 \\(9.9\\) 和 \\(9.11\\) 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   为了便于比较,将两个数的小数位数统一。将 \\(9.9\\) 写成 \\(9.90\\)。\n   \n   \\[\n   9.9 = 9.90\n   \\]\n   \n2. **逐位比较**:\n   从左到右逐位比较两个数:\n   \n   - **整数部分**:两者都是 \\(9\\),相等。\n   - **第一位小数**:两者都是 \\(9\\),相等。\n   - **第二位小数**:\\(0\\)(在 \\(9.90\\) 中) vs \\(1\\)(在 \\(9.11\\) 中)。\n   \n   因为 \\(0 < 1\\),所以 \\(9.90 < 9.11\\)。\n\n3. **结论**:\n   \\[\n   9.9 < 9.11\n   \\]\n   \n因此,\\(\\boxed{9.11}\\) 更大。","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":13,"completion_tokens":218,"total_tokens":231},"created":1739847774,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-15511b5b-d92d-9ca2-859c-13bf003e4381"}

而发往腾讯云时,执行三次结果全部正确:

通过上述,可以发现,阿里云在执行时,通过api进行调用时,使用go代码和shell代码执行结果并不一致,因此其可能存在逻辑并不相同的情况。

2、设置一中性通用提示词,对结果的影响

若设置system提示词为:you are a helpful assister

使用go代码时,在调用阿里云服务时结果为:

"9.11比9.9大。在比较小数时,从左到右逐位比较,9.9可以看作9.90,而9.11的十分位是1,比9.90的十分位9大,因此9.11更大。<|im_end|>"

同样代码,在调用腾讯云服务时,结果正确:

要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n - 将 **9.9** 写成 **9.90**,以便与 **9.11** 进行比较。\n\n2. **逐位比较**:\n - **个位数**:两者都是 **9**,相等。\n - **十分位**:**9.90** 的十分位是 **9**,**9.11** 的十分位是 **1**。由于 **9 > 1**,因此 **9.90 > 9.11**。\n\n3. **结论**:\n - **9.9** 大于 **9.11**。\n\n最终答案:\\boxed{9.9 > 9.11}

go代码为:

package mainimport ("context""fmt""github.com/openai/openai-go""github.com/openai/openai-go/option"
)func main() {client := openai.NewClient(option.WithAPIKey("sk-xxxxxxxxxxxxxxxxx"), // defaults to os.LookupEnv("OPENAI_API_KEY")//阿里云调用地址option.WithBaseURL("https://dashscope.aliyuncs.com/compatible-mode/v1/"),//腾讯云地址//option.WithBaseURL("https://api.lkeap.cloud.tencent.com/v1/"),)chatCompletion, err := client.Chat.Completions.New(context.TODO(), openai.ChatCompletionNewParams{Messages: openai.F([]openai.ChatCompletionMessageParamUnion{openai.SystemMessage("you are a helpful assister"), openai.UserMessage("9.9和9.11谁大"),}),Model: openai.F("deepseek-v3"),})if err != nil {panic(err.Error())}println(chatCompletion.Choices[0].Message.Content)
}

通过curl直接调用阿里云或腾讯云服务时均正确:

curl -X POST https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions \
-H "Authorization: Bearer sk-xxxxxxxx" \
-H "Content-Type: application/json" \
-d '{"model": "deepseek-v3","messages": [{"role": "system","content": "You a helpful assister."},{"role": "user", "content": "9.9和9.11谁大?"}]
}'

阿里云三次输出结果,二次正确,一次错误:

第一次结果错误,显示9.11大于9.9

{"choices":[{"message":{"content":"要比较 \\(9.9\\) 和 \\(9.11\\) 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   将 \\(9.9\\) 写成两位小数:\n   \\[\n   9.9 = 9.90\n   \\]\n   \n2. **逐位比较**:\n   \\[\n   \\begin{align*}\n   \\text{整数部分} & : 9 = 9 \\\\\n   \\text{第一位小数} & : 9 = 9 \\\\\n   \\text{第二位小数} & : 0 < 1 \\\\\n   \\end{align*}\n   \\]\n   \n   在第二位小数上,\\(0 < 1\\),因此 \\(9.90 < 9.11\\)。\n\n3. **结论**:\n   \\[\n   9.9 < 9.11\n   \\]\n\n所以,\\(9.11\\) 比 \\(9.9\\) 大。\n\n\\[\n\\boxed{9.11 \\text{ 更大}}\n\\]","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":19,"completion_tokens":211,"total_tokens":230},"created":1739865100,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-0eab475c-656c-9627-91a6-b5edd90c1cda"}

正确的二次结果:

{"choices":[{"message":{"content":"**解答:**\n\n比较两个小数 \\(9.9\\) 和 \\(9.11\\) 的大小。\n\n1. **统一小数位数:**\n   \\[\n   9.9 = 9.90\n   \\]\n   \\[\n   9.11 = 9.11\n   \\]\n\n2. **逐位比较:**\n   - 个位数:\\(9 = 9\\)(相等)\n   - 十位小数:\\(9 > 1\\)\n\n由于在十位小数上 \\(9.90\\) 的 \\(9\\) 大于 \\(9.11\\) 的 \\(1\\),因此:\n\\[\n9.90 > 9.11\n\\]\n\n**最终答案:**\n\\[\n\\boxed{9.9 > 9.11}\n\\]","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":19,"completion_tokens":163,"total_tokens":182},"created":1739865225,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-b5755232-db96-98e0-abb5-1727a1e1cdb5"}
{"choices":[{"message":{"content":"**解答:**\n\n比较两个数 \\(9.9\\) 和 \\(9.11\\) 的大小。\n\n1. **统一小数位数:**\n   为了方便比较,将 \\(9.9\\) 写成 \\(9.90\\)。\n\n2. **逐位比较:**\n   - 比较整数部分:\\(9 = 9\\),相等。\n   - 比较第一位小数:\\(9 > 1\\)。\n\n3. **结论:**\n   由于第一位小数 \\(9 > 1\\),所以 \\(9.90 > 9.11\\)。\n\n最终答案:\\boxed{9.9\\ \\text{更大}}","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":19,"completion_tokens":132,"total_tokens":151},"created":1739865274,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-b6d313fe-3b5d-948b-8b7a-0c63b9055213"}

发往腾讯云的代码:

  curl -X POST https://api.lkeap.cloud.tencent.com/v1/chat/completions \-H "Authorization: Bearer sk-xxxx" \-H "Content-Type: application/json" \-d '{"model": "deepseek-v3","messages": [{"role": "system","content": "You a helpful assister."},{"role": "user", "content": "9.9和9.11谁大?"}]}'

腾讯云每次均正确,三次调用结果如下:

{"id":"0cbeaab6ca3b27bb4f9b40915806912d","object":"chat.completion","created":1739865487,"model":"deepseek-v3","choices":[{"index":0,"message":{"role":"assistant","content":"要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   - 将 **9.9** 写成 **9.90**,以便与 **9.11** 进行比较。\n\n2. **逐位比较**:\n   - **个位数**:两者都是 **9**,相等。\n   - **十分位**:**9.90** 的十分位是 **9**,**9.11** 的十分位是 **1**。由于 **9 \u003e 1**,因此 **9.90 \u003e 9.11**。\n\n或者,可以将两个数都转换为分数形式进行比较:\n\n3. **转换为分数**:\n   - **9.9** 可以表示为 \\( 9 \\frac{9}{10} = \\frac{99}{10} \\)。\n   - **9.11** 可以表示为 \\( 9 \\frac{11}{100} = \\frac{911}{100} \\)。\n\n4. **比较分数**:\n   - 将 \\( \\frac{99}{10} \\) 转换为分母为 **100** 的分数:\\( \\frac{990}{100} \\)。\n   - 比较 \\( \\frac{990}{100} \\) 和 \\( \\frac{911}{100} \\),显然 \\( 990 \u003e 911 \\),所以 \\( \\frac{990}{100} \u003e \\frac{911}{100} \\)。\n\n综上所述,**9.9** 大于 **9.11**。\n\n\\[\n\\boxed{9.9 \u003e 9.11}\n\\]"},"finish_reason":"stop"}],"usage":{"prompt_tokens":23,"completion_tokens":341,"total_tokens":364}}
{"choices":[{"message":{"content":"要比较 \\(9.9\\) 和 \\(9.11\\) 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   将 \\(9.9\\) 写成 \\(9.90\\),以便与 \\(9.11\\) 进行比较。\n\n2. **逐位比较**:\n   - **个位数**:两者都是 \\(9\\),相等。\n   - **十分位**:\\(9.90\\) 的十分位是 \\(9\\),\\(9.11\\) 的十分位是 \\(1\\)。\n   \n   由于 \\(9 > 1\\),所以 \\(9.90 > 9.11\\)。\n\n**最终答案:**\n\\[\n\\boxed{9.9 > 9.11}\n\\]","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":19,"completion_tokens":158,"total_tokens":177},"created":1739865560,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-aac07423-8ed4-9988-934c-ba3dd78e1cad"}
{"choices":[{"message":{"content":"要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   - 将 **9.9** 写成 **9.90**,这样两个数的小数位数相同,便于比较。\n\n2. **逐位比较**:\n   - **个位数**:两者都是 **9**,相等。\n   - **十分位**:**9.90** 的十分位是 **9**,**9.11** 的十分位是 **1**。\n   \n   由于 **9 > 1**,因此 **9.90 > 9.11**。\n\n**结论**:\n\\boxed{9.9 > 9.11}","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":19,"completion_tokens":157,"total_tokens":176},"created":1739865685,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-bcd8c5df-9380-9d1a-933e-b4e7b9e0d794"}

3、设置一无意义的提示词对问题的影响

提示词为you

go代码为:

package mainimport ("context""fmt""github.com/openai/openai-go""github.com/openai/openai-go/option"
)func main() {client := openai.NewClient(option.WithAPIKey("sk-xxxxxxxxxxxxxxxxx"), // defaults to os.LookupEnv("OPENAI_API_KEY")//阿里云调用地址option.WithBaseURL("https://dashscope.aliyuncs.com/compatible-mode/v1/"),//腾讯云地址//option.WithBaseURL("https://api.lkeap.cloud.tencent.com/v1/"),)chatCompletion, err := client.Chat.Completions.New(context.TODO(), openai.ChatCompletionNewParams{Messages: openai.F([]openai.ChatCompletionMessageParamUnion{openai.SystemMessage("you"), openai.UserMessage("9.9和9.11谁大"),}),Model: openai.F("deepseek-v3"),})if err != nil {panic(err.Error())}println(chatCompletion.Choices[0].Message.Content)
}

阿里云执行的结果不正确为:

9.11比9.9大。在比较小数时,从左到右逐位比较,9.9可以看作9.90,而9.11的第一位小数是1,比9.90的第一位小数9大,因此9.11大于9.9。<|im_end|>

腾讯云执行结果正确:

要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   将 **9.9** 转换为 **9.90**,以便与 **9.11** 进行比较。\n\n2. **逐位比较**:\n   - **个位数**:两者都是 **9**,相等。\n   - **十分位**:**9.90** 的十分位是 **9**,**9.11** 的十分位是 **1**。\n   \n   由于 **9 > 1**,所以 **9.90 > 9.11**。\n\n**最终答案:**\n\\[\n\\boxed{9.9 > 9.11}\n\\]

使用curl的结果分析:

发往阿里云的代码:

curl -X POST https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions \
-H "Authorization: Bearer sk-xxxx" \
-H "Content-Type: application/json" \
-d '{"model": "deepseek-v3","messages": [{"role": "system","content": "you"},{"role": "user", "content": "9.9和9.11谁大?"}]
}'

三次执行结果均正确:

{"choices":[{"message":{"content":"要比较 \\(9.9\\) 和 \\(9.11\\) 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   将 \\(9.9\\) 转换为 \\(9.90\\),便于与 \\(9.11\\) 比较。\n\n2. **逐位比较**:\n   - **个位数**:两个数的个位数都是 \\(9\\),相等。\n   - **十分位**:\\(9.90\\) 的十分位是 \\(9\\),而 \\(9.11\\) 的十分位是 \\(1\\)。\n   \n   由于 \\(9 > 1\\),所以 \\(9.90 > 9.11\\)。\n\n因此,\\(9.9\\) 大于 \\(9.11\\)。\n\n\\[\n\\boxed{9.9\\ >\\ 9.11}\n\\]","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":14,"completion_tokens":174,"total_tokens":188},"created":1739868276,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-d928cc66-2ff5-950d-aa25-3e63b71c5ea8"}
{"choices":[{"message":{"content":"要比较 \\(9.9\\) 和 \\(9.11\\) 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   \n   为了便于比较,将 \\(9.9\\) 转换为 \\(9.90\\)。\n\n2. **逐位比较**:\n   \n   \\[\n   \\begin{align*}\n   &\\underline{9}.\\underline{9}\\underline{0} \\quad (\\text{即 } 9.90) \\\\\n   &\\underline{9}.\\underline{1}\\underline{1} \\quad (\\text{即 } 9.11)\n   \\end{align*}\n   \\]\n   \n   - **整数部分**:两数的整数部分都是 \\(9\\),相同。\n   - **十分位**:\\(9\\)(来自 \\(9.90\\))大于 \\(1\\)(来自 \\(9.11\\))。\n   \n   因此,\\(9.90\\) 大于 \\(9.11\\)。\n\n3. **结论**:\n   \n   \\[\n   \\boxed{9.9 > 9.11}\n   \\]","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":14,"completion_tokens":225,"total_tokens":239},"created":1739868380,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-f9d5f7d3-1886-9b1e-8dc6-cbbe5e999ce9"}
{"choices":[{"message":{"content":"要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   将 **9.9** 写成 **9.90**,这样两个数都有两位小数,便于比较。\n\n2. **逐位比较**:\n   - **整数部分**:9 和 9 相同。\n   - **第一位小数**:9 和 1。因为 9 > 1,所以 **9.90 > 9.11**。\n\n因此,**9.9** 大于 **9.11**。\n\n最终答案:\\boxed{9.9}","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":14,"completion_tokens":138,"total_tokens":152},"created":1739868423,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-90359b2a-ac45-951b-9069-6e57c07edf9a"}

发往腾讯云的代码:

 curl -X POST https://api.lkeap.cloud.tencent.com/v1/chat/completions \-H "Authorization: Bearer sk-xxx" \-H "Content-Type: application/json" \-d '{"model": "deepseek-v3","messages": [{"role": "system","content": "you"},{"role": "user", "content": "9.9和9.11谁大?"}]}'

失败一次:

{"id":"13e0702bd97a5c2ae19e0fdbe8d55e8f","object":"chat.completion","created":1739868567,"model":"deepseek-v3","choices":[{"index":0,"message":{"role":"assistant","content":"要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   \n   将 **9.9** 写成 **9.90**,这样两个数的小数位数相同,便于比较。\n\n2. **逐位比较**:\n   \n   - **个位数**:两个数的个位数都是 **9**,相等。\n   - **十分位**:两个数的十分位都是 **9**,相等。\n   - **百分位**:**9.90** 的百分位是 **0**,而 **9.11** 的百分位是 **1**。\n\n3. **确定大小**:\n   \n   由于在百分位上 **1 \u003e 0**,所以 **9.11 \u003e 9.90**。\n\n**最终答案:**\n\n\\[\n\\boxed{9.11 \\text{ 更大}}\n\\]"},"finish_reason":"stop"}],"usage":{"prompt_tokens":23,"completion_tokens":194,"total_tokens":217}}

成功二次:

{"choices":[{"message":{"content":"要比较 \\(9.9\\) 和 \\(9.11\\) 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   将 \\(9.9\\) 写成 \\(9.90\\),以便与 \\(9.11\\) 进行比较。\n\n2. **逐位比较**:\n   - 比较整数部分:两者都是 \\(9\\),相等。\n   - 比较第一位小数:\\(9.90\\) 的第一位小数是 \\(9\\),而 \\(9.11\\) 的第一位小数是 \\(1\\)。由于 \\(9 > 1\\),因此 \\(9.90 > 9.11\\)。\n\n3. **得出结论**:\n   \\[\n   9.9 > 9.11\n   \\]\n\n最终答案是:\n\\[\n\\boxed{9.9}\n\\]","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":14,"completion_tokens":171,"total_tokens":185},"created":1739868850,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-bc3e2987-6cf7-92ed-ab54-7ce0022a03aa"}
{"choices":[{"message":{"content":"要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   - 将 **9.9** 转换为 **9.90**,以便与 **9.11** 进行比较。\n\n2. **逐位比较**:\n   - **整数部分**:两者都是 **9**,相等。\n   - **第一位小数**:**9.90** 的第一位小数是 **9**,而 **9.11** 的第一位小数是 **1**。\n   \n3. **得出结论**:\n   - 由于 **9 > 1**,因此 **9.90 > 9.11**。\n\n最终,**9.9** 大于 **9.11**。\n\n\\[\n\\boxed{9.9 > 9.11}\n\\]","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":14,"completion_tokens":179,"total_tokens":193},"created":1739871179,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-7facfd28-9db2-9274-af43-fdbef215eaee"}

4 设置带有思考逻辑提示词

提示词:识别用户的问题类型,回答问题的类型,并作为该类型问题专家,思考用户并回答用户提出的问题

相关代码同第第3节

go代码阿里云回答的结果,全部错误:

这是一个数学比较问题。作为数学专家,我来回答这个问题。\n\n9.11 比 9.9 大。因为在小数比较中,我们先比较整数部分,两者都是9,然后比较小数部分,0.11大于0.9。所以9.11大于9.9。
这是一个数学比较问题。作为数学专家,我来回答这个问题。\n\n9.11 比 9.9 大。因为在小数点后第一位,1 比 9 小,所以 9.11 大于 9.9。
用户的问题是关于数值比较的问题。作为数值比较问题的专家,我将帮助用户比较这两个数值的大小。\n\n要比较9.9和9.11的大小,我们可以将它们转换为相同的小数位数以便更清楚地比较:\n\n- 9.9 可以写成 9.90\n- 9.11 保持不变\n\n现在,我们比较这两个数值:\n\n9.90 < 9.11\n\n因此,9.11 大于 9.9。\n\n答案:9.11 大于 9.9。<|im_end|>

go代码腾讯云的回答结果二次错误,一次正确:

错误的结果:

"9.11比9.9大。在比较小数时,我们首先比较整数部分,如果整数部分相同,再比较小数部分。在这个例子中,两个数的整数部分都是9,但9.11的小数部分(0.11)大于9.9的小数部分(0.9),因此9.11更大。"
"要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   为了方便比较,将 **9.9** 写成 **9.90**。\n\n2. **逐位比较**:\n   - **个位数**:两数的个位数都是 **9**,相等。\n   - **十分位**:两数的十分位都是 **9**,相等。\n   - **百分位**:**9.90** 的百分位是 **0**,而 **9.11** 的百分位是 **1**。\n\n3. **得出结论**:\n   由于在百分位上 **1 > 0**,所以 **9.11 > 9.90**。\n\n**最终答案:**\n\\[\n\\boxed{9.11 \\text{ 大于 } 9.9}\n\\]"

正确的结果:

"要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   为了方便比较,将 **9.9** 写成 **9.90**。\n\n2. **逐位比较**:\n   - **个位数**:两者都是 **9**,相等。\n   - **十分位**:**9.90** 的十分位是 **9**,**9.11** 的十分位是 **1**。\n   \n   由于 **9 > 1**,所以 **9.90 > 9.11**。\n\n**最终答案:**\n\\[\n\\boxed{9.9 > 9.11}\n\\]"

curl命令的执行结果:

发往阿里云的三次执行结果全部正确:

{"choices":[{"message":{"content":"在比较9.9和9.11时,我们可以通过将它们转换为相同的小数位数来简化比较:\n\n- 9.9可以写作9.90\n- 9.11保持不变\n\n现在比较9.90和9.11,显然9.90大于9.11。因此,9.9大于9.11。","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":36,"completion_tokens":70,"total_tokens":106},"created":1739874057,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-fd5adad0-625e-9d69-bbf0-6d65684454dc"}
{"choices":[{"message":{"content":"要比较 \\(9.9\\) 和 \\(9.11\\) 的大小,我们可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   为了方便比较,将两数的小数位数统一。将 \\(9.9\\) 写成 \\(9.90\\)。\n\n2. **逐位比较**:\n   - 比较个位数:两个数的个位数都是 \\(9\\),相等。\n   - 比较十分位:\\(9.90\\) 的十分位是 \\(9\\),而 \\(9.11\\) 的十分位是 \\(1\\)。由于 \\(9 > 1\\),因此 \\(9.90 > 9.11\\)。\n\n3. **结论**:\n   通过以上比较,可以得出 \\(9.9\\) 大于 \\(9.11\\)。\n\n\\[\n\\boxed{9.9 > 9.11}\n\\]","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":36,"completion_tokens":182,"total_tokens":218},"created":1739874266,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-d4f846cd-20b8-91c2-aa98-3730fb88cd37"}
{"choices":[{"message":{"content":"要比较 \\(9.9\\) 和 \\(9.11\\) 的大小,我们可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   为了方便比较,我们将两个数都保留两位小数:\n   \\[\n   9.9 = 9.90\n   \\]\n   \\[\n   9.11 = 9.11\n   \\]\n\n2. **逐位比较**:\n   - 比较整数部分:两者的整数部分都是 \\(9\\),相等。\n   - 比较第一位小数:\\(9.90\\) 的第一位小数是 \\(9\\),而 \\(9.11\\) 的第一位小数是 \\(1\\)。\n   - 因为 \\(9 > 1\\),所以 \\(9.90 > 9.11\\)。\n\n3. **结论**:\n   \\[\n   9.9 > 9.11\n   \\]\n\n因此,\\(9.9\\) 比 \\(9.11\\) 大。\n\n\\[\n\\boxed{9.9 \\text{ 大于 } 9.11}\n\\]","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":36,"completion_tokens":220,"total_tokens":256},"created":1739874530,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-e30fad3c-dbbb-9739-b557-df1fdc02431a"}

发往腾讯云的三次执行结果全部正确:

错误

{"id":"67946867247717b454fee86f05d5e84b","object":"chat.completion","created":1739874853,"model":"deepseek-v3","choices":[{"index":0,"message":{"role":"assistant","content":"9.11 比 9.9 大。\n\n解释:\n- 9.9 可以理解为 9 又 9/10,即 9.90。\n- 9.11 可以理解为 9 又 11/100,即 9.11。\n\n比较小数点后的部分,0.11 大于 0.90,因此 9.11 大于 9.9。"},"finish_reason":"stop"}],"usage":{"prompt_tokens":39,"completion_tokens":88,"total_tokens":127}}

正确:

{"id":"3d4f5e01cb183c6e6069ed19cc9103aa","object":"chat.completion","created":1739876125,"model":"deepseek-v3","choices":[{"index":0,"message":{"role":"assistant","content":"要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   - 将 **9.9** 写成 **9.90**,以便与 **9.11** 进行比较。\n\n2. **逐位比较**:\n   - **整数部分**:两者都是 **9**,相等。\n   - **十分位**:**9.90** 的十分位是 **9**,**9.11** 的十分位是 **1**。由于 **9 \u003e 1**,因此 **9.90 \u003e 9.11**。\n\n**结论**:\n\\[\n\\boxed{9.9 \\text{ 大于 } 9.11}\n\\]"},"finish_reason":"stop"}],"usage":{"prompt_tokens":39,"completion_tokens":163,"total_tokens":202}}
{"id":"1b9728633fead52bbbc2e835692b02e9","object":"chat.completion","created":1739876187,"model":"deepseek-v3","choices":[{"index":0,"message":{"role":"assistant","content":"要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   为了方便比较,将 **9.9** 写成 **9.90**。\n\n2. **逐位比较**:\n   - **个位数**:两者都是 **9**,相等。\n   - **十分位**:**9.90** 的十分位是 **9**,**9.11** 的十分位是 **1**。\n   \n   由于 **9 \u003e 1**,因此 **9.90 \u003e 9.11**。\n\n**最终答案:**\n\\[\n\\boxed{9.9 \u003e 9.11}\n\\]"},"finish_reason":"stop"}],"usage":{"prompt_tokens":39,"completion_tokens":152,"total_tokens":191}}

5 接口分析

由1~4节执行的结果看,在相同的提示词情况下,通过go实现的接口得到的结果和通过curl获得的内容差异较大,尤其是在阿里云平台上表现更是如此。通过代码调试后,将报文内容序列后,得到message格式为:

"messages": [{"content": [{"text": "you","type": "text"}],"role": "system"},{"content": [{"text": "9.9和9.11谁大","type": "text"}],"role": "user"}]

参考文章OpenAI API格式详解-Chat Completions

一个完整的User message是一个json对象,包含以下字段:

  • content必须提供的string或array类型,二选一,表示user的消息内容
    • 为string类型时,表示消息的文本内容
    • 为array类型时,一般用于调用多模态模型,用来包含多个内容部分的数组,一般是一个文本内容的json对象和一个或多个图片内容的json对象。仅当使用 gpt-4-visual-preview 这样的多模态模型时才支持图像输入。具体字段如下:
      • 文本内容部分,是一个json对象:
        • type:必须提供的string类型,表示内容部分的类型,一般是“text”
        • text:必须提供的string类型,文字内容
      • 图片内容部分,是一个json对象:
        • type:必须提供的string类型,表示内容部分的类型,一般是"image_url"
        • image_url:必须提供的json对象类型,字段有:
          • url:必须提供的string类型,图像的 URL 或 Base64 编码的图像数据
          • detail:可选的string类型,一般默认是“auto”
  • role:必须提供的string类型,表示消息作者的角色,对于user message应该是"user"
  • name:可选的string类型,表示对话参与者的名称

因此根据openai sdk官网实现的内容,实际上对应于多模态的实现部分。

通过curl执行以下代码,可以得到上述go代码类似的效果

curl -X POST https://api.lkeap.cloud.tencent.com/v1/chat/completions \
-H "Authorization: Bearer sk-xxxx" \
-H "Content-Type: application/json" \
-d '{"messages": [{"content": [{"text": "识别用户的问题类型,回答问题的类型,并作为该类型问题专家,思考并回答用户提出的问题","type": "text"}],"role": "system"},{"content": [{"text": "9.9和9.11谁大","type": "text"}],"role": "user"}],"model": "deepseek-v3"}'

而go代码若是需要得到类似于1~3的curl结果的实现,需要进行以下的实现:

package mainimport ("context""fmt""github.com/openai/openai-go""github.com/openai/openai-go/option"
)func main() {client := openai.NewClient(option.WithAPIKey("sk-xxxxxxxxxxxxxxxxx"), // defaults to os.LookupEnv("OPENAI_API_KEY")option.WithBaseURL("https://dashscope.aliyuncs.com/compatible-mode/v1/"),)chatCompletion, err := client.Chat.Completions.New(context.TODO(), openai.ChatCompletionNewParams{Messages: openai.F([]openai.ChatCompletionMessageParamUnion{openai.ChatCompletionMessage{Role: oai.ChatCompletionMessageRole(oai.ChatCompletionUserMessageParamRoleUser), Content: "识别用户的问题类型,回答问题的类型,并作为该类型问题专家,思考并回答用户提出的问题"},openai.ChatCompletionMessage{Role: oai.ChatCompletionMessageRole(oai.ChatCompletionSystemMessageParamRoleSystem), Content: "9.9和9.11谁大"}}),Model: openai.F("deepseek-v3"),})if err != nil {panic(err.Error())}println(chatCompletion.Choices[0].Message.Content)
}

6 结论

同样的deepseek-v3的模型,同样的提示词,不同的云平台的部署和实现存在差异,不可等同视之。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/70248.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

宝塔面板开始ssl后,使用域名访问不了后台管理

宝塔面板后台开启ssl访问后&#xff0c;用的证书是其他第三方颁发的证书 再使用 域名/xxx 的形式&#xff1a;https://域名:xxx/xxx 访问后台&#xff0c;结果出现如下&#xff0c;不管使用 http 还是 https 的路径访问都进不后台管理 这个时候可以使用 https://ip/xxx 的方式来…

开发板部署|RK3588部署DeepSeek-1.5B

前言 在 RK3588 上部署大模型可以显著提升计算效率、节能、加速推理过程&#xff0c;并实现本地化推理&#xff0c;适合各种边缘计算应用&#xff0c;如智能设备、自动驾驶、工业机器人、健康监测等领域。此外&#xff0c;RK3588 配备了强大的 NPU&#xff08;神经网络处理单元…

UDP与TCP

用UDP一定比用TCP快吗&#xff1f; 假设我们需要在a电脑的进程发一段数据到b电脑的进程我们可以选择使用TCP或UDP协议进行通信。 对于TCP这样的可靠性协议每次消息发出后都能明确知道对方有没有收到&#xff0c;就像打电话一样&#xff0c;只要“喂喂"两下对方就能回你个…

【ELK】【Elasticsearch】数据查询方式

1. 简单查询&#xff08;URI Search&#xff09; 通过 URL 参数直接进行查询&#xff0c;适合简单的搜索场景。 示例&#xff1a; bash 复制 GET /index_name/_search?qfield_name:search_value 说明&#xff1a; index_name&#xff1a;索引名称。 field_name&#xf…

软件测试:定义和实质

软件缺陷的定义&#xff1a; 未实现说明书要求的功能出现了说明书指明不应出现的错误实现了说明书未提到的功能未实现说明书没有明确提出但应该实现的目标软件难以理解&#xff0c;不易使用&#xff0c;运行缓慢 或者从测试员客户会认为不好的。 软件缺陷的原因&#xff1a; …

【软考】【2025年系统分析师拿证之路】【啃书】第十一章 软件需求工程(十二)

目录 需求的层次需求工程的主要活动需求的记录技术需求分析需求定义 需求的层次 业务需求用户需求系统需求 需求工程的主要活动 需求获取需求分析形成需求规格需求确认和验证需求管理 需求的记录技术 任务卡片场景说明用户故事 需求分析 方法&#xff1a; 结构化分析&a…

计算机网络原理试题六

一、单项选择 1.(单选题,5分)IP地址中网络号的作用有 A.指定了设备能够进行通信的网络 B.指定了主机所属的网络 C.指定了被寻址的子网中的某个节点 D.标志了网络中的主机 答案:B 2.(单选题,5分)关于IP主机地址,下列说法正确的是 A.网段部分不可以全1也不可以全0 B.主机部分可…

路由基础 | 路由引入实验 | 不同路由引入方式存在的问题

注&#xff1a;本文为 “路由基础 | 路由表 | 路由引入” 相关文章合辑。 未整理去重。 路由基本概念 1—— 路由表信息、路由进表以及转发流程、最长掩码匹配原则 静下心来敲木鱼已于 2023-11-26 14:06:22 修改 什么是路由 路由就是指导报文转发的路径信息&#xff0c;可以…

更高效实用 vscode 的常用设置

VSCode 可以说是文本编辑神器, 不止程序员使用, 普通人用其作为文本编辑工具, 更是效率翻倍. 这里分享博主对于 VSCode 的好用设置, 让 VSCode 如虎添翼 进入设置 首先进入设置界面, 后续都在这里进行配置修改 具体设置 每项配置通过搜索关键字, 来快速定位配置项 自动保存…

本地部署DeepSeek

1、下载ollama 浏览器输入ollama&#xff0c;打开ollama网站&#xff0c;选择版本下载 可以使用迅雷下载 打开迅雷&#xff0c;复制网址 2、安装ollama ollama下载完成之后&#xff0c;安装 3、查看ollama版本 Win R&#xff0c;cmd ollama -v 查看ollama版本 4、下载De…

大模型驱动的业务自动化

大模型输出token的速度太低且为统计输出&#xff0c;所以目前大模型主要应用在toP&#xff08;人&#xff09;的相关领域&#xff1b;但其智能方面的优势又是如此的强大&#xff0c;自然就需要尝试如何将其应用到更加广泛的toM&#xff08;物理系统、生产系统&#xff09;领域中…

Leetcode1299:将每个元素替换为右侧最大元素

题目描述&#xff1a; 给你一个数组 arr &#xff0c;请你将每个元素用它右边最大的元素替换&#xff0c;如果是最后一个元素&#xff0c;用 -1 替换。 完成所有替换操作后&#xff0c;请你返回这个数组。 代码思路&#xff1a; 方法 replaceElements 输入参数&#xff1a;…

Java 大视界 -- 人才需求与培养:Java 大数据领域的职业发展路径(92)

&#x1f496;亲爱的朋友们&#xff0c;热烈欢迎来到 青云交的博客&#xff01;能与诸位在此相逢&#xff0c;我倍感荣幸。在这飞速更迭的时代&#xff0c;我们都渴望一方心灵净土&#xff0c;而 我的博客 正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识&#xff0c;也…

Weboffice在线Word权限控制:限制编辑,只读、修订、禁止复制等

在现代企业办公中&#xff0c;文档编辑是一项常见且重要的任务。尤其是在线办公环境中&#xff0c;员工需要在网页中打开和编辑文档&#xff0c;但如何确保这些文档只能进行预览而无法被编辑或复制&#xff0c;成为许多企业面临的一个痛点。尤其是在处理涉密文档时&#xff0c;…

基于 Spring Boot 和微信小程序的仓储管理系统设计与实现

大家好&#xff0c;今天要和大家聊的是一款基于 Spring Boot 和 微信小程序 的“仓储管理系统”的设计与实现。项目源码以及部署相关事宜请联系我&#xff0c;文末附上联系方式。 项目简介 基于 Spring Boot 和 微信小程序 的“仓储管理系统”主要使用者分为 员工、供应商 和…

Stable Diffusion本地化部署超详细教程(手动+自动+整合包三种方式)

一、 Stable Diffusion简介 2022年作为AIGC&#xff08;Artificial Intelligence GeneratedContent&#xff09;时代的元年&#xff0c;各个领域的AIGC技术都有一个迅猛的发展&#xff0c;给工业界、学术界、投资界甚至竞赛界都注入了新的“[AI(https://so.csdn.net/so/search…

WPS的AI助手进化跟踪(灵犀+插件)

Ver V0.0 250216: 如何给WPS安装插件用以支持其他大模型LLM V0.1 250217: WPS的灵犀AI现在是DeepSeek R1(可能是全参数671B) 前言 WPS也有内置的AI&#xff0c;叫灵犀&#xff0c;之前应是自已的LLM模型&#xff0c;只能说是属于“能用&#xff0c;有好过无”&#xff0c;所…

通俗理解-L、-rpath和-rpath-link编译链接动态库

一、参考资料 链接选项 rpath 的应用和原理 | BewareMyPower的博客 使用 rpath 和 rpath-link 确保 samba-util 库正确链接-CSDN博客 编译参数-Wl和rpath的理解_-wl,-rpath-CSDN博客 Using LD, the GNU linker - Options Directory Options (Using the GNU Compiler Colle…

SpringMVC环境搭建

文章目录 1.模块创建1.创建一个webapp的maven项目2.目录结构 2.代码1.HomeController.java2.home.jsp3.applicationContext.xml Spring配置文件4.spring-mvc.xml SpringMVC配置文件5.web.xml 配置中央控制器以及Spring和SpringMVC配置文件的路径6.index.jsp 3.配置Tomcat1.配置…

window中git bash使用conda命令

window系统的终端cmd和linux不一样&#xff0c;运行不了.sh文件&#xff0c;为了在window中模仿linux&#xff0c;可以使用gui bash模拟linux的终端。为了在gui bash中使用python环境&#xff0c;由于python环境是在anaconda中创建的&#xff0c;所以需要在gui bash使用conda命…