官网注册
 R1模型,推理模型
 参考视频理解
理解大语言模型的本质
- 大模型在训练时是将内容token化的
 - 大模型知识是存在截止时间的
 - 大模型缺乏自我认知、自我意识
 - 记忆有限
 - 输出长度有限
 
智商理解,例如下面的DeepSeek的测试:
 
用DeepSeek
- 官网
 - 手机App
 - 调用API
 - 本地部署
 
使用技巧
- 提出明确的要求
 - 要求特定的风格
 - 提供充分的任务背景信息
 - 主动标注自己的知识状态
 - 定义目标而非过程
 - 提供AI不具备的知识背景
 - 从开放到收敛
 
本地部署
ollama官网
 ollama是一个开源项目,可下载和运行模型,帮助开发者更轻松构建和使用模型。
使用ollama
- 安装ollama
 - 配置模型和参数
 - 使用数据集训练模型
 - 将训练好的模型部署到生产环境
 
示例:
from ollama import TextGenerator# 初始化文本生成器
generator = TextGenerator(model_name="gpt-3")# 生成文本
input_text = "今天天气很好,"
output_text = generator.generate(input_text, max_length=50)print(output_text)
 
部署
建议下载小的,成功后根据需求进行配置
参考
DeepSeek R1 本地部署