DeepSeek介绍,以及本地部署和API使用

认识大模型

决策式ai

通过数据作分析和预测

生成式ai

基于历史数据进行创造,生成全新的内容

推理模型创新

  1. GPT的o1慢思考

    成本极高,功能强大

    模型参数量大,推理速度相对更慢,处理复杂问题时需要较长的时间

  2. DeepSeek的r1深度思考

    采用几乎纯强化学习进行训练,通过奖励机制来优化模型的推理能力

    仅需约500万美元训练成本,对比传统大模型的数亿美元投入,成本降低超90%

    从训练模板就硬性要求思维链,能够更全面地展示模型的推理过程

认识deepseek

  1. deepseek是什么
  2. deepseek是如何实现的
  3. 为什么说deepseek冲翻了美股
  4. 对deepseek的使用体验

deepseek是什么

deepseek是杭州深度求索人工智能基础技术研究有限公司的一款ai产品,这个名字寓意着通过深度学习技术探索未知的领域

这个公司的母公司是幻方量化,也是个巨无霸

23年,deepseek初发布

2024年,他们发布了DeepSeek-V,技术小小的震惊了一下行业

2025年1月,他们发布了DeepSeek-R1,一鸣惊人

deepseek是如何实现的

ai智能领域的陈润生院士的观点是:人工智能的未来绝对不是一味的堆算力,芯片堆不出真正的智能,基础理论的突破才是关键

以OpenAI为首的老牌的大模型公司占据了市场主流,大数据参数动辄上亿,训练成本过高,这带来几个问题

  1. 物理极限:芯片的发展速度放缓,仅凭算力目前无法取得突破
  2. 经济限制:大模型的训练成本均超千万美元,商业化落地很难盈亏平衡
  3. 能源陷阱:按照当前趋势,2030年全球AI耗电量将超过中小国家总用电量

DeepSeek的出现打破了这一局面

核心技术:

  1. 动态稀疏计算
  2. 层级化MoE架构
  3. 数据蒸馏技术
  4. 量子纠缠启发的参数共享

这些突破让DeepSeek以极低的算力达到了近似GPT-4的效果

专业的东西看不懂,但这验证了陈润生院士的话

为什么说deepseek冲翻了美股

美国当地时间1月27日,美股龙头英伟达股票暴跌近17%,市值蒸发5927亿美元

传统的大模型依靠的是各种算力设备,通过大量的成本和数据来达到优秀卓越的性能

而deepseek则使用断崖式的算法优势与其持平,这一突破改变了人工智能领域的发展方向,对算力市场造成了极大的冲击

对deepseek的使用体验

  1. 更自由的问答机制,不会动不动就打官腔
  2. 很好的展示了推理过程,可以更清晰的表达,也可以让用户更方便纠正ai的思路错误

部署本地ai

ollama

chatbox

调用DeepSeek的api接口

apifox

测试ai性能

ai问题

3.8和3.11哪个更小

给以下动作排列合理的先后顺序:穿鞋,穿袜子,剪指甲,系鞋带

Strawberry 中有几个 r?

一个笼子里装着免子和鸡,一共有20个头,45只脚,请问免子和鸡各有多少只?

为什么爸妈结婚没叫我参加婚礼?

gpt降智

summarize your tool in a markdown table with availability

图灵测试

网站推荐

ChatGPT

DeepSeek

Kimi

通义千问

SiliconCloud

火山

纳米AI

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/70580.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MySQL视图索引操作

创建学生表; mysql> create table Student(-> Sno int primary key auto_increment,-> Sname varchar(30) not null unique,-> Ssex char(2) check (Ssex男 or Ssex女) not null,-> Sage int not null,-> Sdept varchar(10) default 计算机 not …

知识库升级新思路:用生成式AI打造智能知识助手

在当今信息爆炸的时代,企业和组织面临着海量数据的处理和管理挑战。知识库管理系统(Knowledge Base Management System, KBMS)作为一种有效的信息管理工具,帮助企业存储、组织和检索知识。然而,传统的知识库系统往往依…

Python 文字识别OCR

一.引言 文字识别,也称为光学字符识别(Optical Character Recognition, OCR),是一种将不同形式的文档(如扫描的纸质文档、PDF文件或数字相机拍摄的图片)中的文字转换成可编辑和可搜索的数据的技术。随着技…

ximalaya(三) playUriList值解密--webpack

本文主要介绍解密音频播放url参数。 本文仅代表个人理解,如有其他建议可在评论区沟通。 声明 仅仅记录一下自己的学习方法,不作为其他参考、更不作为商业用途。如有侵犯请联系本人删除 目标地址:aHR0cHM6Ly93d3cueGltYWxheWEuY29tL3NvdW5k…

Linux之Http协议分析以及cookie和session

Linux之Http协议分析以及cookie和session 一.分析请求行与响应行1.1请求行1.1.1资源的URL路径1.1.2常见的方法1.2响应行 二.cookie和session2.1cookie2.2session 一.分析请求行与响应行 在我们简单了解了请求和响应的格式以及模拟实现了请求和响应后我们已经可以通过网页来访问…

【漫话机器学习系列】085.自助采样法(Bootstrap Sampling)

自助采样法(Bootstrap Sampling) 1. 引言 在统计学和机器学习领域,数据的充足性直接影响模型的性能。然而,在许多实际场景中,我们可能无法获得足够的数据。为了解决这个问题,自助采样法(Boots…

15vue3实战-----props和emit传值

15vue3实战-----props和emit传值 1.emit的使用2.配合props实现完整父子通信 vue3中props和emit的使用有点不一样,但万变不离其宗。 1.emit的使用 子组件: <script setup lang"ts"> // 定义触发的事件及其数据类型 const emit defineEmits([update, delete]…

nodejs - vue 视频切片上传,本地正常,线上环境导致磁盘爆满bug

nodejs 视频切片上传&#xff0c;本地正常&#xff0c;线上环境导致磁盘爆满bug 原因&#xff1a; 然后在每隔一分钟执行du -sh ls &#xff0c;发现文件变得越来越大&#xff0c;即文件下的mp4文件越来越大 最后导致磁盘直接爆满 排查原因 1、尝试将m3u8文件夹下的所有视…

金融资产配置

不要放在一个篮子里也不要放在太多篮子里&#xff1a; 尽量放在不相关的行业实现风险对冲 金融资产从风险类别上主要可以分为三类&#xff1a; 进攻型资产、稳定型资产和防守型资产 进攻型资产包括原油、股票、一级市场股权投资等 稳定型资产包括信托、理财、国债等 防守…

JavaScript 在 VSCode 中的优势与应用

JavaScript 在 VSCode 中的优势与应用 引言 随着前端技术的发展,JavaScript 已经成为了网页开发中最流行的编程语言之一。Visual Studio Code(简称 VSCode)作为一款轻量级、可扩展的代码编辑器,因其强大的功能和良好的用户体验,深受广大开发者的喜爱。本文将探讨 JavaSc…

公司配置内网穿透方法笔记

一、目的 公司内部有局域网&#xff0c;局域网上有ftp服务器&#xff0c;有windows桌面服务器&#xff1b; 在内网环境下&#xff0c;是可以访问ftp服务器以及用远程桌面登录windows桌面服务器的&#xff1b; 现在想居家办公时&#xff0c;也能访问到公司内网的ftp服务器和win…

qml前后端数据交互

在QML&#xff08;Qt Markup Language&#xff09;中进行前后端数据交互&#xff0c;通常涉及到使用Qt的C后端与QML界面进行通信。QML本身是一个声明式语言&#xff0c;负责界面和交互逻辑的部分&#xff0c;而C后端负责数据处理、逻辑控制以及与系统或网络的交互。以下是一些常…

ZU47DR 100G光纤 高性能板卡

简介 2347DR是一款最大可提供8路ADC接收和8路DAC发射通道的高性能板卡。板卡选用高性价比的Xilinx的Zynq UltraScale RFSoC系列中XCZU47DR-FFVE1156作为处理芯片&#xff08;管脚可以兼容XCZU48DR-FFVE1156&#xff0c;主要差别在有无FEC&#xff08;信道纠错编解码&#xff0…

【自然语言处理】利用Memory Layer替换Transformer中的FFN

论文地址&#xff1a;https://arxiv.org/pdf/2412.09764 相关博客 【自然语言处理】利用Memory Layer替换Transformer中的FFN 【自然语言处理】【大模型】BitNet&#xff1a;用1-bit Transformer训练LLM 【自然语言处理】BitNet b1.58&#xff1a;1bit LLM时代 【自然语言处理】…

ChunkKV:优化 KV 缓存压缩,让 LLM 长文本推理更高效

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗&#xff1f;订阅我们的简报&#xff0c;深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同&#xff0c;从行业内部的深度分析和实用指南中受益。不要错过这个机会&#xff0c;成为AI领…

k8s中部署nginx的pod

在当今数字化的浪潮中&#xff0c;容器编排技术成为了构建和管理应用程序的核心力量。Kubernetes&#xff08;简称 k8s&#xff09;作为容器编排领域的佼佼者&#xff0c;凭借其强大的自动化部署、扩展和管理能力&#xff0c;深受开发者和运维人员的青睐。而 Nginx 作为一款高性…

台湾精锐APEX减速机在半导体制造设备中的应用案例

半导体制造设备对传动系统的精度、可靠性和稳定性要求极高&#xff0c;台湾精锐APEX减速机凭借其低背隙、高精度和高刚性等优势&#xff0c;在半导体制造设备中得到了广泛应用。 案例一&#xff1a;晶圆切割设备 1.应用场景 在晶圆切割过程中&#xff0c;设备需要高精度的运…

UV - Python 包管理

文章目录 创建 uv 项目已有项目已有uv项目 创建 uv 项目 # 创建项目 uv init m3 # 创建环境 cd m3 uv venv --python 3.11 # 激活环境 source .venv/bin/activate # 添加库 uv add flask 如果创建项目后&#xff0c;给库取别的名字&#xff0c;add 的时候&#xff0c;会…

如何为win10本地部署的deepseek创建一个快捷方式

简介&#xff1a;在桌面上创建一个快捷方式&#xff0c;双击即可实现打开终端并且输入ollama run的命令。 在win10系统下&#xff0c;本地部署了deepseek之后&#xff0c;每次需要打开powershell&#xff0c;然后再手动输入指令 ollama run deepseek-r1:1.5b 要想实现一个桌面…

网安三剑客:DNS、CDN、VPN

DNS&#xff08;网络地址转换系统&#xff09;的技术原理与安全应用 1. 网络地址转换系统的基本原理 DNS通过解析用户的访问URL&#xff08;超链接&#xff09;&#xff0c;将其映射到服务器上存储的信息。具体来说&#xff1a; 解析URL&#xff1a;DNS从URL中提取出 hostna…