Spark核心之01:架构部署、sparkshell、程序模板

spark内存计算框架

在这里插入图片描述

一、主题

  1. spark核心概念
  2. spark集群架构
  3. spark集群安装部署
  4. spark-shell的使用
  5. 通过IDEA开发spark程序

二、要点

1. spark是什么

  • Apache Spark™ is a unified analytics engine for large-scale data processing.

  • spark是针对于大规模数据处理的统一分析引擎

spark是在Hadoop基础上的改进,是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的map reduce的算法。
spark是基于内存计算框架,计算速度非常之快,但是它仅仅只是涉及到计算,并没有涉及到数据的存储,后期需要使用spark对接外部的数据源,比如hdfs。

2. spark的四大特性

2.1 速度快

在这里插入图片描述

  • 运行速度提高100倍

    • Apache Spark使用最先进的DAG调度程序,查询优化程序和物理执行引擎,实现批量和流式数据的高性能。
  • spark比mapreduce快的2个主要原因

    • 1、基于内存

      (1)mapreduce任务后期再计算的时候,每一个job的输出结果会落地到磁盘,后续有其他的job需要依赖于前面job的输出结果,这个时候就需要进行大量的磁盘io操作。性能就比较低。
      (2)spark任务后期再计算的时候,job的输出结果可以保存在内存中,后续有其他的job需要依赖于前面job的输出结果,这个时候就直接从内存中获取得到,避免了磁盘io操作,性能比较高

    • 2、进程与线程

      spark任务以线程的方式运行在Executor进程中

      (1)mapreduce任务以进程的方式运行在yarn集群中,比如程序中有100个MapTask,一个task就需要一个进程,这些task要运行就需要开启100个进程。
      (2)spark任务以线程的方式运行在进程中,比如程序中有100个MapTask,后期一个task就对应一个线程,这里就不在是进程,这些task需要运行,这里可以极端一点:
      只需要开启1个进程,在这个进程中启动100个线程就可以了。
      进程中可以启动很多个线程,而开启一个进程与开启一个线程需要的时间和调度代价是不一样。 开启一个进程需要的时间远远大于开启一个线程。

2.2 易用性

在这里插入图片描述

  • 可以快速去编写spark程序通过 java/scala/python/R/SQL等不同语言
2.3 通用性

在这里插入图片描述

  • spark框架不在是一个简单的框架,可以把spark理解成一个==生态系统==,它内部是包含了很多模块,基于不同的应用场景可以选择对应的模块去使用
    • sparksql
      • 通过sql去开发spark程序做一些离线分析
    • sparkStreaming
      • 主要是用来解决公司有实时计算的这种场景
    • Mlib
      • 它封装了一些机器学习的算法库
    • Graphx
      • 图计算
2.4 兼容性

在这里插入图片描述

  • spark程序就是一个计算逻辑程序,这个任务要运行就需要计算资源(内存、cpu、磁盘),哪里可以给当前这个任务提供计算资源,就可以把spark程序提交到哪里去运行
    • standAlone
      • 它是spark自带的独立运行模式,整个任务的资源分配由spark集群的老大Master负责
    • yarn
      • 可以把spark程序提交到yarn中运行,整个任务的资源分配由yarn中的老大ResourceManager负责
    • mesos
      • 它也是apache开源的一个类似于yarn的资源调度平台

⭐️3. spark集群架构

在这里插入图片描述

  • Driver

    • 它会执行客户端写好的main方法,它会构建一个名叫SparkContext对象
      • 该对象是所有spark程序的执行入口
  • Application

    • 就是一个spark的应用程序,它是包含了客户端的代码和任务运行的资源信息
  • ⭐️ClusterManager

  • 它是给程序提供计算资源的外部服务

    • standAlone
      • 它是spark自带的集群模式,整个任务的资源分配由spark集群的老大Master负责
    • yarn
      • 可以把spark程序提交到yarn中运行,整个任务的资源分配由yarn中的老大ResourceManager负责
    • mesos
      • 它也是apache开源的一个类似于yarn的资源调度平台。
  • Master

    • 它是整个spark集群的主节点,负责任务资源的分配
  • Worker

    • 它是整个spark集群的从节点,负责任务计算的节点
  • Executor

    • 它是一个进程,它会在worker节点启动该进程(计算资源)
  • Task

    • spark任务是以task线程的方式运行在worker节点对应的executor进程中

4. spark集群安装部署

  • 事先搭建好zookeeper集群
  • 1、下载安装包

    • https://archive.apache.org/dist/spark/spark-2.3.3/spark-2.3.3-bin-hadoop2.7.tgz
    • spark-2.3.3-bin-hadoop2.7.tgz
  • 2、规划安装目录

    • /kkb/install
  • 3、上传安装包到服务器

  • 4、解压安装包到指定的安装目录

    • tar -zxvf spark-2.3.3-bin-hadoop2.7.tgz -C /kkb/install
  • 5、重命名解压目录

    • mv spark-2.3.3-bin-hadoop2.7 spark
  • 6、修改配置文件

    • 进入到spark的安装目录下对应的conf文件夹

      • vim spark-env.sh ( mv spark-env.sh.template spark-env.sh)

        #配置java的环境变量
        export JAVA_HOME=/kkb/install/jdk1.8.0_141
        #配置zk相关信息
        export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER  -Dspark.deploy.zookeeper.url=node01:2181,node02:2181,node03:2181  -Dspark.deploy.zookeeper.dir=/spark"
        
      • vim slaves ( mv slaves.template slaves)

        #指定spark集群的worker节点
        node02
        node03
        
  • 7、分发安装目录到其他机器

    scp -r /kkb/install/spark node02:/kkb/install
    scp -r /kkb/install/spark node03:/kkb/install
    
  • 8、修改spark环境变量

    • vim /etc/profile

      export SPARK_HOME=/kkb/install/spark
      export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin
      
  • 9、分发spark环境变量到其他机器

    scp /etc/profile node02:/etc
    scp /etc/profile node03:/etc
    
  • 10、让所有机器的spark环境变量生效

    • 在所有节点执行
      • source /etc/profile

5. spark集群的启动和停止

5.1 启动
  • 1、先启动zk
  • 2、启动spark集群
    • 可以在任意一台服务器来执行(条件:需要任意2台机器之间实现ssh免密登录)
      • $SPARK_HOME/sbin/start-all.sh
      • 在哪里启动这个脚本,就在当前该机器启动一个Master进程
      • 整个集群的worker进程的启动由slaves文件
    • 后期可以在其他机器单独在启动master
      • $SPARK_HOME/sbin/start-master.sh

⭐️⭐️

(1) 如何恢复到上一次活着master挂掉之前的状态?在高可用模式下,整个spark集群就有很多个master,其中只有一个master被zk选举成活着的master,其他的多个master都处于standby,同时把整个spark集群的元数据信息通过zk中节点进行保存。后期如果活着的master挂掉。首先zk会感知到活着的master挂掉,下面开始在多个处于standby中的master进行选举,再次产生一个活着的master,这个活着的master会读取保存在zk节点中的spark集群元数据信息,恢复到上一次master的状态。整个过程在恢复的时候经历过了很多个不同的阶段,每个阶段都需要一定时间,最终恢复到上个活着的master的转态,整个恢复过程一般需要1-2分钟。(2) 在master的恢复阶段对任务的影响?a)对已经运行的任务是没有任何影响由于该任务正在运行,说明它已经拿到了计算资源,这个时候就不需要master。b) 对即将要提交的任务是有影响由于该任务需要有计算资源,这个时候会找活着的master去申请计算资源,由于没有一个活着的master,该任务是获取不到计算资源,也就是任务无法运行。
5.2 停止
  • 在处于active Master主节点执行

    • $SPARK_HOME/sbin/stop-all.sh
  • 在处于standBy Master主节点执行

    • $SPARK_HOME/sbin/stop-master.sh

6. spark集群的web管理界面

  • 当启动好spark集群之后,可以访问这样一个地址
    • http://master主机名:8080
    • 可以通过这个web界面观察到很多信息
      • 整个spark集群的详细信息
      • 整个spark集群总的资源信息
      • 整个spark集群已经使用的资源信息
      • 整个spark集群还剩的资源信息
      • 整个spark集群正在运行的任务信息
      • 整个spark集群已经完成的任务信息

在这里插入图片描述

7. 初识spark程序

⭐️7.1 普通模式提交 (指定活着的master地址)
bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master spark://node01:7077 \
--executor-memory 1G \
--total-executor-cores 2 \
examples/jars/spark-examples_2.11-2.3.3.jar \
10####参数说明
--class:指定包含main方法的主类
--master:指定spark集群master地址
--executor-memory:指定任务在运行的时候需要的每一个executor内存大小
--total-executor-cores: 指定任务在运行的时候需要总的cpu核数
⭐️7.2 高可用模式提交 (集群有很多个master)
bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master spark://node01:7077,node02:7077,node03:7077 \
--executor-memory 1G \
--total-executor-cores 2 \
examples/jars/spark-examples_2.11-2.3.3.jar \
10spark集群中有很多个master,并不知道哪一个master是活着的master,即使你知道哪一个master是活着的master,它也有可能下一秒就挂掉,这里就可以把所有master都罗列出来
--master spark://node01:7077,node02:7077,node03:7077后期程序会轮训整个master列表,最终找到活着的master,然后向它申请计算资源,最后运行程序。

8. spark-shell使用

8.1 运行spark-shell --master local[N] 读取本地文件进行单词统计
  • –master local[N]

    • local 表示程序在本地进行计算,跟spark集群目前没有任何关系
    • N 它是一个正整数,表示使用N个线程参与任务计算
    • local[N] 表示本地采用N个线程计算任务
  • spark-shell --master local[2]

    • 默认会产生一个SparkSubmit进程
    sc.textFile("file:///home/hadoop/words.txt").flatMap(x=>x.split(" ")).map(x=>(x,1)).reduceByKey((x,y)=>x+y).collectsc.textFile("file:///home/hadoop/words.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).collect
    
8.2 运行spark-shell --master local[N] 读取HDFS上文件进行单词统计
  • spark整合HDFS

    • 在node01上修改配置文件
      • vim spark-env.sh
    export HADOOP_CONF_DIR=/kkb/install/hadoop-2.6.0-cdh5.14.2/etc/hadoop
    
    • 分发到其他节点
    scp spark-env.sh node02:/kkb/install/spark/conf
    scp spark-env.sh node03:/kkb/install/spark/conf
    
  • spark-shell --master local[2]

    sc.textFile("/words.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).collectsc.textFile("hdfs://node01:8020/words.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).collect
    
8.3 运行spark-shell 指定集群中活着master 读取HDFS上文件进行单词统计
  • spark-shell --master spark://node01:7077 --executor-memory 1g --total-executor-cores 4

    • –master spark://node01:7077
      • 指定活着的master地址
    • –executor-memory 1g
      • 指定每一个executor进程的内存大小
    • –total-executor-cores 4
      • 指定总的executor进程cpu核数
    sc.textFile("hdfs://node01:8020/words.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).collect//实现读取hdfs上文件之后,需要把计算的结果保存到hdfs上
    sc.textFile("/words.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).saveAsTextFile("/out")
    

9. 通过IDEA开发spark程序

  • 构建maven工程,添加pom依赖

     <dependencies><dependency><groupId>org.apache.spark</groupId><artifactId>spark-core_2.11</artifactId><version>2.3.3</version></dependency>
    </dependencies><build><sourceDirectory>src/main/scala</sourceDirectory><testSourceDirectory>src/test/scala</testSourceDirectory><plugins><plugin><groupId>net.alchim31.maven</groupId><artifactId>scala-maven-plugin</artifactId><version>3.2.2</version><executions><execution><goals><goal>compile</goal><goal>testCompile</goal></goals><configuration><args><arg>-dependencyfile</arg><arg>${project.build.directory}/.scala_dependencies</arg></args></configuration></execution></executions></plugin><plugin><groupId>org.apache.maven.plugins</groupId><artifactId>maven-shade-plugin</artifactId><version>2.4.3</version><executions><execution><phase>package</phase><goals><goal>shade</goal></goals><configuration><filters><filter><artifact>*:*</artifact><excludes><exclude>META-INF/*.SF</exclude><exclude>META-INF/*.DSA</exclude><exclude>META-INF/*.RSA</exclude></excludes></filter></filters><transformers><transformer implementation="org.apache.maven.plugins.shade.resource.ManifestResourceTransformer"><mainClass></mainClass></transformer></transformers></configuration></execution></executions></plugin></plugins></build>
    
  • 创建 src/main/scala 和 src/test/scala 目录

在这里插入图片描述

9.1 利用scala语言开发spark程序实现单词统计–本地运行
  • 代码开发
package com.kaikebaimport org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}//todo: 利用scala语言开发spark程序实现单词统计
object WordCount {def main(args: Array[String]): Unit = {//1、构建sparkConf对象 设置application名称和master地址val sparkConf: SparkConf = new SparkConf().setAppName("WordCount").setMaster("local[2]")//2、构建sparkContext对象,该对象非常重要,它是所有spark程序的执行入口// 它内部会构建  DAGScheduler和 TaskScheduler 对象val sc = new SparkContext(sparkConf)//设置日志输出级别sc.setLogLevel("warn")//3、读取数据文件val data: RDD[String] = sc.textFile("E:\\words.txt")//4、 切分每一行,获取所有单词val words: RDD[String] = data.flatMap(x=>x.split(" "))//5、每个单词计为1val wordAndOne: RDD[(String, Int)] = words.map(x => (x,1))//6、相同单词出现的1累加val result: RDD[(String, Int)] = wordAndOne.reduceByKey((x,y)=>x+y)//按照单词出现的次数降序排列  第二个参数默认是true表示升序,设置为false表示降序val sortedRDD: RDD[(String, Int)] = result.sortBy( x=> x._2,false)//7、收集数据打印val finalResult: Array[(String, Int)] = sortedRDD.collect()finalResult.foreach(println)//8、关闭scsc.stop()}
}
9.2 利用scala语言开发spark程序实现单词统计–集群运行
  • 代码开发
package com.kaikeba
import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}//todo: 利用scala语言开发spark程序实现单词统计
object WordCountOnSpark {def main(args: Array[String]): Unit = {//1、构建sparkConf对象 设置application名称val sparkConf: SparkConf = new SparkConf().setAppName("WordCountOnSpark")//2、构建sparkContext对象,该对象非常重要,它是所有spark程序的执行入口// 它内部会构建  DAGScheduler和 TaskScheduler 对象val sc = new SparkContext(sparkConf)//设置日志输出级别sc.setLogLevel("warn")//3、读取数据文件val data: RDD[String] = sc.textFile(args(0))//4、 切分每一行,获取所有单词val words: RDD[String] = data.flatMap(x=>x.split(" "))//5、每个单词计为1val wordAndOne: RDD[(String, Int)] = words.map(x => (x,1))//6、相同单词出现的1累加val result: RDD[(String, Int)] = wordAndOne.reduceByKey((x,y)=>x+y)//7、把计算结果保存在hdfs上result.saveAsTextFile(args(1))//8、关闭scsc.stop()}
}
  • 打成jar包提交到集群中运行
spark-submit \
--master spark://node01:7077,node02:7077 \
--class com.kaikeba.WordCountOnSpark \
--executor-memory 1g  \
--total-executor-cores 4 \
original-spark_class01-1.0-SNAPSHOT.jar \
/words.txt  /out
9.3 利用java语言开发spark程序实现单词统计–本地运行
  • 代码开发
package com.kaikeba;import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaPairRDD;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.FlatMapFunction;
import org.apache.spark.api.java.function.Function2;
import org.apache.spark.api.java.function.PairFunction;
import scala.Tuple2;import java.util.Arrays;
import java.util.Iterator;
import java.util.List;//todo: 利用java语言开发spark的单词统计程序
public class JavaWordCount {public static void main(String[] args) {//1、创建SparkConf对象SparkConf sparkConf = new SparkConf().setAppName("JavaWordCount").setMaster("local[2]");//2、构建JavaSparkContext对象JavaSparkContext jsc = new JavaSparkContext(sparkConf);//3、读取数据文件JavaRDD<String> data = jsc.textFile("E:\\words.txt");//4、切分每一行获取所有的单词   scala:  data.flatMap(x=>x.split(" "))JavaRDD<String> wordsJavaRDD = data.flatMap(new FlatMapFunction<String, String>() {public Iterator<String> call(String line) throws Exception {String[] words = line.split(" ");return Arrays.asList(words).iterator();}});//5、每个单词计为1    scala:  wordsJavaRDD.map(x=>(x,1))JavaPairRDD<String, Integer> wordAndOne = wordsJavaRDD.mapToPair(new PairFunction<String, String, Integer>() {public Tuple2<String, Integer> call(String word) throws Exception {return new Tuple2<String, Integer>(word, 1);}});//6、相同单词出现的1累加    scala:  wordAndOne.reduceByKey((x,y)=>x+y)JavaPairRDD<String, Integer> result = wordAndOne.reduceByKey(new Function2<Integer, Integer, Integer>() {public Integer call(Integer v1, Integer v2) throws Exception {return v1 + v2;}});//按照单词出现的次数降序 (单词,次数)  -->(次数,单词).sortByKey----> (单词,次数)JavaPairRDD<Integer, String> reverseJavaRDD = result.mapToPair(new PairFunction<Tuple2<String, Integer>, Integer, String>() {public Tuple2<Integer, String> call(Tuple2<String, Integer> t) throws Exception {return new Tuple2<Integer, String>(t._2, t._1);}});JavaPairRDD<String, Integer> sortedRDD = reverseJavaRDD.sortByKey(false).mapToPair(new PairFunction<Tuple2<Integer, String>, String, Integer>() {public Tuple2<String, Integer> call(Tuple2<Integer, String> t) throws Exception {return new Tuple2<String, Integer>(t._2, t._1);}});//7、收集打印List<Tuple2<String, Integer>> finalResult = sortedRDD.collect();for (Tuple2<String, Integer> t : finalResult) {System.out.println("单词:"+t._1 +"\t次数:"+t._2);}jsc.stop();}
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/71116.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何通过Python网络爬虫技术应对复杂的反爬机制?

要使用Python网络爬虫技术绕过复杂的反爬虫机制&#xff0c;可以采取以下几种策略&#xff1a; 设置User-Agent&#xff1a;通过设置不同的User-Agent&#xff0c;模拟正常用户的浏览器访问&#xff0c;避免被网站识别为爬虫。可以使用fake_useragent库来随机生成User-Agent。…

[Windows] 批量为视频或者音频生成字幕 video subtitle master 1.5.2

Video Subtitle Master 1.5.2 介绍 Video Subtitle Master 1.5.2 是一款功能强大的客户端工具&#xff0c;能够批量为视频或音频生成字幕&#xff0c;还支持批量将字幕翻译成其他语言。该工具具有跨平台性&#xff0c;无论是 mac 系统还是 windows 系统都能使用。 参考原文&a…

神经网络代码入门解析

神经网络代码入门解析 import torch import matplotlib.pyplot as pltimport randomdef create_data(w, b, data_num): # 数据生成x torch.normal(0, 1, (data_num, len(w)))y torch.matmul(x, w) b # 矩阵相乘再加bnoise torch.normal(0, 0.01, y.shape) # 为y添加噪声…

DeepSeek 开源狂欢周(一)FlashMLA:高效推理加速新时代

上周末&#xff0c;DeepSeek在X平台&#xff08;Twitter&#xff09;宣布将开启连续一周的开源&#xff0c;整个开源社区为之沸腾&#xff0c;全球AI爱好者纷纷为关注。没错&#xff0c;这是一场由DeepSeek引领的开源盛宴&#xff0c;推翻了传统推理加速的种种限制。这周一&…

EfficientViT模型详解及代码复现

核心架构 在EfficientViT模型的核心架构中,作者设计了一种创新的 sandwich布局 作为基础构建块,旨在提高内存效率和计算效率。这种布局巧妙地平衡了自注意力层和前馈神经网络层的比例,具体结构如下: 基于深度卷积的Token Interaction :通过深度卷积操作对输入特征进行初步…

大语言模型(LLM)如何赋能时间序列分析?

引言 近年来&#xff0c;大语言模型&#xff08;LLM&#xff09;在文本生成、推理和跨模态任务中展现了惊人能力。与此同时&#xff0c;时间序列分析作为工业、金融、物联网等领域的核心技术&#xff0c;长期依赖传统统计模型&#xff08;如ARIMA&#xff09;或深度学习模型&a…

Java 设计模式:软件开发的精髓与艺

目录 一、设计模式的起源二、设计模式的分类1. 创建型模式2. 结构型模式3. 行为型模式三、设计模式的实践1. 单例模式2. 工厂模式3. 策略模式四、设计模式的优势五、设计模式的局限性六、总结在软件开发的浩瀚星空中,设计模式犹如一颗颗璀璨的星辰,照亮了开发者前行的道路。它…

【基于Raft的KV共识算法】-序:Raft概述

本文目录 1.为什么会有Raft&#xff1f;CAP理论 2.Raft基本原理流程为什么要以日志作为中间载体&#xff1f; 3.实现思路任期领导选举日志同步 1.为什么会有Raft&#xff1f; 简单来说就是数据会随着业务和时间的增长&#xff0c;单机不能存的下&#xff0c;这个时候需要以某种…

【愚公系列】《Python网络爬虫从入门到精通》040-Matplotlib 概述

标题详情作者简介愚公搬代码头衔华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,亚马逊技领云博主,51CTO博客专家等。近期荣誉2022年度…

EasyRTC嵌入式WebRTC技术与AI大模型结合:从ICE框架优化到AI推理

实时通信技术在现代社会中扮演着越来越重要的角色&#xff0c;从视频会议到在线教育&#xff0c;再到远程医疗&#xff0c;其应用场景不断拓展。WebRTC作为一项开源项目&#xff0c;为浏览器和移动应用提供了便捷的实时通信能力。而EasyRTC作为基于WebRTC的嵌入式解决方案&…

javaEE初阶————多线程初阶(5)

本期是多线程初阶的最后一篇文章了&#xff0c;下一篇就是多线程进阶的文章了&#xff0c;大家加油&#xff01; 一&#xff0c;模拟实现线程池 我们上期说过线程池类似一个数组&#xff0c;我们有任务就放到线程池中&#xff0c;让线程池帮助我们完成任务&#xff0c;我们该如…

工业AR眼镜的‘芯’动力:FPC让制造更智能【新立电子】

随着增强现实&#xff08;AR&#xff09;技术的快速发展&#xff0c;工业AR智能眼镜也正逐步成为制造业领域的重要工具。它不仅为现场工作人员提供了视觉辅助&#xff0c;还极大地提升了远程协助的效率、优化了仓储管理。FPC在AI眼镜中的应用&#xff0c;为工业AR智能眼镜提供了…

FPGA开发,使用Deepseek V3还是R1(5):temperature设置

以下都是Deepseek生成的答案 FPGA开发&#xff0c;使用Deepseek V3还是R1&#xff08;1&#xff09;&#xff1a;应用场景 FPGA开发&#xff0c;使用Deepseek V3还是R1&#xff08;2&#xff09;&#xff1a;V3和R1的区别 FPGA开发&#xff0c;使用Deepseek V3还是R1&#x…

网站内容更新后百度排名下降怎么办?有效策略有哪些?

转自 网站内容更新后百度排名下降怎么办&#xff1f;有效策略有哪些&#xff1f; 网站内容更新是促进网站优化的关键环节&#xff0c;但是频繁修改网站内容会对网站的搜索引擎排名造成很大的影响。为了保持网站排名&#xff0c;我们需要采取一些措施来最小化对百度排名的影响。…

安装 cpolar 内网穿透工具的步骤

安装 cpolar 内网穿透工具的步骤 1. 下载 cpolar 软件安装包 步骤&#xff1a; 前往 cpolar 官方下载页面。 根据您的操作系统&#xff08;Windows、macOS、Linux 等&#xff09;&#xff0c;选择对应的安装包进行下载。 2. 注册 cpolar 账号 步骤&#xff1a; 访问 cpolar…

Linux :进程状态

目录 1 引言 2 操作系统的资源分配 3进程状态 3.1运行状态 3.2 阻塞状态 3.3挂起状态 4.进程状态详解 4.1 运行状态R 4.2 休眠状态S 4.3深度睡眠状态D 4.4僵尸状态Z 5 孤儿进程 6 进程优先级 其他概念 1 引言 &#x1f33b;在前面的文章中&#xff0c;我们已…

openwebUI访问vllm加载deepseek微调过的本地大模型

文章目录 前言一、openwebui安装二、配置openwebui环境三、安装vllm四、启动vllm五、启动openwebui 前言 首先安装vllm&#xff0c;然后加载本地模型&#xff0c;会起一个端口好。 在安装openwebui,去访问这个端口号。下面具体步骤的演示。 一、openwebui安装 rootautodl-co…

DeepSeek-V3:AI语言模型的高效训练与推理之路

参考&#xff1a;【论文学习】DeepSeek-V3 全文翻译 在人工智能领域&#xff0c;语言模型的发展日新月异。从早期的简单模型到如今拥有数千亿参数的巨无霸模型&#xff0c;技术的进步令人瞩目。然而&#xff0c;随着模型规模的不断扩大&#xff0c;训练成本和推理效率成为了摆在…

Spring单例模式 Spring 中的单例 饿汉式加载 懒汉式加载

目录 核心特性 实现方式详解 1. 饿汉式&#xff08;Eager Initialization&#xff09; 2. 懒汉式&#xff08;Lazy Initialization&#xff09; 3. 静态内部类&#xff08;Bill Pugh 实现&#xff09; 4. 枚举&#xff08;Enum&#xff09; 破坏单例的场景及防御 Sprin…

DeepSeek MLA(Multi-Head Latent Attention)算法浅析

目录 前言1. 从MHA、MQA、GQA到MLA1.1 MHA1.2 瓶颈1.3 MQA1.4 GQA1.5 MLA1.5.1 Part 11.5.2 Part 21.5.3 Part 3 结语参考 前言 学习 DeepSeek 中的 MLA 模块&#xff0c;究极缝合怪&#xff0c;东抄抄西抄抄&#xff0c;主要 copy 自苏神的文章&#xff0c;仅供自己参考&#…