网站上面的小图标怎么做的建材网站设计

diannao/2026/1/16 23:59:16/文章来源:
网站上面的小图标怎么做的,建材网站设计,呼和浩特做网站的公司有哪些,江苏大才建设集团网站1、大数据流程图 2、大数据各个环节主要技术 2.1、数据处理主要技术 Sqoop#xff1a;#xff08;发音#xff1a;skup#xff09;作为一款开源的离线数据传输工具#xff0c;主要用于Hadoop(Hive) 与传统数据库#xff08;MySql,PostgreSQL#xff09;间的数据传递。它…  1、大数据流程图          2、大数据各个环节主要技术        2.1、数据处理主要技术     Sqoop发音skup作为一款开源的离线数据传输工具主要用于Hadoop(Hive) 与传统数据库MySql,PostgreSQL间的数据传递。它可以将一个关系数据库中数据导入Hadoop的HDFS中         也可以将HDFS中的数据导入关系型数据库中。     Flume实时数据采集的一个开源框架它是Cloudera提供的一个高可用用的、高可靠、分布式的海量日志采集、聚合和传输的系统。目前已经是Apache的顶级子项目。使用Flume可以收集诸如日志、时间等数据         并将这些数据集中存储起来供下游使用尤其是数据流框架例如Storm。和Flume类似的另一个框架是ScribeFaceBook开源的日志收集系统它为日志的分布式收集、统一处理提供一个可扩展的、高容错的简单方案     Kafka通常来说Flume采集数据的速度和下游处理的速度通常不同步因此实时平台架构都会用一个消息中间件来缓冲而这方面最为流行和应用最为广泛的无疑是Kafka。它是由LinkedIn开发的一个分布式消息系统         以其可以水平扩展和高吞吐率而被广泛使用。目前主流的开源分布式处理系统如Storm和Spark等都支持与Kafka 集成。         Kafka是一个基于分布式的消息发布-订阅系统特点是速度快、可扩展且持久。与其他消息发布-订阅系统类似Kafka可在主题中保存消息的信息。生产者向主题写入数据消费者从主题中读取数据。         作为一个分布式的、分区的、低延迟的、冗余的日志提交服务。和Kafka类似消息中间件开源产品还包括RabbiMQ、ActiveMQ、ZeroMQ等。       MapReduce         MapReduce是Google公司的核心计算模型它将运行于大规模集群上的复杂并行计算过程高度抽象为两个函数map和reduce。MapReduce最伟大之处在于其将处理大数据的能力赋予了普通开发人员         以至于普通开发人员即使不会任何的分布式编程知识也能将自己的程序运行在分布式系统上处理海量数据。       Hive MapReduce将处理大数据的能力赋予了普通开发人员而Hive进一步将处理和分析大数据的能力赋予了实际的数据使用人员数据开发工程师、数据分析师、算法工程师、和业务分析人员。         Hive是由Facebook开发并贡献给Hadoop开源社区的是一个建立在Hadoop体系结构上的一层SQL抽象。Hive提供了一些对Hadoop文件中数据集进行处理、查询、分析的工具。它支持类似于传统RDBMS的SQL语言         的查询语言一帮助那些熟悉SQL的用户处理和查询Hodoop在的数据该查询语言称为Hive SQL。Hive SQL实际上先被SQL解析器解析然后被Hive框架解析成一个MapReduce可执行计划         并按照该计划生产MapReduce任务后交给Hadoop集群处理。       Spark尽管MapReduce和Hive能完成海量数据的大多数批处理工作并且在打数据时代称为企业大数据处理的首选技术但是其数据查询的延迟一直被诟病而且也非常不适合迭代计算和DAG(有限无环图)计算。         由于Spark具有可伸缩、基于内存计算能特点且可以直接读写Hadoop上任何格式的数据较好地满足了数据即时查询和迭代分析的需求因此变得越来越流行。         Spark是UC Berkeley AMP Lab加州大学伯克利分校的 AMP实验室所开源的类Hadoop MapReduce的通用并行框架它拥有Hadoop MapReduce所具有的优点但不同MapReduce的是         Job中间输出结果可以保存在内存中从而不需要再读写HDFS 因此能更好适用于数据挖掘和机器学习等需要迭代的MapReduce算法。         Spark也提供类Live的SQL接口即Spark SQL来方便数据人员处理和分析数据。         Spark还有用于处理实时数据的流计算框架Spark Streaming,其基本原理是将实时流数据分成小的时间片段秒或几百毫秒以类似Spark离线批处理的方式来处理这小部分数据。       StormMapReduce、Hive和Spark是离线和准实时数据处理的主要工具而Storm是实时处理数据的。         Storm是Twitter开源的一个类似于Hadoop的实时数据处理框架。Storm对于实时计算的意义相当于Hadoop对于批处理的意义。Hadoop提供了Map和Reduce原语使对数据进行批处理变得非常简单和优美。         同样Storm也对数据的实时计算提供了简单的Spout和Bolt原语。Storm集群表面上和Hadoop集群非常像但是在Hadoop上面运行的是MapReduce的Job,而在Storm上面运行的是Topology拓扑。         Storm拓扑任务和Hadoop MapReduce任务一个非常关键的区别在于1个MapReduce Job最终会结束而1一个Topology永远运行除非显示的杀掉它所以实际上Storm等实时任务的资源使用相比离线         MapReduce任务等要大很多因为离线任务运行完就释放掉所使用的计算、内存等资源而Storm等实时任务必须一直占有直到被显式的杀掉。         Storm具有低延迟、分布式、可扩展、高容错等特性可以保证消息不丢失目前Storm, 类Storm或基于Storm抽象的框架技术是实时处理、流处理领域主要采用的技术。       Flink在数据处理领域批处理任务和实时流计算任务一般被认为是两种不同的任务一个数据项目一般会被设计为只能处理其中一种任务例如Storm只支持流处理任务而MapReduce, Hive只支持批处理任务。           Apache Flink是一个同时面向分布式实时流处理和批量数据处理的开源数据平台它能基于同一个Flink运行时Flink Runtime,提供支持流处理和批处理两种类型应用的功能。Flink在实现流处理和批处理时         与传统的一些方案完全不同它从另一个视角看待流处理和批处理将二者统一起来。Flink完全支持流处理批处理被作为一种特殊的流处理只是它的数据流被定义为有界的而已。基于同一个Flink运行时         Flink分别提供了流处理和批处理API而这两种API也是实现上层面向流处理、批处理类型应用框架的基础。       BeamGoogle开源的Beam在Flink基础上更进了一步不但希望统一批处理和流处理而且希望统一大数据处理范式和标准。Apache Beam项目重点在于数据处理的的编程范式和接口定义并不涉及具体执行引擎         的实现。Apache Beam希望基于Beam开发的数据处理程序可以执行在任意的分布式计算引擎上。         Apache Beam主要由Beam SDK和Beam Runner组成Beam SDK定义了开发分布式数据处理任务业务逻辑的API接口生成的分布式数据处理任务Pipeline交给具体的Beam Runner执行引擎。Apache Flink         目前支持的API是由Java语言实现的它支持的底层执行引擎包括Apache Flink、Apache Spark和Google Cloud Flatform。     2.2、数据存储主要技术     HDFSHadoop Distributed File System,简称FDFS是一个分布式文件系统。它有一定高度的容错性和高吞吐量的数据访问非常适合大规模数据集上的应用。HDFS提供了一个高容错性和高吞吐量的海量数据存储解决方案。         在Hadoop的整个架构中HDFS在MapReduce任务处理过程在中提供了对文件操作的和存储的的支持MapReduce在HDFS基础上实现了任务的分发、跟踪和执行等工作并收集结果两者相互作用共同完成了         Hadoop分布式集群的主要任务。     HBaseHBase是一种构建在HDFS之上的分布式、面向列族的存储系统。在需要实时读写并随机访问超大规模数据集等场景下HBase目前是市场上主流的技术选择。         HBase技术来源于Google论文《Bigtable 一个结构化数据的分布式存储系统》。如同Bigtable利用了Google File System提供的分布式数据存储方式一样HBase在HDFS之上提供了类似于Bigtable的能力。         HBase解决了传递数据库的单点性能极限。实际上传统的数据库解决方案尤其是关系型数据库也可以通过复制和分区的方法来提高单点性能极限但这些都是后知后觉的安装和维护都非常复杂。         而HBase从另一个角度处理伸缩性的问题即通过线性方式从下到上增加节点来进行扩展。         HBase 不是关系型数据库也不支持SQL它的特性如下         1、大一个表可以有上亿上上百万列。         2、面向列面向列表簇的存储和权限控制列簇独立检索。         3、稀疏为空null的列不占用存储空间因此表可以设计的非常稀疏。         4、无模式:每一行都有一个可以排序的主键和任意多的列。列可以根据需求动态增加同一张表中不同的行可以有截然不同的列。         5、数据多版本每个单元的数据可以有多个版本默认情况下版本号字段分开它是单元格插入时的时间戳。         6、数据类型单一HBase中数据都是字符串没有类型。             2.3、数据应用主要技术     数据有很多应用方式如固定报表、即时分析、数据服务、数据分析、数据挖掘和机器学习等。下面说下即时分析Drill框架、数据分析R语言、机器学习TensorFlow框架。     DrillApache Drill是一个开源实时大数据分布式查询引擎目前已成为Apache的顶级项目。Drill开源版本的Google Dremel。Dremel是Google的“交互式”数据分析系统可以组建成规模上千的集群处理PB级别的数据。        MapReduce处理数据一般在分钟甚至小时级别而Dremel将处理时间缩短至秒级即Drill是对MapReduce的有力补充。Drill兼容ANSI SQL语法作为接口支持本地文件、HDFS、Hive、HBase、MongoDb作为        存储的数据查询。文件格式支持Parquet、CSV、TSV以及Json这种无模式schema-free数据。所有这些数据都像传统数据库的表查询一样进行快速实时查询。          R语言R是一种开源的数据分析解决方案。R流行原因如下         1、R是自由软件完全免费、开源。可在官方网站及其镜像中下载任何有关的安装程序、源代码、程序包及其源代码、文档资料标准的安装文件自身就带有许多模块和内嵌统计函数安装好后可以直接实现许多           常用的统计功能。         2、R是一种可编程的语言作为一个开放的统计编程环境R语言的语法通俗易懂而且目前大多数新的统计方法和技术都可以在R中找到。         3、R具有很强的互动性除了图形输出在另外的窗口它的熟入输出都是在一个窗口进行的输入语法中如果有错马上会在窗口中给出提示对以前输入过的命令有记忆功能可以随时再现、编辑、修改以满足           用户的需要输出的图形可以直接保存为JPG、BMP、PNG等图片格式还可以直接保存为PDF文件。此外R语言和其它编程语言和数据库直接有很好的接口。       TensorFlowTensorFlow是一个非常灵活的框架它能够运行在个人电脑或服务器的单个/多个cpu和GPU上甚至是移动设备上它最早是为了研究机器学习和深度神经网络而开发的后来因为通用而开源。           TensorFlow是基于数据流图的处理框架TensorFlow节点表示数学运算边表示运算节点之间的数据交互。TensorFlow从字母意义上来讲有两层含义一是Tensor代表的是节点之间传递的数据通常这个数据           是一个多维度矩阵multidimensional data arrays或一维向量二是Flow指的数据流形象理解就是数据按照流的形式进入数据运算图的各个节点。     3、数据相关从业者和角色                         4、数据埋点     后台数据库和日志文件一般只能满足常规的统计分析对于具体的产品和项目来说一般还要根据项目的目标和分析需求进行针对性的“数据埋点”工作所谓埋点就是在额外的正常功能逻辑上添加针对性的逻辑统计即期望的   事件是否发生发生后应该记录那些信息比如用户在当前页面是否用鼠标滚动页面、有关的页面区域是否曝光了、当前的用户操作的的时间是多少、停留时长多少、这些都需要前端工程师进行针对性的埋点才能满足有关的分析需求。     数据埋点工作一般由产品经理和分析师预先确定分析需求然后由数据开发团队对接前端和后端开发完成具体的埋点工作。     参考资料《离线和实时大数据开发实战》转载于:https://www.cnblogs.com/shaosks/p/9431040.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/91256.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

西安 网站搭建最好看的网站设计

在LabVIEW应用开发和部署过程中,确保LabVIEW版本、硬件驱动和Windows版本之间的一致性和兼容性至关重要。这不仅影响程序的稳定性和性能,还关系到项目的成功实施。本文从多角度详细分析这些因素之间的兼容性问题,并提供相关建议。 兼容性考虑…

怎么自己做网站教程设计网页公司哪里好

2019独角兽企业重金招聘Python工程师标准>>> [引言] 我们在学习Java编程的时候,如果需要开发客户端窗体类型的程序,可以使用JDK中的awt和swing库。本文开始小博老师就继续为大家演示Java窗体编程中的绘图技术,今天主要讲解绘图技术…

企业网站建设合同方案有哪些网站做团购最好

P2015 二叉苹果树 题意: 一个完全二叉树,n个点,n-1个边,每个边都有边权,问保留q个边,所能保留的最大边权是多少 题解: 树形dp dp[u][i]表示u的子树上保留i条边,至多保留的苹果数…

阜阳专业网站建设区块链网站开发

本文列举常见的java定时任务实现方式,并做一定比较。1. 循环内部sleep实现周期执行创建一个thread,run() while循环里sleep()来实现周期性执行; 简单粗暴,作为一个初学者很容易想到。public class Task1 {public static void main(String[] a…

五泉山网页设计宣传网站制作兰州优化定制

2019独角兽企业重金招聘Python工程师标准>>> Java中接口、抽象类与内部类学习 接口与内部类为我们提供了一种将接口与实现分离的更加结构化的方法。 抽象类和抽象方法 抽象方法:仅有声明而没有方法体。 抽象类:包含一个或多个抽象方法的类&am…

网站建设合同表(书)vps如何做网站步骤

这篇文章将介绍如何使用Guava EventBus将更改发布到Java 7 WatchService检测到的目录或子目录中。 Guava EventBus是向应用程序添加发布/订阅通信的好方法。 Java 7 java.nio.file软件包中新增的WatchService用于监视目录中的更改。 由于EventBus和WatchService已在以前的文章中…

网站设置什么意思360建筑网一级消防

本文讨论了领导者在沟通过程中如何避免成为传声筒,通过筛选、处理和总结信息,在向上、向下沟通时保持相关性和真实性,提高沟通效率和效果。原文: The Dumbest Mistake Leaders Make in Communication 中层管理者作为高层领导、下属团队和其他…

网站建设活动广告网站建设 工作建议

我们知道,只要在一个Java类上加上Component、Service、Controller等注解,就可以被加载到Spring容器中,除了以上方式,加了Bean和Import好像也可以将对象添加到Spring容器中,究竟Spring是如何实现这些功能的呢&#xff1…

东莞外贸网站设计网页设计入门教学视频

一、python介绍python的创始人为吉多・范罗苏姆(Guido van Rossum)目前python主要应用领域:・云计算・WEB开发・科学运算、人工智能・系统运维・金融:量化交易,金融分析等,作为动态语言的python,语言结构清晰简单&…

绍兴网站推广福永网站建设公司

背景互联网时代的数据重要性不言而喻,任何数据的丢失都会给企事业单位、政府机关等造成无法计算和无法弥补的损失,尤其随着云计算和大数据时代的到来,数据中心的规模日益增大,环境更加复杂,云上客户群体越来越庞大&…

国外做储物柜的网站wordpress功能小工具栏

落地灯对于上班族、学生党来说真的很友好,能够提供贴合眼睛用光舒适的光度,使这些日常长时间用眼的人能够减少不良光线对眼睛造成的影响,从而科学健康的用眼! 市面上的落地灯产品越来越多,琳琅满目的产品让不少刚接触落…

环保设备网站建设模板舆情网站直接打开怎么弄

在最后的社区主题演讲后,我前往希尔顿金门大桥3/4/5观看了维克多巴生 ( Viktor Klang )的( Typesafe )“上,下,外:Akka”演讲。 巴生(Klang)是Akka的技术主管…

烟台网站制作工具什么样的网站好优化

在很多python脚本中在最后的部分会执行一个判断语句if __name__ "__main__:",之后还可能会有一些执行语句。那添加这个判断的目的何在? 在python编译器读取源文件的时候会执行它找到的所有代码,而在执行之前会根据当前运行的模块是…

织梦搬家 网站空白网站建设的平台分析

save和saveOrUpdate之间的区别是什么或save和persist之间的区别是任何Hibernate面试中常见的面试问题,就像Hibernate中get和load方法之间的区别一样。 Hibernate Session类提供了几种通过save , saveOrUpdate和persist等方法将对象保存到数据库中的方法。…

网站建设核心点tp框架做餐饮网站

ConfigurableListableBeanFactory 提供bean definition的解析,注册功能,再对单例来个预加载(解决循环依赖问题). 貌似我们一般开发就会直接定义这么个接口了事.而不是像Spring这样先根据使用情况细分那么多,到这边再合并 ConfigurableListableBeanFactory具体: 1、…

做公司网站的费用计入什么科目wordpress图片添加音乐

泽宇对自己的研究方向也就是知识图谱嵌入(KG Embedding)技术进行了总结,并制作了一套slides,力求让大家只看slides就可以理解并掌握知识图谱嵌入的相关知识和最新研究情况,包括知识图谱嵌入的基本概念、方法分类和经典…

给公司建立网站不可以做到的网络架构图怎么画

目录 0 引言1 函数指针模拟多播委托 🙋‍♂️ 作者:海码007📜 专栏:UE虚幻引擎专栏💥 标题:【UE 委托】如何利用函数指针理解委托的基本原理❣️ 寄语:书到用时方恨少,事非经过不知难…

公司网站维护一般需要做什么大数据技术建设网站

共享指针是 C 中一种智能指针,用于管理动态内存。它可以有效防止内存泄漏和悬空指针问题。在实际项目中,共享指针有以下几种常见的用法: 1. 管理对象的生命周期 共享指针可以用来管理对象的生命周期。当最后一个共享指针指向的对象时&#…

设计师网站 pins东营刚刚发生

目录 1.软件与平面基础 2.互联网插画 3.互联网运营设计 4.C4D三维制作 5.UI设计基础

新乡模板建站WordPress输出当前网址

一个程序被加载到内存当中运作,那么在内存内的那个数据就被称为进程(process)。 进程是操作系统上非常重要的概念,所有系统上面跑的数据都会以进程的型态存在。 进程 在 Linux底下所有的指令与能够进行的动作都与权限有关,而系统如何判定权…