如何做网站稳定客户网站设计工资

diannao/2025/10/16 11:35:14/文章来源:
如何做网站稳定客户,网站设计工资,wordpress pot 翻译,vi应用设计apache spark迁移到Apache Spark之前需要了解的5件事 似乎每个人都只是在谈论最热门的新技术#xff0c;而忽略采用它的实际含义。 但这是自然的#xff0c;对吧#xff1f; 新功能和承诺胜过其他所有事物#xff0c;而艰难的挑战和决​​定被抛在一边。 这次不行。 软件… apache spark 迁移到Apache Spark之前需要了解的5件事 似乎每个人都只是在谈论最热门的新技术而忽略采用它的实际含义。 但这是自然的对吧 新功能和承诺胜过其他所有事物而艰难的挑战和决​​定被抛在一边。 这次不行。 软件架构很难权衡是游戏的名称。 在本文中我们想退后一步看看执行从头开始转向Spark的决定的真正含义。 非常感谢Kenshoo的开发人员和系统架构师Tzach Zohar 他在本博文中与我们分享了他的经验。 为什么还要烦恼呢 如果您从一个可以从分布式数据分析中受益的全新项目开始无论是批处理分析还是精简分析Spark都已将其优势确立为MapReduce的最佳实现。 主要是因为它使用内存处理的方式。 否则如果您在一台服务器上获得了所需的吞吐量并且使用的数据不会超出该范围那么最好避免使用分布式的复杂性。 请注意我们甚至一次都没有说过大数据。 哦 此外Spark具有一个很棒且易于使用的机器学习库。 Spark与Hadoop 尽管您的起点很可能是您已经拥有的现有解决方案但这会使事情变得多余。 我们将把重点放在那上面。 在难以扩展的数据库之上从Hadoop或本地解决方案迁移。 性能的提高最终可以减少硬件成本提高生产力或者实际上只是摆脱尝试做的事情的唯一方法。 最大的好处来自批次分析的角度因此如果这是您的用例–升级集群将变得更加紧迫。 在Kenshoo的情况下单服务器MySQL解决方案已绰绰有余。 但是随着公司的发展和几年的过去这已经不够了–每天要处理成千上万条记录数百张表较大记录上的十亿条记录以及TB级的数据。 不再是堪萨斯州了 。 有一点是您无法进行所有优化甚至TokuDB之类的高性能存储引擎也无法实现。 您最终要做的是在类固醇上安装了一个突变MySQL。 在海岸的另一边有Spark公司它解决了各种各样的问题这些新问题却是长期存在的原则并得到社区的Swift采用和许多积极的信号。 1. HDFS与Cassandra与S3 您为Apache Spark选择的存储服务器应该反映出您对系统最看重的东西。 这里的3个常见选项是Hadoop的HDFSApache Cassandra和Amazon的S3。 当数据局部性不是很关键时S3适合非常特定的用例。 例如每天运行一次的作业或者实际上不需要任何数据和处理能力来共享机器的任何事情。 没有紧迫的工作。 至于HDFS与Cassandra的问题运行HDFS的硬件成本较低因为它旨在解决更简单的用例。 多低 高达10倍。 主要区别在于HDFS解决了分布式文件系统运行的问题而Cassandra专门设计为高吞吐量键值存储。 尽管成本较高但Cassandra在交互式流数据分析方面处于优势地位–与运行批处理作业相反。 您可以说HDFS喜欢大文件而Cassandra不必加载所有数据仅使用所需的数据即可访问 S3 –非紧急批处理作业。 Cassandra –非常适合流数据分析并且对批处理作业有过高的要求。 HDFS –非常适合批处理作业而不会影响数据局部性。 2.绿地与重构 好吧所以您现在决定迁移到Spark您应该从全新的项目开始还是基于当前应用程序进行重构 每个人都有自己的警告Kenshoo决定放弃绿地之路以重构其当前系统。 该决定缩小为四个因素 避免移动目标场景 –从头开始构建新系统需要花费时间和数月的开发时间。 在此期间旧系统也在发生变化因此您的规范实际上是随时间变化的移动目标。 零差异容限 –新系统应达到与旧系统相同的结果对吗 听起来很简单的过程是一个变相的问题。 经过多年的发展针对特定分析过程的各种怪癖和定制已被硬编码到较旧的应用程序中。 例如某些假设四舍五入的结果以及来自各个客户的请求-已经创建了一个复杂的分析过程很难从头开始重新创建。 代码是唯一的规范 –文档很有可能……不存在。 如果确实存在则很可能不能反映系统的当前状态。 这是您可能与代码中的那些黑角有关的示例 “不应该”发生的东西但是会发生吗 测试重用 –您当前的测试与较旧的实现结合在一起并采用不同的设置。 这里的另一个任务是重写它们以匹配新的实现。 底线在这种情况下重构而不是完全重新启动是最有意义的。 3.重构挑战 选择重构路径还面临挑战未经测试的遗留代码与其他系统组件的紧密耦合以及新体系结构的范式转换。 从相似的Hadoop架构进行切换比在单节点应用程序上进入分布式系统路径更容易。 有很多新的知识要学习要有调整的过程还有很多摩擦。 不论是否新建项目这都是艰巨的任务但是如果您确定这是值得的–隧道尽头便是一盏灯。 在Kenshoo的案例中他们的任务是从一个拥有8年历史的庞大系统中释放瓶颈聚合器组件。 聚合器偶尔对数据执行批处理并通过不同的键将其分组。 底线在移动之前预先了解您的弱点并确保针对新实现中的关键路径具有解决方案。 4.解决方法 4.1。 核心业务规则至上 重构的主要好处之一当然是代码重用。 构建新系统的第一步是首先遵循核心业务规则并从中创建一个独立的jar。 这些方法被重构为Java静态方法以避免Spark中的序列化问题。 4.2。 Dropwizard指标和复杂的遗留代码 继续前进还记得“不应该发生”的例子吗 Kenshoo使用Dropwizard Metrics计数器进行装配 你知道什么。 确实发生了很多 发生…..“这不应该发生” 底线事实证明使用度量标准来度量遗留代码中的未知数是一个功能强大的工具它可以将“隐藏”功能转变为明确的经过良好记录和经过良好测试的功能。 4.3。 本地模式测试 为了应对测试挑战Kenshoo充分利用了Spark的本地模式并从中汲取了灵感–在新的聚合组件中创建了一个类似Spark的嵌入式实例。 而且他们然后采用了这个新组件并将其嵌入到旧系统中重用了较早的测试并确保新系统满足所有要求 4.4。 石墨“ diffRecorder” 除了本地模式测试之外最后的领域是测试生产中的实际数据并查看Spark结果是否与旧系统的结果匹配。 为此实现了与Graphite可视化挂钩的“ diffRecorder”。 差异记录器将这两个版本不同的每个实际输入表示为Graphite Metric石墨度量精确指出新实现不一致的确切输入。 生成的数据有助于了解需要进行哪些调整以匹配旧系统或发现系统中的隐藏故障。 顺便说一句要了解有关Graphite的更多信息可以查看有关为系统选择最佳Graphite体系结构的文章 。 Kenshoo的Graphite仪表板 5.火花监控 Spark与Graphite紧密集成您可以在其中绘制任何您想要的图形。 除此之外这里的第二个工具是Spark Web UI用于查看您的作业和性能指标。 任何严肃的Spark部署都需要在性能和监视方面投入大量精力。 这可能会成为一个非常棘手的问题您需要熟悉内部结构才能调整系统。 为Spark编写代码很容易但是性能又增加了另一层复杂性。 从这个意义上讲很容易在这里出错并产生错误的代码。 查看这篇文章我们探讨了Taboola的Spark监视架构 以及他们为什么要继续将Takipi添加到其监视堆栈中。 推荐的Spark入门资源 基本文档简短直接可以完成工作。 有关Spark性能调整的更高级的主题主要可以在以前的Spark峰会的录制演讲中找到。 结论 存储重构技术监视测试重用和一致的结果–我们希望您发现所提供的解决方案有用并且知道如何在需要时应用它们。 向新技术的过渡非常困难。 除了学习曲线外它们还使您更容易出错也使您更有可能在半夜接听电话以解决某些关键的生产问题。 对于这种情况我们启动了Takipi的Spark错误分析 。 我们要再次感谢Kenshoo的Tzach Zohar与我们分享他的经验 翻译自: https://www.javacodegeeks.com/2015/08/apache-spark-5-pitfalls-you-must-solve-before-changing-your-architecture.htmlapache spark

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/92312.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

icp网站信息免费python在线网站

过年回来后,时间变得飞快,很多事情都是马上要去干,而且又是很着急的事,呵呵,真的要干趴了 然后——经历了第一次年后的周末连续加班出版本保量产,经历了加班到凌晨3点调试问题,经历我们在疯狂的…

网站打赏怎么做的荆州seo公司

RV32/64 特权架构 - 特权模式与指令 1 特权模式2 特权指令2.1 mret(从机器模式返回到先前的模式)2.2 sret(从监管模式返回到先前的模式)2.3 wfi(等待中断)2.4 sfence.vma(内存屏障) …

做网站多少钱赚钱吗wordpress服务器版

LLVM 是 Low Level Virtual Machine (低级虚拟机)的简称,这个库提供了与编译器相关的支持,可以作为多种语言编译器的后台来使用。能够进行程序语言的编译期优化、链接优化、在线编译优化、代码生成。LLVM的项目是一个模块化和可重复使用的编译器和工具技…

软件开发工具与平台杭州优化seo公司

一、ECMAScript6标准简述 ECMAScript 6.0(以下简称 ES6)是 JavaScript 语言的下一代标准,已经在 2015 年 6 月正式发布了。它的目标,是使得 JavaScript 语言可以用来编写复杂的大型应用程序,成为企业级开发语言。 1.1E…

网站开发要源码多少钱火车头采集wordpress发布时间

关于2021,我们能看到的技术变化有很多。当云原生向下而生,当分布式数据库席卷而至,当低代码平台扩展了开发的边界,当万物互联蔚然成风……我们看到了太多在2021年形成的变化,但也能看到这些趋势非但没有结束&#xff0…

网站换域名seo怎么做个人如何做一个网站

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼前几天在微博上看到24点的游戏,6 6 610。算了很久是在算不出来,最后我想我何不写一个小程序解决它?说做就做,我刚开始的想法很简单,就是列举4个数的所有可能的表达式组合&…

wordpress mysqli苏州seo关键词优化方法

最近测试了www.doweb8.com/m/list.php?tid1 在手机站访问的时候,无法跳转到手机的模板,终于找到了解决了方法,给大家分享一下修改根目录下的m/list.php文件重新弄的代码, 不区分几级目录,理论是根据你指定的PC&#…

php企业网站开发实训报告网站发布到ftp

排序算法 基础排序 冒泡排序 核心为交换,通过不断进行交换,将大的元素一点一点往后移,每一轮最大的元素排到对应的位置上,形成有序。 设数组长度为N,过程为: 共进行N轮排序每一轮排序从数组的最左边开始&#xff0…

网站创建知识广告网页制作模板

Web3.0的概念代表着互联网的下一阶段发展,它将实现更加分散、安全、私密且能够实现无需中心化管理的网络生态系统。随着Web3.0的发展,推广策略也需要跟进并进行相应的创新。本文将为您介绍7个Web3.0时代的爆款推广策略,帮助你更好地了解和把握…

网站建设项目描述范文深圳做网站

一、AI 解析 DNS欺骗,又称DNS缓存投毒,是一种网络攻击技术。攻击者通过篡改DNS服务器的缓存数据,使得DNS查询的结果指向一个恶意的IP地址,从而引导用户访问到钓鱼网站或者恶意软件下载页面,对用户的信息安全造成威胁。…

对网站建设的问题wordpress 文章序号

数据库表 实体类&#xff08;对应数据库的字段&#xff0c;可以驼峰命名&#xff09; 封装的查询方法sql List<Student> getAllStudents(String name,String studentId,Integer classId,String className); 这里的值一一对应。 在多表查询时&#xff0c;查询到的指定字段…

美做天然居家居网站高端营销型网站制作

1. strlen函数的使用和模拟实现 size_t strlen(const char* str); 1.1 函数功能以及用法 字符串长度 strlen函数的功能是计算字符串的长度。在使用时&#xff0c;要求用户传入需要计算长度的字符串的起始位置&#xff0c;并返回字符串的长度。 #include <stdio.h> #…

网站首页幻灯片尺寸房屋装修设计师培训

全栈工程师开发手册 &#xff08;作者&#xff1a;栾鹏&#xff09; 一站式云原生机器学习平台 前言 开源地址&#xff1a;https://github.com/tencentmusic/cube-studio cube studio 腾讯开源的国内最热门的一站式机器学习mlops/大模型训练平台&#xff0c;支持多租户&…

免费制作购物网站网站免费搭建

ios 静音模式您最近是否遵循Mute-Design-Pattern™编写了大量代码&#xff1f; 例如 try {complex();logic();here(); } catch (Exception ignore) {// Will never happen heheSystem.exit(-1); }Java 8有一个更简单的方法&#xff01; 只需将这个非常有用的工具添加到您的Ut…

后端开发网站做一些什么创建网站的软件什么梦

目录 引言&#xff1a; 冒泡排序概述&#xff1a; 优化前&#xff1a; 优化后(注意看注释)&#xff1a; 解析优化后&#xff1a; 原理&#xff08;先去了解qsort&#xff09;&#xff1a; 引言&#xff1a; 排序算法是计算机科学中的基础问题之一。在本篇博客中&#xff0c…

dz论坛网站创建页面企业网站建设和运营

描述 编写一个4bit乘法器模块&#xff0c;并例化该乘法器求解c12*a5*b&#xff0c;其中输入信号a,b为4bit无符号数&#xff0c;c为输出。注意请不要直接使用*符号实现乘法功能。 模块的信号接口图如下&#xff1a; 要求使用Verilog HDL语言实现以上功能&#xff0c;并编写tes…

小程序名称大全网络优化推广公司哪家好

计算器默认角度制(D)。此时&#xff0c;按下mode&#xff0c;mode&#xff0c;2(Rad)&#xff0c;可将计算器调整为弧度制。输入要转化的角度(如30)&#xff0c;按下shift&#xff0c;ans(DRG三角)&#xff0c;1(D)&#xff0c;画面将显示30度&#xff0c;按下等号&#xff0c;…

什么是网站seo西安好的皮肤管理做团购网站

全世界只有3.14 % 的人关注了青少年数学之旅相信很多人都听过南北蟑螂的故事&#xff0c;即使是一个可以打死老虎的北方人在南方蟑螂面前也会惊慌失措。除此之外&#xff0c;我们日常生活里和蟑螂的故事还有很多&#xff0c;比如&#xff1a;当你打开灯的时候&#xff0c;会有一…

网站域名备案时间建筑工程劳务信息平台

文章目录 命令行约定格式**粗体&#xff1a;命令行关键字***斜体&#xff1a;命令行参数*[ ]&#xff1a;可选配置{ x | y | ... } 和 [ x | y | ... ]&#xff1a;选项{ x | y | ... }* 和 [ x | y | ... ]*&#xff1a;多选项&<1-n>&#xff1a;重复参数#&#xff…

seo网站优化做什么北京软件外包公司名单

GraphQL 既是一种用于 API 的查询语言也是一个满足你数据查询的运行时。GraphQL 对你的 API 中的数据提供了一套易于理解的完整描述&#xff0c;使得客户端能够准确地获得它需要的数据&#xff0c;而且没有任何冗余&#xff0c;也让 API 更容易地随着时间推移而演进&#xff0c…