JavaScript 的数值计算精度:Kahan 求和算法在处理大量浮点数累加时的应用

各位同学,各位同仁,大家好!

今天,我们将深入探讨一个在日常编程中常常被忽视,但在处理大量数值数据时又至关重要的话题:JavaScript 中的浮点数计算精度。特别是,我们将聚焦于一个巧妙的算法——Kahan 求和算法,来解决在累加大量浮点数时可能出现的精度损失问题。

浮点数:数字世界的“近似”与挑战

在JavaScript(以及大多数现代编程语言)中,数字的表示遵循 IEEE 754 双精度浮点数标准。这意味着每个数字都由64位二进制数来存储,其中包括一个符号位、一个指数位和一个尾数(或称有效数字)位。这种表示方法在很大程度上能够高效地表示非常大或非常小的数字,但它并非没有代价。

问题根源:二进制无法精确表示所有十进制小数

浮点数的本质是使用二进制分数来近似表示实数。就像十进制分数1/3无法在有限位数的十进制中精确表示为0.333...一样,许多简单的十进制小数,如0.1,也无法在二进制中被精确表示。

例如,十进制的0.1在二进制中是一个无限循环小数:
0.00011001100110011...

由于计算机的存储空间有限,它必须在某个点截断这个无限序列,这就引入了微小的舍入误差。单个的舍入误差通常非常小,对大多数计算来说可以忽略不计。但当这些微小的误差在一系列计算中累积起来时,就可能导致最终结果与预期值产生显著偏差。

让我们看一个经典的JavaScript浮点数问题:

console.log(0.1 + 0.2); // 预期结果:0.3 // 实际输出:0.30000000000000004

这个结果令人惊讶,但它直接揭示了浮点数计算的内在特性。0.10.2都不能被精确表示,它们各自都有一个微小的舍入误差。当它们相加时,这些误差被合并,并且在结果中以一个微小的偏差显现出来。

IEEE 754 双精度浮点数概述

为了更好地理解精度问题,我们有必要简要回顾一下 IEEE 754 双精度浮点数的结构。一个64位的双精度浮点数被分解为三个部分:

  1. 符号位 (Sign Bit): 1位,表示数字的正负(0为正,1为负)。
  2. 指数位 (Exponent): 11位,用于表示小数点的位置,决定了数字的量级。通过一个偏移量(bias)来处理正负指数。
  3. 尾数/有效数字位 (Mantissa/Significand): 52位,用于表示数字的精确值。由于浮点数通常以规范化形式存储(即假定小数点前有一位非零数字,通常是1),所以这52位实际上提供了53位的精度(隐含的最高位1)。

这种结构允许表示的数字范围非常广,从大约5e-3241.8e+308。然而,它也意味着在任意两个可表示的浮点数之间存在着“间隙”。这些间隙的大小随着数字的绝对值增大而增大。

关键概念:机器精度 (Machine Epsilon)

Number.EPSILON是 JavaScript 提供的一个常量,它代表了1与大于1的最小浮点数之间的差值。在双精度浮点数中,它大约是2.220446049250313e-16。它衡量了浮点数计算的相对精度。当两个数字的差值小于或等于EPSILON乘以其中较大数字的绝对值时,它们可能被认为是相等的,或者说,它们的差异已经超出了浮点数可以区分的最小单位。

部分位数描述
符号位10表示正数,1表示负数
指数位11决定数字的量级,范围约从 -1022 到 1023
尾数位52决定数字的精确值,提供约15-17位十进制精度

正是由于这种有限的精度和间隙的存在,当我们在进行大量浮点数累加时,问题就会变得尤为突出。

朴素求和的陷阱:误差的累积与吞噬

最直观的求和方法就是简单地将所有数字逐个相加:

function naiveSum(numbers) { let sum = 0; for (let i = 0; i < numbers.length; i++) { sum += numbers[i]; } return sum; }

这种方法在大多数情况下都表现良好,但当满足以下两个条件时,它会暴露出严重的精度问题:

  1. 累加的数字数量非常大。
  2. 要累加的数字大小差异悬殊。例如,将大量非常小的数字累加到一个非常大的数字上。

误差吞噬 (Loss of Significance)

当一个非常小的浮点数被添加到一个非常大的浮点数时,小数字的有效位可能会完全丢失。这是因为在执行加法操作之前,计算机需要调整这两个数字的指数,使它们的有效数字对齐。如果两个数字的量级相差太大,小数字的有效位可能会被“右移”到超出尾数所能表示的范围,从而被舍弃。

举一个例子:
假设我们有一个非常大的数A = 1.0000000000000000e+15和一个非常小的数B = 1.0e-1
当我们计算A + B时:
1.0000000000000000e+15

The difference betweenAandA + Bis so small that it falls within the rounding precision ofA. The effectivelyA + B = A.

实际案例:
假设你正在模拟一个粒子系统,需要对数百万个粒子在每个时间步长的能量进行累加。如果每个粒子的能量都是一个微小数,而总能量可能非常大,那么朴素求和将迅速积累误差。

// 模拟一个场景:将大量小值加到一个大值上 const NUM_ITERATIONS = 1000000; const largeValue = 1000000000000000; // 一个非常大的数 const smallValue = 0.0000000000000001; // 一个非常小的数 let numbersToSum = [largeValue]; for (let i = 0; i < NUM_ITERATIONS; i++) { numbersToSum.push(smallValue); } const naiveResult = naiveSum(numbersToSum); const expectedApproximateResult = largeValue + NUM_ITERATIONS * smallValue; // 理论上的精确和 console.log("--- 朴素求和示例 ---"); console.log("大值:", largeValue); console.log("小值:", smallValue); console.log("累加次数:", NUM_ITERATIONS); console.log("理论近似和:", expectedApproximateResult); console.log("朴素求和结果:", naiveResult); console.log("朴素求和误差:", Math.abs(naiveResult - expectedApproximateResult)); // 实际运行,你会发现 naiveResult 会比 expectedApproximateResult 小很多, // 甚至可能就是 largeValue 本身,因为所有 smallValue 都被“吞噬”了。

smallValue足够小,而largeValue足够大时,naiveResult的输出可能就是largeValue,这意味着所有NUM_ITERATIONSsmallValue的贡献都被完全抹杀了,这是一个灾难性的精度损失。

Kahan 求和算法:补偿式求和

为了应对这种累积的舍入误差,W. Kahan 在1960年代提出了一种精巧的解决方案,被称为Kahan 求和算法(Kahan summation algorithm),也称作补偿式求和(compensated summation)。

Kahan 算法的核心思想是:在每一次加法操作中,不仅仅是更新总和,还要记录因为舍入而“丢失”的那一部分值,并在下一次迭代中将其补偿回来。通过这种方式,即使每次丢失的量很小,它们也会被追踪并最终被加回到总和中,从而显著提高累加的精度。

算法变量:

  • sum: 当前的累加总和。
  • input: 当前要加入总和的数字。
  • y: 经过补偿后的input
  • t: 临时总和,用于计算新的sum
  • c: 补偿值(compensation),记录了上次加法中丢失的低位信息。

Kahan 算法的步骤:

  1. 初始化sum = 0.0c = 0.0
  2. 对于序列中的每个数字input
    a. 计算y = input - cy是当前数字减去上一次加法中丢失的补偿值。这样

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1004728.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

15、Linux 系统下的邮件与即时通讯使用指南

Linux 系统下的邮件与即时通讯使用指南 1. Linux 系统中的邮件客户端 在人们提及互联网时,往往首先想到的是万维网,但实际上电子邮件可能是最常用且最受欢迎的互联网应用之一。对于 Linux 用户而言,有众多的电子邮件程序可供选择,不同的 Linux 发行版默认的邮件客户端也各…

微信遥控Mac:WeChatPlugin远程控制终极指南

微信遥控Mac&#xff1a;WeChatPlugin远程控制终极指南 【免费下载链接】WeChatPlugin-MacOS 微信小助手 项目地址: https://gitcode.com/gh_mirrors/we/WeChatPlugin-MacOS 你是否曾经想过&#xff0c;躺在沙发上就能控制远在书房里的Mac电脑&#xff1f;或者在外出时突…

为什么 C盘空间会莫名其妙减少(即使没装新软件)?

为什么 C盘空间会莫名其妙减少&#xff08;即使没装新软件&#xff09;&#xff1f;你有没有注意到c盘空间在减少&#xff0c;即使你没有安装新程序, 这个常见问题可能让人担心, 但通常有明确原因, windows和其他软件会定期创建临时文件、系统备份和更新, 占用磁盘空间而不会每…

16、探索 Linux:网络应用与文件管理指南

探索 Linux:网络应用与文件管理指南 在当今数字化时代,Linux 系统凭借其强大的功能和高度的可定制性,受到了越来越多用户的青睐。本文将深入介绍 Linux 系统中的网络应用和文件管理操作,帮助你更好地利用 Linux 系统的优势,提升工作和学习效率。 网络应用:即时通讯、文…

【SOVD】软件定义汽车时代的诊断新范式

目录 一、为什么传统诊断体系正在“失效” 二、SOVD 是什么? 三、SOVD 的定位:不是替代 UDS,而是“包裹” UDS 四、SOVD 解决的核心问题 1️⃣ 诊断访问的“现代化” 2️⃣ 跨 ECU、跨域的统一视图 3️⃣ 云端与远程诊断的安全边界 五、SOVD 的核心概念:资源模型 常见资源类…

javet 的使用

第一版使用的是j2v8,但是已经不维护了,部署到liunx后报错 J2V8 native library not loaded ,之后切换到这个库了 https://github.com/caoccao/Javenode 引入依赖 <!-- Core (Must-have) --><dependency><groupId>com.caoccao.javet</groupId><art…

用户目录能不能放到其他盘?

用户目录能不能放到其他盘&#xff1f;是的, 你可以把用户文件夹移动到另一个磁盘, 但你应该小心操作. 许多人想要腾出系统盘空间或把个人文件放在单独的磁盘上. 移动用户文件夹可以缓解空间限制并简化备份, 但如果方法不当也可能引发问题. 本文解释了安全的选项, 需要遵循的步…

数据分析工具对比:SPSS vs Tableau vs DataEase

工具概览 SPSS 全称&#xff1a;Statistical Package for the Social Sciences 描述&#xff1a;是一款专业的统计分析软件&#xff0c;广泛应用于社会科学、医学、市场研究等领域。 Tableau 描述&#xff1a;一款强大的数据可视化工具&#xff0c;能够将复杂的数据转化为直观、…

【OTA】自动化测试方案

目录 基于 Python + PyQt5 的 OTA 自动化测试工具方案 1. 背景与问题定义 2. 工具整体架构设计 2.1 架构分层 2.2 核心设计思想 3. OTA 自动化流程拆解(状态机) 4. PyQt5 UI 设计(任务控制台) 4.1 UI 功能 4.2 主窗口代码示例(PyQt5) 5. OTA 状态机与调度实现 5.1 Worker…

哪些文件夹里的文件是可以安全删除的?比如Temp、Download这些?

哪些文件夹里的文件是可以安全删除的&#xff1f;比如Temp、Download这些&#xff1f;files accumulate on every computer and phone, some of those files are safe to remove, and deleting them can free space and make your device run smoother, this article explains,…

最全词典整合收录:打造专业英语学习利器

最全词典整合收录&#xff1a;打造专业英语学习利器 【免费下载链接】最全词典整合收录词典刺客 本仓库提供了一个名为“最全词典整合收录(词典刺客)”的资源文件下载。该资源文件包含了以下词典的整合收录&#xff1a;- 柯林斯双解&#xff08;mddmdx&#xff09;- 朗文双解&a…

SuperDesign:在IDE中唤醒你的设计创造力

SuperDesign&#xff1a;在IDE中唤醒你的设计创造力 【免费下载链接】superdesign 项目地址: https://gitcode.com/gh_mirrors/su/superdesign 你是否曾经在深夜对着空白的代码编辑器&#xff0c;脑海中浮现出完美的UI设计&#xff0c;却不知道如何快速实现&#xff1f…

C盘哪些文件可以删除?

C盘哪些文件可以删除&#xff1f;c盘通常存放操作系统和许多用户文件&#xff0c;随着时间推移&#xff0c;它会被占满并使电脑变慢&#xff0c;在删除任何东西之前&#xff0c;你应该检查是什么占用了空间&#xff0c;备份重要文件&#xff0c;并了解哪些文件可以安全删除&…

17、深入理解 Linux 文件系统机制与结构

深入理解 Linux 文件系统机制与结构 1. 理解长格式文件列表 在 Linux 中,使用 ls -la 命令可以查看详细的文件列表信息,示例输出如下: drwx------ 2 dee dee 4096 Jul 29 07:48 . drwxr-xr-x 5 root root 4096 Jul 27 11:57 .. -rw-r--r-- 1 dee dee 24 Jul 27 …

10款最佳开源Android个性化应用:让你的手机桌面焕然一新

10款最佳开源Android个性化应用&#xff1a;让你的手机桌面焕然一新 【免费下载链接】open-source-android-apps Open-Source Android Apps 项目地址: https://gitcode.com/gh_mirrors/op/open-source-android-apps 厌倦了千篇一律的手机界面&#xff1f;想要打造真正属…

cmark Markdown解析器终极指南:从入门到精通

cmark Markdown解析器终极指南&#xff1a;从入门到精通 【免费下载链接】cmark CommonMark parsing and rendering library and program in C 项目地址: https://gitcode.com/gh_mirrors/cm/cmark cmark是一款高性能的CommonMark标准Markdown解析器&#xff0c;采用C语…

我的文档、桌面、下载这些文件夹都在C盘,怎么把它们整个移到D盘?

我的文档、桌面、下载这些文件夹都在C盘&#xff0c;怎么把它们整个移到D盘&#xff1f;you keep finding your documents, desktop, and downloads folders stored on the c: drive and want to move them all to d:, that is a common need when the system drive is low on …

18、深入了解 Linux 文件系统:导航与分区指南

深入了解 Linux 文件系统:导航与分区指南 1. Linux 常见子目录及其内容 在 Linux 系统中,有许多重要的子目录,每个子目录都有其特定的用途。以下是一些常见的子目录及其内容: | 子目录 | 内容描述 | | — | — | | /usr/games | 系统上安装的游戏,除了那些可选择放置…

19、Linux系统使用指南:文件系统、磁盘管理与软件操作

Linux系统使用指南:文件系统、磁盘管理与软件操作 1. Linux文件系统与分区 在Linux中,文件系统的分区管理有着独特的方式。紧跟三位字母标识后的数字代表你所指的分区。例如,用户为Linux创建了三个分区,第一个IDE驱动器是一个单独的分区,分配给根分区;第二个IDE驱动器被…

磁盘清理工具没反应怎么办

磁盘清理工具没反应怎么办如果你的磁盘清理工具不响应,你不用惊慌,不响应通常意味着程序卡住了,在等待某个资源,或者被其他进程阻塞,先做一些现在能做的简单检查,确认工具窗口没有被隐藏或最小化,尝试点击它的按钮,观察状态文本或进度指示,如果一两分钟后没有变化,就进行基本排…