离散化C++

离散化(Discretization)是一种将连续数据映射到离散值的技术,常用于将大数据范围压缩到较小范围,例如将数值映射到索引。离散化在算法竞赛中常用于处理数值范围较大但数据量较小的问题(如区间问题、统计问题等)。

以下是离散化的模板和示例:


1. 离散化的基本步骤

  1. 排序:将所有需要离散化的值排序。
  2. 去重:去除重复的值。
  3. 映射:通过二分查找将原始值映射到离散化后的索引。

2. 离散化模板

2.1 使用 std::vectorstd::unique

#include <iostream>
#include <vector>
#include <algorithm>// 离散化函数
std::vector<int> discretize(std::vector<int>& nums) {// 1. 排序std::vector<int> sorted_nums = nums;std::sort(sorted_nums.begin(), sorted_nums.end());// 2. 去重auto last = std::unique(sorted_nums.begin(), sorted_nums.end());sorted_nums.erase(last, sorted_nums.end());// 3. 映射std::vector<int> result(nums.size());for (size_t i = 0; i < nums.size(); i++) {result[i] = std::lower_bound(sorted_nums.begin(), sorted_nums.end(), nums[i]) - sorted_nums.begin();}return result;
}int main() {std::vector<int> nums = {100, 200, 50, 100, 300, 50};// 离散化std::vector<int> discretized = discretize(nums);// 输出结果std::cout << "Original: ";for (int num : nums) {std::cout << num << " ";}std::cout << std::endl;std::cout << "Discretized: ";for (int num : discretized) {std::cout << num << " ";}std::cout << std::endl;return 0;
}

输出:

Original: 100 200 50 100 300 50 
Discretized: 1 2 0 1 3 0 

2.2 离散化后还原原始值

如果需要还原离散化后的值,可以通过离散化数组进行映射。

#include <iostream>
#include <vector>
#include <algorithm>// 离散化函数
std::pair<std::vector<int>, std::vector<int>> discretizeWithMap(std::vector<int>& nums) {// 1. 排序std::vector<int> sorted_nums = nums;std::sort(sorted_nums.begin(), sorted_nums.end());// 2. 去重auto last = std::unique(sorted_nums.begin(), sorted_nums.end());sorted_nums.erase(last, sorted_nums.end());// 3. 映射std::vector<int> result(nums.size());for (size_t i = 0; i < nums.size(); i++) {result[i] = std::lower_bound(sorted_nums.begin(), sorted_nums.end(), nums[i]) - sorted_nums.begin();}return {result, sorted_nums};
}int main() {std::vector<int> nums = {100, 200, 50, 100, 300, 50};// 离散化auto [discretized, map] = discretizeWithMap(nums);// 输出结果std::cout << "Original: ";for (int num : nums) {std::cout << num << " ";}std::cout << std::endl;std::cout << "Discretized: ";for (int num : discretized) {std::cout << num << " ";}std::cout << std::endl;std::cout << "Map: ";for (int num : map) {std::cout << num << " ";}std::cout << std::endl;// 还原离散化后的值std::cout << "Reconstructed: ";for (int num : discretized) {std::cout << map[num] << " ";}std::cout << std::endl;return 0;
}

输出:

Original: 100 200 50 100 300 50 
Discretized: 1 2 0 1 3 0 
Map: 50 100 200 300 
Reconstructed: 100 200 50 100 300 50 

3. 离散化的应用场景

3.1 区间问题

离散化常用于处理区间问题,例如区间合并、区间查询等。

#include <iostream>
#include <vector>
#include <algorithm>// 区间合并
std::vector<std::pair<int, int>> mergeIntervals(std::vector<std::pair<int, int>>& intervals) {if (intervals.empty()) return {};// 离散化std::vector<int> nums;for (const auto& interval : intervals) {nums.push_back(interval.first);nums.push_back(interval.second);}auto [discretized, map] = discretizeWithMap(nums);// 区间合并std::sort(intervals.begin(), intervals.end());std::vector<std::pair<int, int>> merged;for (const auto& interval : intervals) {if (merged.empty() || merged.back().second < interval.first) {merged.push_back(interval);} else {merged.back().second = std::max(merged.back().second, interval.second);}}return merged;
}int main() {std::vector<std::pair<int, int>> intervals = {{1, 3}, {2, 6}, {8, 10}, {15, 18}};// 区间合并auto merged = mergeIntervals(intervals);// 输出结果std::cout << "Merged Intervals: ";for (const auto& interval : merged) {std::cout << "[" << interval.first << ", " << interval.second << "] ";}std::cout << std::endl;return 0;
}

输出:

Merged Intervals: [1, 6] [8, 10] [15, 18] 

3.2 统计问题

离散化可以用于统计某个范围内数据的频率。

#include <iostream>
#include <vector>
#include <algorithm>// 统计频率
std::vector<int> countFrequency(std::vector<int>& nums) {// 离散化auto [discretized, map] = discretizeWithMap(nums);// 统计频率std::vector<int> freq(map.size(), 0);for (int num : discretized) {freq[num]++;}return freq;
}int main() {std::vector<int> nums = {100, 200, 50, 100, 300, 50};// 统计频率auto freq = countFrequency(nums);// 输出结果std::cout << "Frequency: ";for (int count : freq) {std::cout << count << " ";}std::cout << std::endl;return 0;
}

输出:

Frequency: 2 2 1 1 

4. 总结

  • 离散化的核心步骤是排序、去重和映射。
  • 离散化可以用于处理区间问题、统计问题等。
  • 通过离散化,可以将大数据范围压缩到较小范围,提高算法效率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/68811.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

php的使用及 phpstorm环境部署

php语法 环境搭建&#xff1a;在小皮中新建网站&#xff0c;注意先填写域名再点击选择根目录。 成功创建网站后&#xff0c;打开发现forbidden&#xff0c;因为新建的网站里是空的&#xff0c;需要新建index.php文件----> 在Phpstorm中左上角打开文件&#xff0c;打开那个文…

win10部署本地deepseek-r1,chatbox,deepseek联网(谷歌网页插件Page Assist)

win10部署本地deepseek-r1&#xff0c;chatbox&#xff0c;deepseek联网&#xff08;谷歌网页插件Page Assist&#xff09; 前言一、本地部署DeepSeek-r1step1 安装ollamastep2 下载deepseek-r1step2.1 找到模型deepseek-r1step2.2 cmd里粘贴 后按回车&#xff0c;进行下载 ste…

5.3.2 软件设计原则

文章目录 抽象模块化信息隐蔽与独立性衡量 软件设计原则&#xff1a;抽象、模块化、信息隐蔽。 抽象 抽象是抽出事物本质的共同特性。过程抽象是指将一个明确定义功能的操作当作单个实体看待。数据抽象是对数据的类型、操作、取值范围进行定义&#xff0c;然后通过这些操作对数…

4-图像梯度计算

文章目录 4.图像梯度计算(1)Sobel算子(2)梯度计算方法(3)Scharr与Laplacian算子4.图像梯度计算 (1)Sobel算子 图像梯度-Sobel算子 Sobel算子是一种经典的图像边缘检测算子,广泛应用于图像处理和计算机视觉领域。以下是关于Sobel算子的详细介绍: 基本原理 Sobel算子…

02.05、链表求和

02.05、[中等] 链表求和 1、题目描述 给定两个用链表表示的整数&#xff0c;每个节点包含一个数位。 这些数位是反向存放的&#xff0c;也就是个位排在链表首部。 编写函数对这两个整数求和&#xff0c;并用链表形式返回结果。 2、解题思路 本题要求对两个链表表示的整数…

pyside6-uic form.ui -o ui_form.py 的作用

pyside6-uic form.ui -o ui_form.py 的作用 pyside6-uic form.ui -o ui_form.py 这个命令是用来将 .ui 文件转换为 Python 代码文件的工具。 具体作用&#xff1a; pyside6-uic&#xff1a;这是一个命令行工具&#xff0c;用于将用 Qt Designer 或其他图形界面工具创建的 .ui …

图漾相机-ROS2-SDK-Ubuntu版本编译(新版本)

文章目录 前言1.Camport ROS2 SDK 介绍1.1 Camport ROS2 SDK源文件介绍1.2 Camport ROS2 SDK工作流程1.2.1 包含头文件1.2.2 2 初始化 ROS 2 节点1.2.3 创建节点对象1.2.4 创建发布者对象并实现发布逻辑1.2.5 启动 ROS 2 1.3 ROS2 SDK环境配置与编译1.3.1 Ubuntu 20.04 下ROS2 …

海外问卷调查渠道查:企业经营的利器

一、海外问卷调查的基本概念 市场&#xff1a;市场主要由需求者和供给者组成的一种经济关系&#xff0c;主要是商品和服务的交换的一种方式和手段&#xff0c;市场类型按不同标准来划分。按地域划分&#xff0c;则分为国内市场和国际市场&#xff0c;按照产品类型划分&#xf…

pandas中的str使用方法

在 Pandas 中&#xff0c;str 访问器用于对 Series 或 DataFrame 中的字符串数据进行矢量化操作&#xff0c;使其能够像 Python 的字符串方法一样被调用&#xff0c;但支持对整个列或 Series 进行高效处理。 str 只能用于包含字符串类型的 Series 或 DataFrame 的 string 类型…

向上调整算法(详解)c++

算法流程&#xff1a; 与⽗结点的权值作⽐较&#xff0c;如果⽐它⼤&#xff0c;就与⽗亲交换&#xff1b; 交换完之后&#xff0c;重复 1 操作&#xff0c;直到⽐⽗亲⼩&#xff0c;或者换到根节点的位置 这里为什么插入85完后合法&#xff1f; 我们插入一个85&#xff0c;…

LeetCode题练习与总结:根据二叉树创建字符串--606

一、题目描述 给你二叉树的根节点 root &#xff0c;请你采用前序遍历的方式&#xff0c;将二叉树转化为一个由括号和整数组成的字符串&#xff0c;返回构造出的字符串。 空节点使用一对空括号对 "()" 表示&#xff0c;转化后需要省略所有不影响字符串与原始二叉树…

人工智能入门课【手写自注意力机制】

原理 自注意力&#xff08;Self-Attention&#xff09;是一种强大的机制&#xff0c;广泛应用于自然语言处理、计算机视觉等领域&#xff0c;尤其是在Transformer架构中发挥了关键作用。它的核心思想是让模型能够动态地关注输入序列中不同位置之间的关系&#xff0c;从而更好地…

理解 InnoDB 如何处理崩溃恢复

在数据库领域&#xff0c;数据的一致性与可靠性至关重要。InnoDB 存储引擎的崩溃恢复机制是保障数据安全的核心&#xff0c;其中 Doublewrite Buffer 和 Redo Log 发挥着关键作用。下面&#xff0c;我们将详细探讨 InnoDB 从写入到崩溃恢复的全过程。 一、写入流程 修改页面&…

gentoo 中更改$PS1

现象&#xff1a;gentoo linux Xfce桌面&#xff0c;Terminal 终端&#xff0c;当进入很深的目录时&#xff0c;终端提示符会很长&#xff0c;不方便。如下图所示&#xff1a; 故需要修改$PS1 gentoo 默认的 PS1 在 /etc/bash/bashrc .d/10-gentoo-color.bash中定义&a…

安全防护前置

就业概述 网络安全工程师/安全运维工程师/安全工程师 安全架构师/安全专员/研究院&#xff08;数学要好&#xff09; 厂商工程师&#xff08;售前/售后&#xff09; 系统集成工程师&#xff08;所有计算机知识都要会一点&#xff09; 学习目标 前言 网络安全事件 蠕虫病毒--&…

【自然语言处理(NLP)】深度学习架构:Transformer 原理及代码实现

文章目录 介绍Transformer核心组件架构图编码器&#xff08;Encoder&#xff09;解码器&#xff08;Decoder&#xff09; 优点应用代码实现导包基于位置的前馈网络残差连接后进行层规范化编码器 Block编码器解码器 Block解码器训练预测 个人主页&#xff1a;道友老李 欢迎加入社…

wordpress代码结构解析

WordPress 是一个基于 PHP 和 MySQL 的开源内容管理系统&#xff08;CMS&#xff09;&#xff0c;广泛用于构建网站和博客。要解析 WordPress 代码&#xff0c;首先需要了解其核心结构、主要文件和常用的函数。以下是 WordPress 代码解析的基本指南&#xff1a; --- ### 1. *…

【Leetcode 每日一题】81. 搜索旋转排序数组 II

问题背景 已知存在一个按非降序排列的整数数组 n u m s nums nums&#xff0c;数组中的值不必互不相同。 在传递给函数之前&#xff0c; n u m s nums nums 在预先未知的某个下标 k ( 0 < k < n u m s . l e n g t h ) k\ (0 < k < nums.length) k (0<k<…

机器学习优化算法:从梯度下降到Adam及其变种

机器学习优化算法&#xff1a;从梯度下降到Adam及其变种 引言 最近deepseek的爆火已然说明&#xff0c;在机器学习领域&#xff0c;优化算法是模型训练的核心驱动力。无论是简单的线性回归还是复杂的深度神经网络&#xff0c;优化算法的选择直接影响模型的收敛速度、泛化性能…

mysqldump+-binlog增量备份

注意&#xff1a;二进制文件删除必须使用help purge 不可用rm -f 会崩 一、概念 增量备份&#xff1a;仅备份上次备份以后变化的数据 差异备份&#xff1a;仅备份上次完全备份以后变化的数据 完全备份&#xff1a;顾名思义&#xff0c;将数据完全备份 其中&#xff0c;…