制作一个RISC-V的操作系统十四-任务同步和锁

文章目录

  • 并发与同步
  • 临界区和锁
  • 死锁
  • 解决死锁
  • 自旋锁(spin lock)
  • 原子性问题
  • 原子操作实现
    • amoswap.w.aq
    • 例子
  • 另一种方法
  • 自旋锁的注意事项
  • 代码
  • 其他同步技术

并发与同步

控制流:可理解为任务或进程

中断也可以理解为一个切换到另一个任务(中断处理程序),于是宏观上认为同时执行了

同步:可以理解要求某个任务的某个操作与某个任务的某个操作的先后顺序有要求
在这里插入图片描述

临界区和锁

在这里插入图片描述
并发执行中,当一个进程访问临界区时,除非访问结束,否则其他进程(即使切换到了该进程)不能进入临界区即阻塞。不然影响该进程对临界区资源的使用。

临界区是指在多线程环境中,同一时刻只允许一个线程访问的一段代码或资源区域。为了确保临界区的安全访问,避免因多个线程同时访问导致的数据不一致或其他竞态条件,我们需要采取同步措施来保护临界区

  • 当线程尝试获取一个已被其他线程持有的可睡眠锁时,如果锁不可用,该线程会被操作系统挂起,并放入等待队列中,从而停止执行(进入睡眠状态)。一旦持有锁的线程释放了锁,操作系统会选择合适的线程将其唤醒并赋予其锁的所有权。这样,线程就可以继续执行被保护的代码段。
  • 不可睡眠锁在尝试获取锁时,如果锁被占用,当前线程并不会被挂起,而是会在原地循环等待(自旋),不断检查锁是否已经释放。这种方式避免了线程上下文切换的开销,但可能会导致线程消耗大量的CPU资源,尤其是当锁被持有时间较长时。
    在这里插入图片描述

上锁导致另一个进程也要上锁时阻塞然后一直循坏,。直到最后解锁

死锁

访问多个临界区可能就需要涉及多个锁

当按照A执行获取A锁,然后B执行获取B锁,A再获取B锁,B再获取A锁
这样将导致阻塞。即再切换到A准备获取B锁,然后再切换到B获取A锁会阻塞。二者都卡住
在这里插入图片描述

解决死锁

除了三点之外还可以实现申请多个锁一次性申请,不中断。可以解决

调整获取锁的顺序,因为上个例子中申请锁的顺序不一致也是导致死锁的原因
防止在持有一把锁再申请其他锁就是尽量保存申请一把锁之前申请的锁都释放掉
在这里插入图片描述

自旋锁(spin lock)

  • 初始话锁
  • 在不同控制流访问临界区的前后执行上锁和解锁
    在这里插入图片描述

原子性问题

中断的级别是针对到汇编指令级别的

也就是说上锁操作可能还没完成就中断然后跳转到另一个控制流导致另一个控制流此时发现锁没有被锁上,导致两个都进入临界区(第一个汇编执行进入了if但没有设置locked导致第二个此时也能进入if并上锁)
在这里插入图片描述

原子操作实现

amoswap.w.aq 将locked值存到寄存器,同时locked的值更新为寄存器的值即为1。不会被打断

这里把值的变化给一气呵成完成了,使得不会出现锁没来得及更新就切换到另一个进程使得其也认为没上锁。(也可以认为让值的更新在判断是否进入临界区之前)

如果不是原子性的,那么假设分为几部分实现更新值和保存原来值的作用,那么可能会得到死锁或者同时进入临界区的结果

发现在只有执行这条指令的执行流会上锁,其他都不会,哪怕是快接触到该指令的执行流
在这里插入图片描述

amoswap.w.aq

在RISC-V架构中,amoswap.w.aq指令是原子内存操作指令之一,主要用于并发环境下的原子读改写内存操作。这个指令的名字来源于几个关键词的组合:

  • amo: AtomiC Memory Operation,原子内存操作,表明这条指令在执行过程中是不可分割的,即使在多线程或多处理器环境下也能确保操作的原子性。
  • swap: 表示该指令执行的是交换操作,即将寄存器中的值与内存位置的内容进行交换。
  • w: 表示操作的数据宽度是32位(word大小)。
  • aq: 是Atomicity Qualifier(原子性限定符)的一部分,RISC-V架构中使用aq和rl两个原子性顺序标签来配合实现内存排序模型。其中,aq(Acquire)确保了指令的执行不会与之前的内存操作重排,并且在指令执行后能够观察到对其他核心的写入操作。

amoswap.w.aq指令的具体功能是这样的:

  • 它同时读取内存位置(通过指定的地址)的原始值,并将寄存器中的值写入该内存位置。
  • 最终,指令会将读取到的原始内存值存储到另一个指定的寄存器中。

这一系列操作作为一个单一的原子步骤完成,这对于维护数据一致性至关重要,特别是在多线程并发访问共享内存区域时。

例如,amoswap.w.aq rs2, rs1, (ra) 指令格式中:

  • rs1 是要写入内存的新值的源寄存器。
  • rs2 是保存内存原值的目标寄存器。
  • ra 是包含要操作的内存地址的寄存器。
  1. aq(Acquire)

    • 当一个带有"aq"标签的指令被执行时,它起到“获取”内存屏障的作用,确保该指令在其之前的内存读写操作都已完成,并且这些操作对于后续的操作(包括本核和其他核)都是可见的。
    • 即,amoswap.w.aq指令不仅本身是原子性的,而且还能保证在执行该指令之后,任何对共享变量的读取操作都能够看到指令之前发生的所有写入操作的效果,有效地阻止了指令重排序。
  2. rl(Release)

    • 相对应的,带有"rl"标签的指令意味着它是一个“释放”内存屏障,确保该指令执行时,它及其之前的所有内存操作全部完成,并且在这条指令之后的写入操作对其他核将是不可见的,直到下一个带有"aq"标签的指令执行。
    • 也就是说,amoswap.w.rl指令在写入共享内存后,其他核心只有在执行了自身的"aq"指令后才能看到这次写入的结果。

例子

假设存在两个核心Core A和Core B,它们共享一块内存区域,并且Core A正在修改某个变量shared_var,而Core B需要读取shared_var的最新值。如果不加控制,可能出现以下情况:

  1. Core A首先修改了shared_var的值,但由于缓存一致性等因素,这个修改还没有刷新到主内存;
  2. Core B此时去读取shared_var,由于没有内存排序保障,可能会读取到旧值而非Core A刚修改的新值。

为了保证Core B能看到Core A的写入操作,我们可以使用带有aq标签的原子指令。例如,在RISC-V架构中,如果我们有一个amoswap.w.aq指令:

amoswap.w.aq t1, t2, (a0)

这条指令会将寄存器t2的值原子性地写入地址a0指向的内存位置,并且返回原来内存位置的值到t1。更重要的是,这里的aq标识确保了在执行此原子操作之前,所有内存操作都已经完成并且对外部核心可见,也就是说Core B在执行amoswap.w.aq指令之前,一定能观察到Core A对该共享内存的先前写入。

另一种方法

上锁可以理解为直接关掉中断,使得只有对应进程上锁后,逻辑就无法被切换,进而一直执行该执行流
在这里插入图片描述

自旋锁的注意事项

上锁需要是原子性操作
不能执行长时间,不然使得其他进程占用CPU大量时间但啥事没做
不能主动放弃CPU不然没有解锁,其他进程永远无法访问临界区
在这里插入图片描述

代码

https://github.com/FULLK/risllkos/tree/main/Fullkenerl9

其他同步技术

在这里插入图片描述
在操作系统和多线程编程中,完成变量(Completion Variable)是一种同步原语,主要用于实现线程或进程间的同步,尤其是在一个任务完成特定工作后通知另一个任务的场景。其核心作用在于简化并发环境下的协作流程。

具体来说,完成变量的主要作用包括:

  1. 任务标记:一个任务在完成某项操作后,它可以设置(或增加计数)一个完成变量,表明某个关键阶段已经结束。

  2. 阻塞与唤醒:其他任务可以在等待这个完成变量,当它们检测到变量被设置或等待计数达到预期值时,会被自动唤醒并恢复执行。这样,一个任务可以在开始执行下一个阶段之前,安全地等待前一个任务完成其工作。

  3. 替代信号量:在某些情况下,完成变量可以作为信号量的轻量级替代品,特别是在只需要一次性通知而不是多次信号控制的情况下。相比于传统的信号量,完成变量通常更易于理解和使用,因为它们直接关联到一个特定的操作完成与否。

例如,在Linux内核中,完成变量 (completion) 是一种内建的数据结构和API,它允许内核线程或其他并发实体之间进行同步。一个典型的使用场景是,当一个内核线程发起I/O操作后,可以挂起自己并在完成变量上等待,直到I/O完成,设备驱动或者其他相关部分会触发这个完成变量以唤醒等待的线程。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/829932.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++智能指针详解

目录 一. 智能指针初识 1.1 什么是智能指针 1.2 智能指针历史历程 1.3 为什么需要智能指针 1.3.1 内存泄漏 1.3.2 防止内存泄漏 1.3.3 异常的重新捕获 二. 智能指针的原理与使用 2.1 智能指针的原理 2.2 智能指针的使用 2.3 智能指针的拷贝问题…

docker网络和模式

Docker使用Linux桥接,在宿主机虚拟一个Docker容器网桥(docker0),Docker启动一个容器时会根据Docker网桥的网段分配给容器一个IP地址,称为container-IP,同时Docker网桥是每个容器的默认网关。因为在同一宿主机内的容器都接入同一个…

mars3d开发过程中点击面图层飞行定位,设置俯仰角度后,layer.flyTo({没有生效的排查思路

mars3d开发过程中点击面图层飞行定位,设置俯仰角度后,layer.flyTo({没有生效的排查思路记录,给大家提供一下以后排查定位问题的方向 问题场景相关代码: 1.项目本身代码: 2.精简了关键性代码后,就可以去ge…

【博客经验分享】博客小白在CSDN是如何做到一周内涨粉1800的

🎓我(异构算力老群群-CSDN博客)是在今年3月份才开始写博客的,目的是做一个博士🎓期间的笔录;在CSDN这个技术分享与交流的平台🌐,我近期实现了一个令人振奋的成就——那就是一周内涨粉…

纯血鸿蒙APP实战开发——评论组件案例实现

介绍 评论组件在目前市面上的短视频app中是一种很常见的场景,本案例使用全局状态保留能力弹窗来实现评论组件。点击评论按钮弹出评论组件,点击空白处隐藏该组件,再次点击评论按钮则会恢复上一次浏览的组件状态。 效果图预览 使用说明 点击…

CUDA的基础知识

文章目录 数据精度CUDA概念线程&线程块&线程网络&计算核心GPU规格参数内存 GPU并行方式数据并行流水并行张量并行混合专家系统 数据精度 FP32 是单精度浮点数,用8bit 表示指数,23bit 表示小数;FP16 是半精度浮点数,用…

L1-041 寻找250

作者 陈越 单位 浙江大学 对方不想和你说话,并向你扔了一串数…… 而你必须从这一串数字中找到“250”这个高大上的感人数字。 输入格式: 输入在一行中给出不知道多少个绝对值不超过1000的整数,其中保证至少存在一个“250”。 输出格式&a…

【进程通信】利用管道创建进程池(结合代码)

文章目录 什么叫进程池进程池的优点 创建进程池代码实现: 什么叫进程池 我们知道,一个进程创建子进程通常是为了让这个子进程去为它完成某个任务。例如我们使用的指令,其实就是bash进程创建子进程让子进程去执行的。但是我们需要考虑这样一个…

【介绍下分布式系统】

🌈个人主页: 程序员不想敲代码啊 🏆CSDN优质创作者,CSDN实力新星,CSDN博客专家 👍点赞⭐评论⭐收藏 🤝希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共…

wegame启动游戏错误代码126,加载x3daudio1_7.dll失败的修复教程

在尝试通过WeGame平台启动某款游戏时,遇到了阻碍,系统反馈了一个特定的错误代码“错误代码126,加载x3daudio1_7.dll失败”。这个错误提示表示游戏无法加载x3daudio17.dll文件,导致游戏无法正常启动。经过一番研究和尝试&#xff0…

vue elementui el-table表格 点击单元格添加选中样式

注意: 1、点击某行单元格添加选中样式; 2、表格第一列数据单独添加样式,比如:加粗; 3、表格表头添加样式,比如:修改背景色; 先上代码(效果图在文章末尾)&…

python-pytorch 如何使用python库Netron查看模型结构(以pytorch官网模型为例)0.9.2

Netron查看模型结构 参照模型安装Netron写netron代码运行查看结果需要关注的地方 2024年4月27日14:32:30----0.9.2 参照模型 以pytorch官网的tutorial为观察对象,链接是https://pytorch.org/tutorials/intermediate/char_rnn_classification_tutorial.html 模型代…

Ansible自动化

Ansible自动化 自动化的需求: 1. 在什么样的场景下需要自动化? 批量化的工作: 装软件包、配置服务、升级、下发文件… 2. 为什么在自动化工具中选择ansible? 对比shell脚本: 相对于用shell的脚本来实现自动化&#x…

42.接雨水

接雨水是一个非常经典的题目了,我在二刷的时候,终于能独立做了,在记录一下灵神的横着计算的单调栈思想. 法一: 竖着计算 奇思妙想 让我们想想,接到的雨水到底是存储哪里了呢,其实他就是凹陷部分,而什么是凹陷呢,就是从左边看,从右边看都发现不了的地方. …

滑块验证码破解----Java使用opencv后端破解滑块验证

使用技术:Java SpringBootopenCV 在windows上首先需要下载opencv进行安装,先去官网:Releases - OpenCV 下载这个windows版本的安装包 下载后直接安装解压就行,然后需要,然后找到安装位置里的这个文件: 你下载的是什么版本的,这里的数字就是多少,比如我下载4.5.3版本那么这…

永磁同步电机SMO负载转矩观测matlab模型。

永磁同步电机SMO负载转矩观测matlab模型。 负载转矩的有效识别是提高伺服驱动系统抗负载扰动性能的关键之一。现在的传统结构的LTID滑模观测器存在频率抖动大,估计精度差的缺点,限制了其在高性能伺服系统中的应用。 本模型推导分析了传统LTID滑模观测器…

eclipse 如何创建python文件

一、准备 1.平台要求: 电脑除了要安装eclipse软件和Python语言包之外,还需要将Python集成到eclipse软件中,网上有很多的方法,这里就不细细介绍如何集成了。 在下面界面中可以看到自己已经安装了继承插件。具体方法见步骤2&…

AI新篇章:全面解读ChatGPT3.5与GPT4.0的革命性融合

MidTool(kk.zlrxjh.top),一个集成了多种先进人工智能技术的助手,融合了ChatGPT3.5、GPT4.0、DALLE 3和Midjourney等多个智能服务,提供多功能体验。下面是对这些技术的简要概述: **ChatGPT3.5**:…

可视化智慧工厂

在科技迅猛发展的今天,制造业正迎来一场深刻的变革——智慧工厂的崛起。可视化智慧工厂作为其中的重要一环,以其直观、高效、智能的特点,正成为制造业转型升级的关键所在。 一、什么是可视化智慧工厂? 传统的制造业生产方式往往依赖于人工…

Typora配置PicGo图床,将图片文件上传到gitee厂库,获取图片链接显示在md文件中

Typora配置PicGo图床,将图片文件上传到gitee厂库,获取图片链接显示在md文件中 创建Gitee创库和配置私人令牌 名字、路径、描述自己随便添,但是必须开源,链接才能可以访问: 进入偏好设置 > 图像 > 选择PicGo-Cor…