共轭梯度法笔记

一、梯度下降法

在这里插入图片描述

x k + 1 = x k − α ∇ f ( x k ) x_{k+1} = x_k - \alpha \nabla f(x_k) xk+1=xkαf(xk)

  • 这是普通的梯度下降公式,有两个量是关键,步长 α \alpha α和方向 ∇ f ( x k ) \nabla f(x_k) f(xk)。这里的方向直接选择了梯度方向,也是使用最多,但是并不一定要是这个方向。

二、最速梯度下降

在这里插入图片描述

x k + 1 = x k − α ∇ f ( x k ) x_{k+1} = x_k - \alpha \nabla f(x_k) xk+1=xkαf(xk)
∂ f ( x k + 1 ) ∂ α k = 0 , α k = r k T r k r k T A r k \frac{\partial f(x_{k+1})}{\partial \alpha_k} = 0, \alpha_k = \frac{\mathbf{r}_k^T \mathbf{r}_k}{\mathbf{r}_k^T A \mathbf{r}_k} αkf(xk+1)=0αk=rkTArkrkTrk

  • 最速梯度下降与梯度下降的区别在于采用了一个公式计算步长 α \alpha α,计算思路就是在当前梯度方向上尽量降低评价函数
  • 推导过程可以参考https://www.bilibili.com/video/BV1kM4y177s1/?spm_id_from=333.337.search-card.all.click&vd_source=a686d8f8b0e9b94066f2d4ba714466e7
  • 这样没次更新后在之前的梯度方向上已经没有可以让f健翔的方向了,所以下一个梯度一定会与之前梯度正交

三、共轭梯度下降

整体讲解视频:
https://www.bilibili.com/video/BV1kM4y177s1/?spm_id_from=333.337.search-card.all.click&vd_source=a686d8f8b0e9b94066f2d4ba714466e7
为什么若干共轭梯度在一起可以高效到达期望点:https://blog.csdn.net/bitcarmanlee/article/details/121522734
讲解文字版:
https://blog.csdn.net/weixin_43940314/article/details/121125847

  • 最速梯度下降改变了步长,还可以改变方向,理想状态下是梯度之间可以相互垂直,这样不会出现最速梯度下降那样互相抵消的问题,推导如下:
    在这里插入图片描述
  • 在正交的前提下可以直接计算步长,但是这样存在的问题是并不知道 e i e_i ei,如果知道误差,直接算结果就行了,所以并没有一种叫做正交梯度下降的方法。因此选择了另一种选择方向的思路,采用共轭梯度的方向,也就是梯度方向之间相互共轭。
  • 共轭向量定义如下:
    在这里插入图片描述
  • 共轭向量有一个性质是线性无关
  • 这里我有一个疑惑是相互共轭的向量能像正交向量那样高效的达到期望点吗?也就是共轭向量可以简洁的表示期望点吗?其实是可以的,推导https://blog.csdn.net/bitcarmanlee/article/details/121522734
  • 方法推导过程如下:
    在这里插入图片描述
  • 共轭梯度的步长是用最速梯度下降的方法算的,用推导如下:
    在这里插入图片描述
  • 而方向就是先定义一些线性无关量,然后在每步利用类似施密特正交化的思路,将每个线性无关量转换成共轭量。向量之间相互共轭也线性无关,每次完成一次迭代就失去了一个方向上的误差,之后的梯度方向肯定有自己独特的信息,所以也是线性无关的(这可可以这样想,一个二维的误差空间,线性无关梯度方向有两个,第一次迭代去除一个维度后,新的梯度向量肯定有自己另一个维度的信息)。
  • 之前说最理想的梯度方向是相互正交其实是不准确的,只要梯度向量之间相互线性无关,这就是很好的梯度向量了。正交的梯度向量是线性无关的,但是没法算法。所以利用另外一个让梯度向量相互线性无关的可能方案,也就是共轭向量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/896845.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ubuntu 启动不起来,光标闪烁 解决方法

ubuntu 启动不起来,光标闪烁 进不了系统,解决方法 按ctrl alt f2,进入终端,登录。 jounal -b 查看启动日志。 发现是找不到显卡驱动程序。 解决方法: 卸载nvidia程序。 sudo systemctl stop gdm # 适用于GNOME…

CSS - 妙用Sass

官方文档:https://www.sass.hk/docs/ 1.例1: each $theme in $themeList {$themeKey: map-get($theme, key);media screen and (weex-theme: $themeKey) {.btnText {max-width: 150px;include font(map-get($theme, medFont),map-get($theme, subFontS…

chromadb向量数据库使用 (2)

目录 代码代码解释**1. 导入 chatGLM 嵌入函数****2. 创建 ChromaDB 客户端和集合****3. 查询集合中的数据数量****4. 添加数据到集合****5. 获取已存储的文档****6. 更新文档****7. 再次获取数据,验证更新结果****8. 删除某个文档****9. 获取已删除的文档****总结*…

我的世界1.20.1forge模组开发进阶物品(7)——具有动画、3D立体效果的物品

基础的物品大家都会做了对吧?包括武器的释放技能,这次来点难度,让物品的贴图呈现动画效果和扔出后显示3D立体效果,这个3D立体效果需要先学习blockbench,学习如何制作贴图。 Blockbench Blockbench是一个用于创建和编辑三维模型的免费软件,特别适用于Minecraft模型的设计…

大模型在败血症预测及围手术期管理中的应用研究报告

目录 一、引言 1.1 研究背景与意义 1.2 研究目的与创新点 1.3 研究方法与数据来源 二、败血症概述 2.1 定义与流行病学 2.2 病因与发病机制 2.3 临床表现与诊断标准 2.4 并发症与危害 三、大模型技术原理及在医疗领域的应用 3.1 大模型技术概述 3.2 大模型在医疗领…

SpringBoot接口自动化测试实战:从OpenAPI到压力测试全解析

引言:接口测试的必要性 在微服务架构盛行的今天,SpringBoot项目的接口质量直接影响着系统稳定性。本文将分享如何通过自动化工具链实现接口的功能验证与性能压测,使用OpenAPI规范打通测试全流程,让您的接口质量保障体系更加完备。…

微软具身智能感知交互多面手!Magma:基于基础模型的多模态AI智能体

作者: Jianwei Yang, Reuben Tan, Qianhui Wu, Ruijie Zheng, Baolin Peng, Yongyuan Liang, Yu Gu, MuCai, SeonghyeonYe, JoelJang, Yuquan Deng, Lars Liden, Jianfeng Gao 单位:微软研究院,马里兰大学,威斯康星大学麦迪逊分校…

Linux中jdk-8u291-linux-x64 中jdk工具包

jdk-8u291-linux-x64 指的是适用于 64 位 Linux 系统的 Java 开发工具包(JDK)8 更新 291 版本。这是 JDK 的一个特定版本,用于开发 Java 应用程序和小程序。 jdk-8u291-linux-x64 网盘下载链接:夸克网盘分享

Baklib云内容中台的核心架构是什么?

云内容中台分层架构解析 现代企业内容管理系统的核心在于构建动态聚合与智能分发的云端中枢。以Baklib为代表的云内容中台采用三层架构设计,其基础层为数据汇聚工具集,通过标准化接口实现多源异构数据的实时采集与清洗,支持从CRM、ERP等业务…

17.3 LangSmith Evaluation 深度解析:构建数据驱动的模型优化体系

LangSmith Evaluation 深度解析:构建数据驱动的模型优化体系 关键词:模型评估体系、自动化测试框架、业务指标对齐、A/B测试集成、生产级质量监控 1. Evaluation 核心功能全景 1.1 评估维度矩阵 维度评估指标示例采集方式质量评估准确率、相关性评分、事实性检查人工标注+A…

华为 VRP 系统简介配置SSH,TELNET远程登录

华为 VRP 系统简介&配置TELNET远程登录 1.华为 VRP 系统概述 1.1 什么是 VRP VRP(Versatile Routing Platform 华为数通设备操作系统)是华为公司数据通信产品的通用操作系统平台,从低端到核心的全系列路由器、以太网交换机、业务网关等…

算法基础 -- 字符串哈希的基本概念和数学原理分析

字符串哈希的基本概念和数学原理分析 1. 字符串哈希的定义和基本概念 哈希函数的定义 哈希函数(Hash Function)是一种将任意长度的输入映射为固定长度输出的函数。对于字符串而言,哈希函数通过某种算法将字符串转换成一个整数,…

从新加坡《Companion Guide on Securing AI Systems 》看可信AI全生命周期防护框架构建

从新加坡《AI系统安全指南配套手册》看可信AI全生命周期防护框架构建 一、引言 1.1 研究背景与意义 近年来,人工智能(AI)技术以前所未有的速度蓬勃发展,已然成为推动各行业变革与创新的核心驱动力。从医疗领域辅助疾病诊断,到金融行业的风险预测与智能投顾,再到交通领…

C++学习之C++初识、C++对C语言增强、对C语言扩展

一.C初识 1.C简介 2.第一个C程序 //#include <iostream> //iostream 相当于 C语言下的 stdio.h i - input 输入 o -output 输出 //using namespace std; //using 使用 namespace 命名空间 std 标准 &#xff0c;理解为打开一个房间&#xff0c;房间里有我们所需…

HTMLS基本结构及标签

HTML5是目前制作网页的核心技术&#xff0c;有叫超文本标记语言。 基本结构 声明部分位于文档的最前面&#xff0c;用于向浏览器说明当前文档使用HTML标准规范。 根部标签位于声明部分后&#xff0c;用于告知浏览器这是一个HTML文档。< html>表示文档开始&#xff0c;&l…

eMMC存储器详解(存储区域结构、EXT_CSD[179]、各分区介绍、主要引脚、命令格式与类型等)

读本篇博文所需要的先行知识 关于芯片内部的ROM的作用、工作原理的介绍&#xff0c;链接如下&#xff1a; https://blog.csdn.net/wenhao_ir/article/details/145969584 eMMC的物理结构、特点、用途 这个标题的相关内容见我的另一篇博文&#xff0c;博文链接如下&#xff1a…

分布式锁—2.Redisson的可重入锁一

大纲 1.Redisson可重入锁RedissonLock概述 2.可重入锁源码之创建RedissonClient实例 3.可重入锁源码之lua脚本加锁逻辑 4.可重入锁源码之WatchDog维持加锁逻辑 5.可重入锁源码之可重入加锁逻辑 6.可重入锁源码之锁的互斥阻塞逻辑 7.可重入锁源码之释放锁逻辑 8.可重入锁…

iOS实现一个强大的本地状态记录容器

我们开发中经常会遇到这样的场景&#xff0c;就是我们客户端用户进行了某个操作&#xff0c;这个操作影响了数据的状态&#xff0c;但是我们又不方便重新请求一次数据&#xff0c; 这个时候&#xff0c;就需要我们记录一下本地状态在内存中&#xff0c;随着业务越来越复杂&…

vue中带$的是什么

在Vue.js中&#xff0c;带的 $ 符号用于表示 Vue实例的属性和方法。 这些属性和方法是Vue框架内部定义的&#xff0c;主要用于方便开发者在组件内部访问和使用。 常见的带$的属性和方法: ‌$data‌&#xff1a;用于访问组件的内部数据对象&#xff0c;包含组件内定义的所有响…

杰和科技工业整机AF208|防尘+静音+全天候运行

在特殊的工业环境中&#xff0c;实现快速生产离不开各类工业计算机的强大支持。杰和科技工业计算机AF208&#xff0c;作为核心控制单元&#xff0c;凭借其坚固可靠的外壳、先进的散热技术以及紧凑灵活的部署特点&#xff0c;发挥着关键作用。 硬实力外壳&#xff0c;无惧尘埃 …