【随笔】地理探测器原理与运用

文章目录

  • 一、作者与下载
    • 1.1 软件作者
    • 1.2 软件下载
  • 二、原理简述
    • 2.1 空间分异性与地理探测器的提出
    • 2.2 地理探测器的数学模型
      • 2.21 分异及因子探测
      • 2.22 交互作用探测
      • 2.23 风险区与生态探测
  • 三、使用:excel

一、作者与下载

1.1 软件作者

作者:
在这里插入图片描述
DOI: 10.11821/dlxb201701010

文献:地理探测器:原理与展望。直接看这个文献也可以。

1.2 软件下载

主页:http://www.geodetector.cn/Download.html

分别是excel宏、R包、QGIS和ArcGIS Pro工具箱。

excel的都带有示例数据,不过第三个和第一个的数据是相同的(可能是网站文件设置错误,截至我发文日期)。
在这里插入图片描述

二、原理简述

2.1 空间分异性与地理探测器的提出

空间分异性的科学意义:

空间分异性(空间分层异质性)表现为地理现象在子区域内的方差小于总区域方差,例如气候带、土地利用分区等。地理探测器通过量化这一分异性,为揭示其驱动因子提供了统计学工具。

地理探测器的核心优势:

  1. 无需线性假设:适用于非线性关系分析。
  2. 物理含义明确:通过方差分解直接量化因子解释力。
  3. 多类型数据兼容:支持类型量(如分类地图)和离散化数值量的分析。

基本逻辑:

  • 分异性检验:若子区域方差和( S S W SSW SSW)小于总方差( S S T SST SST),则存在空间分异。
  • 因子关联性:若两变量空间分布一致,则存在统计关联。

2.2 地理探测器的数学模型

2.21 分异及因子探测

q统计量用于度量因子解释力:
q = 1 − ∑ h = 1 L N h σ h 2 N σ 2 = 1 − S S W S S T q = 1 - \frac{\sum_{h=1}^{L} N_h \sigma_h^2}{N\sigma^2} = 1 - \frac{SSW}{SST} q=1Nσ2h=1LNhσh2=1SSTSSW
式中:

  • L L L为分层数, N h N_h Nh N N N为子区域与全区域样本数。
  • σ h 2 \sigma_h^2 σh2 σ 2 \sigma^2 σ2为子区域与总体方差。

在这里插入图片描述

显著性检验通过非中心F分布实现:
F = N − L L − 1 ⋅ q 1 − q ∼ F ( L − 1 , N − L ; λ ) F = \frac{N-L}{L-1} \cdot \frac{q}{1-q} \sim F(L-1, N-L; \lambda) F=L1NL1qqF(L1,NL;λ)
其中非中心参数 λ \lambda λ为:
λ = 1 σ 2 [ ∑ h = 1 L Y ˉ h 2 − 1 N ( ∑ h = 1 L N h Y ˉ h ) 2 ] \lambda = \frac{1}{\sigma^2} \left[ \sum_{h=1}^{L} \bar{Y}_h^2 - \frac{1}{N} \left( \sum_{h=1}^{L} N_h \bar{Y}_h \right)^2 \right] λ=σ21 h=1LYˉh2N1(h=1LNhYˉh)2

某个因子的q值越大,他对因变量的解释力就越强。显著性检验的p值,就不用说了吧,比如小于0.01,就代表xxx.


2.22 交互作用探测

通过比较单因子与多因子叠加的 q q q值,判断交互作用类型:

  1. 非线性增强 q ( X 1 ∩ X 2 ) > q ( X 1 ) + q ( X 2 ) q(X_1 \cap X_2) > q(X_1) + q(X_2) q(X1X2)>q(X1)+q(X2)
  2. 双因子增强 q ( X 1 ∩ X 2 ) > max ⁡ ( q ( X 1 ) , q ( X 2 ) ) q(X_1 \cap X_2) > \max(q(X_1), q(X_2)) q(X1X2)>max(q(X1),q(X2))
  3. 单因子主导 max ⁡ ( q ( X 1 ) , q ( X 2 ) ) < q ( X 1 ∩ X 2 ) < q ( X 1 ) + q ( X 2 ) \max(q(X_1), q(X_2)) < q(X_1 \cap X_2) < q(X_1) + q(X_2) max(q(X1),q(X2))<q(X1X2)<q(X1)+q(X2)
  4. 独立作用 q ( X 1 ∩ X 2 ) = q ( X 1 ) + q ( X 2 ) q(X_1 \cap X_2) = q(X_1) + q(X_2) q(X1X2)=q(X1)+q(X2)
  5. 非线性减弱 q ( X 1 ∩ X 2 ) < min ⁡ ( q ( X 1 ) , q ( X 2 ) ) q(X_1 \cap X_2) < \min(q(X_1), q(X_2)) q(X1X2)<min(q(X1),q(X2))

在这里插入图片描述
这里的叠加,不是把各个因子相加,而是相交,简单来说就是分类增加了。看下图就明白了:
在这里插入图片描述

2.23 风险区与生态探测

  1. 风险区差异检验(t检验):
    t Y ˉ h = 1 − Y ˉ h = 2 = Y ˉ h = 1 − Y ˉ h = 2 Var ( Y ˉ h = 1 ) n h = 1 + Var ( Y ˉ h = 2 ) n h = 2 t_{\bar{Y}_{h=1} - \bar{Y}_{h=2}} = \frac{\bar{Y}_{h=1} - \bar{Y}_{h=2}}{\sqrt{\frac{\text{Var}(\bar{Y}_{h=1})}{n_{h=1}} + \frac{\text{Var}(\bar{Y}_{h=2})}{n_{h=2}}}} tYˉh=1Yˉh=2=nh=1Var(Yˉh=1)+nh=2Var(Yˉh=2) Yˉh=1Yˉh=2
    自由度 d f df df为:
    d f = ( Var ( Y ˉ h = 1 ) n h = 1 + Var ( Y ˉ h = 2 ) n h = 2 ) 2 1 n h = 1 − 1 ( Var ( Y ˉ h = 1 ) n h = 1 ) 2 + 1 n h = 2 − 1 ( Var ( Y ˉ h = 2 ) n h = 2 ) 2 df = \frac{\left( \frac{\text{Var}(\bar{Y}_{h=1})}{n_{h=1}} + \frac{\text{Var}(\bar{Y}_{h=2})}{n_{h=2}} \right)^2}{\frac{1}{n_{h=1}-1} \left( \frac{\text{Var}(\bar{Y}_{h=1})}{n_{h=1}} \right)^2 + \frac{1}{n_{h=2}-1} \left( \frac{\text{Var}(\bar{Y}_{h=2})}{n_{h=2}} \right)^2} df=nh=111(nh=1Var(Yˉh=1))2+nh=211(nh=2Var(Yˉh=2))2(nh=1Var(Yˉh=1)+nh=2Var(Yˉh=2))2

  2. 生态探测(F检验):
    F = N X 1 ( N X 2 − 1 ) S S W X 1 N X 2 ( N X 1 − 1 ) S S W X 2 F = \frac{N_{X1}(N_{X2}-1)SSW_{X1}}{N_{X2}(N_{X1}-1)SSW_{X2}} F=NX2(NX11)SSWX2NX1(NX21)SSWX1
    其中 S S W X 1 SSW_{X1} SSWX1 S S W X 2 SSW_{X2} SSWX2为两因子分层后的层内方差和。


三、使用:excel

以excel版本为例,R语言和GIS版本的也是类似的,R语言看它的help有函数说明的。

直接打开excel版本的xlsm文件,你可能无法使用,因为这是带宏的表格,系统会阻止运行。

在xlsm文件上右键–>属性:在最下面的位置会有一个解除阻止运行之类的选项(名字忘了),设置一下即可。图中我已经解除限制了,没有显示。
在这里插入图片描述

🟢打开表格:里面的数据可以删除换成自己的。自变量需要设置为分类变量。比如一个自变量是全国各个城市的GDP,你可以使用各自算法将数据分为几类,比如使用分位数,分为高中低三类,再编码为1、2、3这种。这个不会的话问AI即可。

接着读取数据到GUI界面,设置自变量、因变量,运行。

在这里插入图片描述
运行后会生成几个sheet:一般只使用交互效应和因子探测的表格,环境和风险的不常用。
在这里插入图片描述


🟢 数据说明:

他需要你提供一个“表格”形式的数据,比如ArcGIS的属性表。

数据量不要太大了:

  • 第一是数据量大,你电脑内存可能不足,比如一个像元一个值,几十米分辨率,你的研究区可能就会有几十亿个像元,存为csv需要几十GB,运行的时候内存通常不足;
  • 第二是运行时间太久,这个不用多说;
  • 第三是使用excel的情况下,excel就支持几百万行数据。实际上几万行数据,这个程序就会溢出的。
  • 第四十结果q值会非常小,因为这个计算出来的方差会非常小,那个比值接近1,q就接近0了。

建议的数据示例:每个城市的数据(因变量+自变量),这样就只有几百或者几十行数据。

另外一点是,自变量的分类(离散化)可能会影响结果:因为这个地理探测器的原理可以看作是,找到一条或者几条分界线,使得自变量和因变量都是用这一组分界线,能将数据很好的区分(当然这个比喻并不是是否准确)。这个分界线其实就相当于你对自变量的分类


参考文献:

王劲峰, 徐成东. 地理探测器:原理与展望[J]. 地理学报, 2017, 72(1): 116-134 https://doi.org/10.11821/dlxb201701010
Jinfeng WANG, Chengdong XU. Geodetector: Principle and prospective[J]. Acta Geographica Sinica, 2017, 72(1): 116-134 https://doi.org/10.11821/dlxb201701010

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/902993.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用达梦官方管理工具SQLark快速生成数据库ER图并导出

在数据库设计与开发中&#xff0c;实体-关系图&#xff08;ER 图&#xff09;作为数据建模的核心工具&#xff0c;能够直观呈现表结构、字段属性及表间关系&#xff0c;是团队沟通和文档维护的重要工具。然而&#xff0c;对于许多使用达梦数据库的开发者来说&#xff0c;可用的…

单精度浮点运算/定点运算下 MATLAB (VS) VIVADO

VIVADO中单精度浮点数IP核计算结果与MATLAB单精度浮点数计算结果的对比 MATLAB定点运算仿真&#xff0c;对比VIVADO计算的结果 目录 前言 一、VIVADO与MATLAB单精度浮点数运算结果对比 二、MATLAB定点运算仿真 总结 前言 本文介绍了怎么在MATLAB中使用单精度浮点数进行运算…

力扣-141.环形链表

题目描述 给你一个链表的头节点 head &#xff0c;判断链表中是否有环。 如果链表中存在环 &#xff0c;则返回 true 。 否则&#xff0c;返回 false 。 class Solution { public:bool hasCycle(ListNode *head) {ListNode *fast head;ListNode *slow head;while (fast! n…

RESTful学习笔记(一)

Web发展 一、API 程序硬件接口&#xff08;Application Programming Interface&#xff09;&#xff0c;是预先定义好的逻辑函数&#xff0c;软件系统不同组成部分衔接的约定&#xff0c;直接调用函数&#xff0c;无序访问代码细节&#xff0c;分为SDK和Web应用接口两类 SDK…

SD2351核心板:重构AI视觉产业价值链的“超级节点”

在AI视觉技术狂飙突进的当下&#xff0c;一个吊诡的现象正在浮现&#xff1a;一方面&#xff0c;学术界不断刷新着ImageNet等基准测试的精度纪录&#xff1b;另一方面&#xff0c;产业界却深陷“算法有、场景无&#xff0c;技术强、落地难”的怪圈。明远智睿SD2351核心板的问世…

【数据结构】红黑树原理及实现

目录 一. 红黑树的概念1. 红黑树的规则思考 2. 红黑树的效率 二.红黑树的实现1. 红黑树的结构2. 红黑树的插入3. 红黑树的平衡调整情况1&#xff1a;变色情况2&#xff1a;单旋变色情况3&#xff1a;双旋变色 4. 红黑树插入及平衡调整代码实现5.红黑树的验证 一. 红黑树的概念 …

时间复杂度分析

复杂度分析的必要性&#xff1a; 当给我们一段代码时&#xff0c;我们是以什么准则来判断代码效率的高低呢&#xff1f;每一段代码都会消耗一段时间&#xff0c;或占据一段数据空间&#xff0c;那么自然是在实现相同功能的情况下&#xff0c;代码所耗时间最少&#xff0c;所占…

L1-1、Prompt 是什么?为什么它能“控制 AI”?

*Prompt 入门 L1-1 想象一下&#xff0c;你只需输入一句话&#xff0c;AI 就能自动为你写一篇文案、生成一份报告、甚至规划你的创业计划。这种“对话即编程”的背后魔法&#xff0c;就是 Prompt 的力量。 &#x1f50d; 一、Prompt 的定义与由来 Prompt&#xff08;提示词&am…

微信小程序文章管理系统开发实现

概述 在内容为王的互联网时代&#xff0c;高效的文章管理系统成为各类平台的刚需。幽络源平台今日分享一款基于SSM框架开发的微信小程序文章管理系统完整解决方案&#xff0c;该系统实现了多角色内容管理、智能分类、互动交流等功能。 主要内容 一、用户端功能模块 ​​多角…

【Python-Day 5】Python 格式化输出实战:%、format()、f-string 对比与最佳实践

Langchain系列文章目录 01-玩转LangChain&#xff1a;从模型调用到Prompt模板与输出解析的完整指南 02-玩转 LangChain Memory 模块&#xff1a;四种记忆类型详解及应用场景全覆盖 03-全面掌握 LangChain&#xff1a;从核心链条构建到动态任务分配的实战指南 04-玩转 LangChai…

R7周:糖尿病预测模型优化探索

&#x1f368; 本文为&#x1f517;365天深度学习训练营中的学习记录博客 &#x1f356; 原作者&#xff1a;K同学啊 一、数据预处理 1.设置GPU import torch.nn.functional as F import torch.nn as nn import torch, torchvisiondevice torch.device("cuda"…

使用Tortoise-ORM和FastAPI构建评论系统

title: 使用Tortoise-ORM和FastAPI构建评论系统 date: 2025/04/25 21:37:36 updated: 2025/04/25 21:37:36 author: cmdragon excerpt: 在models.py中定义了Comment模型,包含id、content、created_at、updated_at字段,并与User和Article模型建立外键关系。schemas.py中定义了…

【VS Code】如何使用SSH打开远程服务器Docker上的项目或文件夹

要在VS Code中使用SSH打开远程服务器Docker上的项目或文件夹&#xff0c;您需要结合使用VS Code的Remote - SSH扩展和Docker的远程访问功能。以下是详细步骤&#xff1a; 安装VS Code Remote - SSH扩展 打开VS Code。点击左侧活动栏的扩展图标&#xff08;或使用快捷键CtrlShif…

NHANES指标推荐:PLP

文章题目&#xff1a;Association of pyridoxal 5-phosphate (PLP) with lipid profiles: a population-based cohort study DOI&#xff1a;10.3389/fnut.2025.1545301 中文标题&#xff1a;5-磷酸吡哆醛 (PLP) 与血脂谱的关系&#xff1a;一项基于人群的队列研究 发表杂志&am…

MySQL 详解之备份与恢复策略:数据安全的最后一道防线

在任何信息系统中,数据都是最宝贵的资产。数据的丢失可能源于多种原因:硬件故障、人为误操作、软件 Bug、恶意攻击,甚至自然灾害。一旦发生数据丢失,如果没有有效的备份和恢复机制,后果可能是灾难性的,可能导致业务中断、经济损失甚至法律责任。 数据库备份与恢复,正是…

2026《数据结构》考研复习笔记五(栈、队列)

栈、队列 一、栈1.卡特兰数2.不合法的出栈序列 二、队列1.循环队列2.输入输出受限队列&#xff08;四个数1234&#xff09; 三、算法1.栈在括号匹配中的应用2.中缀表达式求值&#xff08;通过转化为后缀表达式再后缀表达式求值&#xff09;3.中缀表达式转化为后缀表达式4.后缀表…

深入解析微软MarkitDown:原理、应用与二次开发指南

一、项目背景与技术定位 微软开源的MarkitDown并非简单的又一个Markdown解析器&#xff0c;而是针对现代文档处理需求设计的工具链核心组件。该项目诞生于微软内部大规模文档系统的开发实践&#xff0c;旨在解决以下技术痛点&#xff1a; 大规模文档处理性能&#xff1a;能够高…

pyinstaller打包paddleocr发生错误解决

python环境是3.9&#xff0c;github paddleocr v2.10.0。 一个非常简单的案例如下&#xff0c;打包时发生错误。 import requests from paddleocr import PaddleOCR if __name__ "__main__":paddleocr_ocr PaddleOCR(use_angle_clsTrue, langch,det_model_dirmode…

算法之回溯法

回溯法 回溯法定义与概念核心思想回溯法的一般框架伪代码表示C语言实现框架 回溯法的优化技巧剪枝策略实现剪枝的C语言示例记忆化搜索 案例分析N皇后问题子集和问题全排列问题寻路问题 回溯法的可视化理解决策树状态空间树回溯过程 回溯法与其他算法的比较回溯法与动态规划的区…

命令行指引的尝试

效果 步骤 首先初始化一个空的项目&#xff0c;然后安装一些依赖 npm init -y npm install inquirer execa chalk ora至于这些依赖是干嘛的&#xff0c;如下图所示&#xff1a; 然后再 package.json 中补充一个 bin 然后再根目录下新建一个 index.js , 其中的内容如下 #!/…