PyTorch PINN实战:用深度学习求解微分方程

在人工智能与计算数学的交汇点,物理信息神经网络(Physics-Informed Neural Networks,PINN)正引领着一场求解微分方程的革命。传统上,微分方程是描述自然现象和工程问题中各种关系的重要工具,但其求解往往依赖于复杂的数值方法或耗时的实验验证。然而,随着深度学习技术的飞速发展,PINN为我们提供了一种全新的、高效的求解途径。本文将深入探讨PyTorch PINN的实战应用,展示如何用深度学习求解微分方程,让读者在收获知识的同时,感受到科技创新的魅力。

#### 一、引言:传统方法的局限与PINN的崛起

微分方程,无论是常微分方程(ODE)还是偏微分方程(PDE),都是描述自然界中连续变化过程的基本工具。然而,传统求解微分方程的方法,如有限差分法、有限元法等,往往面临计算复杂度高、对高维问题处理困难等挑战。此外,这些方法通常需要大量的计算资源和时间,且对于某些复杂问题,可能无法得到精确的解析解。

随着深度学习的兴起,神经网络以其强大的非线性拟合能力和数据驱动的学习机制,为解决微分方程提供了新的思路。然而,传统的神经网络模型在求解微分方程时,往往依赖于大规模的标记数据集,这在许多实际应用中是不切实际的。因此,PINN应运而生,它将物理定律(即微分方程)直接整合到神经网络的训练过程中,从而显著提高了数据利用效率,为求解微分方程开辟了一条新的道路。

#### 二、PINN的基本原理与优势

PINN的核心思想是将微分方程的约束条件嵌入到神经网络的损失函数中,使网络在训练过程中不仅能够拟合给定的数据点,还能够满足微分方程的定义。具体来说,PINN的损失函数通常由两部分组成:一部分是数据损失,用于衡量网络输出与真实数据之间的差异;另一部分是物理损失,用于衡量网络输出对微分方程约束的满足程度。

PINN相比传统方法具有显著的优势。首先,它不需要大量的标记数据集,而是通过物理定律的约束从相对小规模的数据集中有效学习。其次,PINN能够处理传统数值求解器难以应对的高维复杂偏微分方程。此外,训练完成后,PINN模型具有良好的泛化能力,可预测不同初始条件或边界条件下的解。在处理逆问题时,PINN对噪声和稀疏数据也表现出较强的鲁棒性。

#### 三、PyTorch PINN实战:求解常微分方程

为了更具体地展示PINN的实战应用,我们将以求解一个简单的常微分方程为例,介绍如何使用PyTorch实现PINN。

**(一)问题定义**

考虑以下一阶线性常微分方程:

$y'(x) = 2x + 5$

初始条件为:

$y(0) = 3$

**(二)数据准备**

在PINN中,我们不需要大量的标记数据集,但为了训练和评估模型,我们仍然需要一些数据点。这里,我们可以使用解析解来生成一些训练数据和测试数据。

**(三)模型搭建**

接下来,我们使用PyTorch定义一个简单的全连接神经网络作为PINN模型。模型的结构可以根据问题的复杂程度进行调整,但通常包括一个输入层、若干个隐藏层和一个输出层。在隐藏层中,我们可以使用ReLU、Tanh等激活函数来增加网络的非线性拟合能力。

```python
import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np
import matplotlib.pyplot as plt

class PINN(nn.Module):
    def __init__(self):
        super(PINN, self).__init__()
        self.net = nn.Sequential(
            nn.Linear(1, 20), nn.Tanh(),
            nn.Linear(20, 20), nn.Tanh(),
            nn.Linear(20, 1)
        )

    def forward(self, x):
        return self.net(x)
```

**(四)损失函数定义**

PINN的损失函数由数据损失和物理损失两部分组成。数据损失用于衡量网络输出与真实数据之间的差异,而物理损失则用于衡量网络输出对微分方程约束的满足程度。

```python
def pinn_loss(model, x):
    x.requires_grad = True
    y = model(x)
    dy_dx = torch.autograd.grad(y, x, torch.ones_like(y), create_graph=True)[0]
    ode_loss = torch.mean((dy_dx - (2 * x + 5)) ** 2)
    x0 = torch.tensor([[0.0]])
    y0_pred = model(x0)
    initial_loss = (y0_pred - 3) ** 2
    total_loss = ode_loss + initial_loss
    return total_loss, ode_loss, initial_loss
```

**(五)模型训练**

在模型训练过程中,我们使用优化器(如Adam)来迭代更新网络的权重参数,以最小化损失函数。同时,我们可以使用训练过程中的损失变化来评估模型的收敛情况。

```python
model = PINN()
optimizer = optim.Adam(model.parameters(), lr=1e-3)
epochs = 5000
loss_history = []
ode_loss_history = []
initial_loss_history = []

x_train = torch.linspace(-2, 2, 100).view(-1, 1)
for epoch in range(epochs):
    optimizer.zero_grad()
    total_loss, ode_loss, initial_loss = pinn_loss(model, x_train)
    total_loss.backward()
    optimizer.step()
    loss_history.append(total_loss.item())
    ode_loss_history.append(ode_loss.item())
    initial_loss_history.append(initial_loss.item())
    if epoch % 1000 == 0:
        print(f"Epoch {epoch}, Loss: {total_loss.item():.6f}")
```

**(六)结果展示**

训练完成后,我们可以使用测试数据来评估模型的性能。同时,我们还可以绘制训练过程中的损失变化曲线,以观察模型的收敛情况。

```python
x_test = torch.linspace(-2, 2, 100).view(-1, 1)
y_true = x_test ** 2 + 5 * x_test + 3  # 真实解
y_pred = model(x_test)

plt.figure(figsize=(8, 5))
plt.plot(x_test.numpy(), y_true.numpy(), linestyle="dashed", linewidth=2, label="True Solution")
plt.plot(x_test.numpy(), y_pred.detach().numpy(), linewidth=2, label="PINN Prediction")
plt.xlabel("x")
plt.ylabel("y(x)")
plt.legend()
plt.title("PINN Solution of ODE")
plt.grid()
plt.show()

plt.figure(figsize=(8, 5))
epochs_list = np.arange(1, epochs + 1)
plt.semilogy(epochs_list, loss_history, 'k--', linewidth=3, label=r'Total Loss $(L_D + L_B)$')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.legend()
plt.title('Training Loss Over Epochs')
plt.grid()
plt.show()
```

#### 四、PyTorch PINN实战:求解偏微分方程

PINN不仅可以用于求解常微分方程,还可以扩展到求解偏微分方程。以二维热传导方程为例,我们将展示如何使用PyTorch PINN来求解这类问题。

**(一)问题定义**

考虑以下二维热传导方程:

$\frac{\partial u}{\partial t} = \alpha \left( \frac{\partial^2 u}{\partial x^2} + \frac{\partial^2 u}{\partial y^2} \right)$

其中,$u(x, y, t)$是温度分布函数,$\alpha$是热扩散系数。

**(二)数据准备与模型搭建**

与常微分方程类似,我们需要准备一些训练数据和测试数据来训练和评估模型。同时,我们还需要根据问题的复杂程度搭建一个合适的神经网络模型。

**(三)损失函数定义与模型训练**

对于偏微分方程,我们需要定义更加复杂的损失函数来同时考虑时间导数、空间导数和初始/边界条件。在模型训练过程中,我们仍然使用优化器来迭代更新网络的权重参数,以最小化损失函数。

**(四)结果展示与分析**

训练完成后,我们可以使用测试数据来评估模型的性能,并绘制温度分布图来直观展示结果。同时,我们还可以分析不同参数对模型性能的影响,以进一步优化模型。

#### 五、创新性探讨与未来展望

PINN作为一种新兴的求解微分方程的方法,具有许多创新性和潜力。首先,它将物理定律直接整合到神经网络的训练过程中,实现了数据驱动与物理约束的有机结合。其次,PINN能够处理传统数值求解器难以应对的高维复杂问题,为科学计算和工程应用提供了新的解决方案。

然而,PINN仍然面临一些挑战和限制。例如,训练过程计算密集且耗时较长,尤其对于高维偏微分方程;模型对超参数选择较为敏感,需要精细调整以平衡不同损失项。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/72453.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【WiFi 7核心技术及未来挑战】

作为刚刚开始从事这一领域的人,浅浅学习了一下WiFi 7(IEEE 802.11be)。Wi-Fi 7发展迅速,提供前所未有的速度、更低的延迟和更高的可靠性。但从频谱政策到能效挑战,再到成本,仍有许多问题亟待解决。 Wi-Fi 7…

Oracle Linux Server 7.9安装fail2ban

yum search oracle-epel-release yum install oracle-epel-release-el7 search fail2ban yum install fail2ban nano /etc/fail2ban/jail.d/00-firewalld.conf # defalut这里是设定全局设置,如果下面的监控没有设置就以全局设置的值设置。 [DEFAULT] # 用于指定哪…

目标在哪里?——寻找人生的意义与方向

在职场中,许多人都会经历这样的困惑:工作看似顺利,却逐渐失去了成就感和成长感。一位在500强企业工作的学员就遇到了这样的问题。她曾考虑过转型做培训,但苦于找不到明确的切入点,对未来的目标感到迷茫。她不禁问自己&…

C++类与对象——拷贝构造与运算符重载

拷贝构造函数和赋值运算符重载就是C类默认六个函数之二。 拷贝构造函数: 如果⼀个构造函数的第⼀个参数是自身类类型的引用,且任何额外的参数都有默认值,则此构造函数 也叫做拷贝构造函数,也就是说拷贝构造是⼀个特殊的构造函数…

破碎的誓言

破碎的誓言 在秋风的呢喃中,落叶轻叹, 昔日的誓言,如烟消散。 你的眼眸,曾是我星辰的指引, 如今,却成了最深的迷惘。 欺骗的利刃,刺穿了信任的堡垒, 我的心,如裂开…

AD画板学习

AD画板 01 课程简介及学习目标 (1)能熟练的新建项目文件、原理图文件、PCB文件且修改文件名,并知道文件保存的位置; (2)会设置原理图编辑器的工作环境,会自底向上绘制层次原理图; …

Linux:进程程序替换

目录 前言 一 进程程序替换的概念 二 进程程序替换的原理 三 为什么需要进行进程程序替换 四 如何进行进程程序替换 1. 进程替换函数 ➊ execl()函数 ➋execv()函数 ➌execlp()函数 ➍execle()函数 ➎execve()* 前言 一般情况下,对应的语言写的程序只…

基于变分推理与 Best‑of‑N 策略的元 Prompt 自动生成与优化框架

摘要 本文提出了一种融合变分推理与 Best‑of‑N 策略的元 Prompt 自动生成与优化框架,通过高度参数化的模板、随机扰动采样及多指标评分机制,实现从初始提示生成到最终输出的动态优化。同时,针对实际应用中对自适应参数调整、深层语义理解、…

Umi-OCR 全家桶

介绍: 下载 访问官网地址 https://github.com/hiroi-sora/umi-ocrhttps://github.com/hiroi-sora/umi-ocr 点击下载(.exe 文件 安装即可) 桌面使用 安装完毕后去安装路径下点击 Umi-OCR.exe (默认不会生成桌面的快捷方式&…

2023南京理工大学计算机复试上机真题

2023南京理工大学计算机复试上机真题 2023南京理工大学计算机复试机试真题 历年南京理工大学计算机复试上机真题 在线评测:传送门:pgcode.cn 括号匹配二 题目描述 苗苗今天刚刚学会使用括号,不过他分不清小括号,中括号&#…

Conda 常规用法指南

Conda 常规用法指南 1. Conda 简介 Conda 是一个开源的包管理和环境管理系统,主要用于 Python 和其他编程语言的开发环境。它能够方便地安装、更新和管理依赖项,使得不同项目可以使用不同的 Python 版本和库。 2. Conda 环境管理 2.1 创建新的环境 conda…

非零初始条件系统的传递函数分析

非零初始条件系统的传递函数分析 在传递函数的定义中,通常假设系统满足零初始条件。然而在实际应用中,很多系统需要处理非零初始状态。为了探讨这一问题,我们以一个一阶微分方程为例进行分析。 一、一阶系统的分析 考虑以下一阶微分方程&a…

centos7安装时采用的默认分区(比如:/dev/sda3的对应挂载点是/),如何对系统扩容?

‌非LVM分区扩容方案‌ 若 /dev/sda3 是‌非LVM分区‌且存储重要数据,可通过 ‌直接扩展分区容量‌ ‌调整文件系统‌ 实现扩容,无需重建LVM或格式化分区‌。以下是具体步骤: ‌1. 扩展物理磁盘(虚拟机场景)‌ ‌关…

Axios简单说明,快速上手

Ajax:异步的JavaScript和XML 作用: 数据交换异步交互 Axios:就是对原生Ajax进行封装,简化书写,快速开发 使用逻辑: 首先要安装Axios,可以通过npm在项目中安装: 打开命令行工具…

模型评估——acc、P、R、F值、交叉验证、K折交叉验证

模型评估:对预测函数地预测精度的评估。 多重回归:涉及三个及其以上的变量的回归问题。 评估模型的方法: 交叉验证:将数据集分成测试集和训练集,可以采用3:7或者2:8的比例方式进行划分&#xff…

【Godot】Window类

(参考自deepseek回答) 在 Godot 引擎中,Window 是一个用于管理应用程序窗口的类。它是 Godot 4.0 引入的新特性,取代了旧版本中的 OS 类对窗口的管理功能。Window 提供了对窗口大小、位置、标题、模式等属性的控制,使开…

JVM 2015/3/15

定义:Java Virtual Machine -java程序的运行环境(java二进制字节码的运行环境) 好处: 一次编写,到处运行 自动内存管理,垃圾回收 数组下标越界检测 多态 比较:jvm/jre/jdk 常见的JVM&…

git submodule

git submodule git submodule 的作用是将一个 git 仓库,最为另一个 git 仓库的子模块 比如 A 仓库地址:gitgithub.com:xxxxxxx/A.git B 仓库地址:gitgithub.com:xxxxxxx/B.git 一、克隆 A 仓库 打开拉取的 A 项目根目录 在 A 项目中添加 …

Compose 实践与探索九 —— DrawModifier 解析

本篇讲解 DrawModifier 的基本用法与代码原理,介绍原理的目的在于可以判断绘制与绘制的关系,绘制与布局的关系。知道达成某种绘制效果应该怎么写,面对复杂的 Modifier 链时对效果有大致预判。 DrawModifier 管理绘制,需要以负责管…

华为手机助手输入连接码时光标乱跳

问题复现:输入12345678,光标自动跳转导致连接码出现乱序情况。 千万别试着找出规律,已试动态规律非大牛误轻试 问题原因: 想啥呢?华哥的软件又不是我开发我要Know Why干啥 我只需关心解决方案 (可能时输入…