python:music21 构建 LSTM+GAN 模型生成爵士风格音乐

keras_lstm_gan_midi.py 这是一个结合 LSTM 和 GAN 生成爵士风格音乐的完整Python脚本。这个实现包含音乐特征提取、对抗训练机制和MIDI生成功能:

import numpy as np
from music21 import converter, instrument, note, chord, stream
from tensorflow.keras.models import Sequential, Model
from tensorflow.keras.layers import (LSTM, Dense, Dropout, Input, Embedding, Reshape, Bidirectional, Conv1D, Flatten)
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.utils import to_categorical# 配置参数
MIDI_FILE = "jazz_swing.mid"  # 爵士训练数据
SEQ_LENGTH = 32               # 序列长度
NOISE_DIM = 100               # 噪声向量维度
BATCH_SIZE = 64
EPOCHS = 2000
STEPS_PER_EPOCH = 50
SAVE_INTERVAL = 100class JazzGAN:def __init__(self, vocab_size):self.vocab_size = vocab_sizeself.seq_length = SEQ_LENGTHself.noise_dim = NOISE_DIM# 构建模型self.generator = self.build_generator()self.discriminator = self.build_discriminator()self.gan = self.build_gan()# 配置优化器self.d_optimizer = Adam(0.0002, 0.5)self.g_optimizer = Adam(0.0001, 0.5)def build_generator(self):"""构建LSTM生成器"""model = Sequential([Input(shape=(self.noise_dim,)),Dense(256),Reshape((1, 256)),LSTM(512, return_sequences=True),Dropout(0.3),LSTM(256),Dense(self.vocab_size, activation='softmax')])return modeldef build_discriminator(self):"""构建CNN-LSTM判别器""" model = Sequential([Input(shape=(self.seq_length,)),Embedding(self.vocab_size, 128),Conv1D(64, 3, strides=2, padding='same'),Bidirectional(LSTM(128)),Dense(64, activation='relu'),Dropout(0.2),Dense(1, activation='sigmoid')])return modeldef build_gan(self):"""组合GAN模型"""self.discriminator.trainable = Falsegan_input = Input(shape=(self.noise_dim,))generated_seq = self.generator(gan_input)validity = self.discriminator(generated_seq)return Model(gan_input, validity)def preprocess_midi(self, file_path):"""处理MIDI数据"""notes = []midi = converter.parse(file_path)print("Extracting notes...")for element in midi.flat.notes:if isinstance(element, note.Note):notes.append(str(element.pitch))elif isinstance(element, chord.Chord):notes.append('.'.join(str(n) for n in element.normalOrder))# 创建字典映射unique_notes = sorted(set(notes))self.note_to_int = {n:i for i, n in enumerate(unique_notes)}self.int_to_note = {i:n for i, n in enumerate(unique_notes)}self.vocab_size = len(unique_notes)# 转换为整数序列int_sequence = [self.note_to_int[n] for n in notes]# 创建训练序列sequences = []for i in range(len(int_sequence) - self.seq_length):seq = int_sequence[i:i+self.seq_length]sequences.append(seq)return np.array(sequences)def train(self, X_train):# 标签平滑valid = np.ones((BATCH_SIZE, 1)) * 0.9fake = np.zeros((BATCH_SIZE, 1))for epoch in range(EPOCHS):# 训练判别器idx = np.random.randint(0, X_train.shape[0], BATCH_SIZE)real_seqs = X_train[idx]noise = np.random.normal(0, 1, (BATCH_SIZE, self.noise_dim))gen_seqs = self.generator.predict(noise)d_loss_real = self.discriminator.train_on_batch(real_seqs, valid)d_loss_fake = self.discriminator.train_on_batch(gen_seqs, fake)d_loss = 0.5 * np.add(d_loss_real, d_loss_fake)# 训练生成器noise = np.random.normal(0, 1, (BATCH_SIZE, self.noise_dim))g_loss = self.gan.train_on_batch(noise, valid)# 输出训练进度if epoch % 100 == 0:print(f"Epoch {epoch} | D Loss: {d_loss[0]} | G Loss: {g_loss}")# 保存示例if epoch % SAVE_INTERVAL == 0:self.generate_and_save(epoch)def generate_and_save(self, epoch):"""生成示例音乐"""noise = np.random.normal(0, 1, (1, self.noise_dim))generated = self.generator.predict(noise)generated_indices = np.argmax(generated, axis=-1)# 转换为音符output_notes = []for idx in generated_indices[0]:output_notes.append(self.int_to_note[idx])# 创建MIDI流midi_stream = stream.Stream()for pattern in output_notes:# 添加爵士和弦扩展if '.' in pattern:notes_in_chord = pattern.split('.')chord_notes = [note.Note(int(n)) for n in notes_in_chord]# 添加7th扩展if len(chord_notes) == 3:root = chord_notes[0].pitchchord_notes.append(root.transpose(10))new_chord = chord.Chord(chord_notes)midi_stream.append(new_chord)else:new_note = note.Note(int(pattern))new_note.storedInstrument = instrument.Saxophone()midi_stream.append(new_note)# 添加摇摆节奏self.add_swing_rhythm(midi_stream)midi_stream.write('midi', fp=f'jazz_gan_{epoch}.mid')print(f"Saved sample at epoch {epoch}")def add_swing_rhythm(self, stream_obj):"""添加爵士摇摆节奏"""for i, n in enumerate(stream_obj.flat.notes):if i % 2 == 1:  # 每两个音符中的第二个n.offset += 0.08  # 轻微延迟if isinstance(n, note.Note):n.duration.quarterLength *= 0.9if __name__ == "__main__":# 初始化并预处理数据gan = JazzGAN(vocab_size=0)  # 初始占位sequences = gan.preprocess_midi(MIDI_FILE)# 训练GANgan.train(sequences)

使用说明:

  1. 准备数据

    • 需要至少10-20个爵士MIDI文件(建议包含钢琴三重奏、大乐队等风格)

    • 推荐数据集:Jazzomat Research Project
      MeloSpySuite 捆绑了3个命令行工具:用于转换旋律文件格式的 melconv、用于特征提取的 melfeature 和用于模式挖掘的 melpat。

  2. 环境配置
    pip install tensorflow
    pip install music

实现亮点说明:

1.模型架构改进

  1. 混合架构设计

    • 生成器:使用双层LSTM结构,适合处理音乐时序特征

    • 判别器:结合CNN和BiLSTM,有效捕捉局部与全局模式

    • 加入Embedding层处理离散音符符号

  2. 爵士特征增强

    # 在和弦中自动添加7th音
    if len(chord_notes) == 3:root = chord_notes[0].pitchchord_notes.append(root.transpose(10))# 摇摆节奏处理
    n.offset += 0.08
    n.duration.quarterLength *= 0.9
    
  3. 训练优化技巧

    • 使用标签平滑(Label Smoothing)提升判别器鲁棒性

    • 分离生成器和判别器的学习率(0.0001 vs 0.0002)

    • 定期保存生成样本监控训练进度

  4.  训练建议

    • 使用GPU加速(至少需要8GB显存)

    • 初始阶段设置EPOCHS=500 以获得较好效果

    • 调整SEQ_LENGTH(32-64)匹配音乐片段长度

  5. 生成样本后处理

    • 使用DAW(如 Ableton Live)添加爵士乐器的真实音色

    • 人工调整和声进行确保功能性(II-V-I等典型进行)

性能优化方向

  1. 模型架构改进

    # 在生成器加入注意力机制
    from tensorflow.keras.layers import Attentiondef build_generator(self):inputs = Input(shape=(self.noise_dim,))x = Dense(256)(inputs)x = Reshape((1, 256))(x)x = LSTM(512, return_sequences=True)(x)x = Attention()([x, x])  # 自注意力x = LSTM(256)(x)outputs = Dense(self.vocab_size, activation='softmax')(x)return Model(inputs, outputs)
    

    2.数据增强: 

    # 实时数据增强
    def augment_sequence(seq):# 随机转调if np.random.rand() > 0.5:shift = np.random.randint(-3, 4)seq = (seq + shift) % self.vocab_size# 随机节奏缩放return seq
    

该脚本生成的爵士音乐将具备以下特征:

  • 复杂的和弦扩展(7th、9th、11th)

  • 摇摆节奏(Swing Feel)

  • 即兴化的旋律走向

  • 符合爵士和声进行规则(如替代和弦使用)

建议配合使用MIDI效果器(如iReal Pro的和声引擎)进行后期处理,可以获得更专业的爵士乐效果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/899051.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

go:前后端分离

1.前端代码 新建一个前端文件夹,在该文件夹下新建一个.html文件,写入自己的html代码。 前端搞定。 2.后端代码 其核心是挂载路由接受前端传来的数据核心代码如下: func main() { // 服务运行提示 fmt.Println("go web server is runn…

大数据学习(86)-Zookeeper去中心化调度

🍋🍋大数据学习🍋🍋 🔥系列专栏: 👑哲学语录: 用力所能及,改变世界。 💖如果觉得博主的文章还不错的话,请点赞👍收藏⭐️留言📝支持一…

JetsonNano —— 4、Windows下对JetsonNano板卡烧录刷机Ubuntu20.04版本(官方教程)

介绍 NVIDIA Jetson Nano™ 开发者套件是一款面向创客、学习者和开发人员的小型 AI 计算机。按照这个简短的指南,你就可以开始构建实用的 AI 应用程序、酷炫的 AI 机器人等了。 烧录刷机 1、下载 Jetson Nano开发者套件SD卡映像 解压出.img文件并记下它在计算机上的…

HTML5 拖放(Drag and Drop)学习笔记

一、HTML5 拖放简介 HTML5 拖放(Drag and Drop)是HTML5标准的一部分,允许用户抓取一个对象并将其拖动到另一个位置。拖放功能在现代网页中非常常见,例如文件上传、任务管理、布局调整等场景。 HTML5 拖放功能支持以下浏览器&…

文件I/O--C++的文件操作

一、打开文件&#xff0c;从文件中读取、写入文件 从文件中读取数据&#xff1a; #include<fstream> //fstream File stream:文件流 #include<iostream> //fstream包含了 iostream&#xff0c;所以这句可以省略&#xff0c;现在不能了 using namespace std;i…

Redis GEO 命令详解:轻松实现“附近的人“功能

目录 引言 Redis GEO命令概述 什么是GEO命令&#xff1f; 主要命令详解 命令应用示例 添加地点信息 查询两地距离 查询附近的城市 实现"查找附近的人"功能 功能需求与实现思路 基本需求 实现思路 命令实现方案 存储用户位置 查询附近的用户 Java代码实…

C语言贪吃蛇实现

When the night gets dark,remember that the Sun is also a star. 当夜幕降临时&#xff0c;请记住太阳也是一颗星星。 ————《去月球海滩篇》 目录 文章目录 一、《贪吃蛇》游戏介绍 二、WIN32部分接口简单介绍 2.1 控制台窗口大小设置 2.2 命令行窗口的名称的变更 2…

NIO入门

IO和NIO的区别&#xff1a; IO&#xff1a;通过流处理数据&#xff0c;仅支持阻塞IO。 核心组件&#xff1a;InputStream /OutputStream用于字节的读写&#xff0c;Reader / Writer&#xff1a;用于字符流的读写。读取过程中无法被中断&#xff0c;是阻塞式IO。 NIO:通过管道处…

基于vue.js开发的家庭装修管理系统开发与设计(源码+lw+部署文档+讲解),源码可白嫖!

摘要 本家庭装修管理系统采用B/S架构&#xff0c;数据库是MySQL&#xff0c;网站的搭建与开发采用了先进的Node.js语言进行编写&#xff0c;使用了VUE框架。该系统从两个对象&#xff1a;由管理员和用户来对系统进行设计构建。用户的功能包括&#xff1a;注册、登录、浏览首页…

OpenCV图像拼接(5)图像拼接模块的用于创建权重图函数createWeightMap()

操作系统&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 编程语言&#xff1a;C11 算法描述 cv::detail::createWeightMap 是 OpenCV 库中用于图像拼接模块的一个函数&#xff0c;主要用于创建权重图。这个权重图在图像拼接过程中扮演着重…

LangGraph 怎么控制递归次数

这一节我们讲讲langgraph图的递归限制 Recursion Limit&#xff0c;递归限制设置了图在单次执行过程中可以执行的最大超级步骤数。一旦达到该限制&#xff0c;LangGraph 将引发 GraphRecursionError 错误。默认情况下&#xff0c;此值设置为 25 步。递归限制可以在运行时为任何…

08-项目中不可控的任务如何安排和验收

项目中有时会有一些任务的时间是不可控的&#xff0c;不可控的原因在于该工作完全受制于他人。意思就是如果其他人没有做好&#xff0c;比如前后端同步开发&#xff0c;前端通常可能会快一些&#xff0c;然后要等后端提供接口&#xff0c;这个时候联调工作是没办法开展的&#…

【Git】git cherry-pick(将某个分支的 commit 改动复制到当前分支)

文章目录 ‌一、基础用法1.1、‌应用单个提交1.2、‌应用多个非连续提交1.3、‌应用多个连续提交 ‌二、高级用法‌2.1、冲突处理‌2.2、放弃操作‌2.3、‌不自动提交2.4、应用分支的最新提交 ‌一、基础用法 1.1、‌应用单个提交 使用提交的哈希值&#xff08;可通过 git lo…

Milvus WeightedRanker 对比 RRF 重排机制

省流:优先选择WeightedRanker 以rag为例,优先选择bm25全文检索,其次选择向量检索 Milvus混合搜索中的重排机制 Milvus通过hybrid_search() API启用混合搜索功能&#xff0c;结合复杂的重排策略来优化多个AnnSearchRequest实例的搜索结果。本主题涵盖了重排过程&#xff0c;…

C++手撕共享指针、多线程交替、LRU缓存

1. 共享指针 #include <atomic> #include <iostream>template <typename T> class sharedptr { private:T *ptr;std::atomic<size_t> *count;public:sharedptr(T *p) : ptr(p), count(new std::atomic<size_t>(1)) {}sharedptr(const sharedptr…

新版 eslintrc 文件弃用 .eslintignore已弃用 替代方案

1.进入eslint.config.mjs文件 2.import { defineConfig, globalIgnores } from "eslint/config"; 引入globalIgnores 3.配置 defineConfig([ ... globalIgnores([ "config/*", ".husky", ".local", "public/*", ".…

基于ngnix配置本地代理到对应服务器

遇到的问题&#xff1a;服务器可以访问到的地址&#xff0c;我本地代码无法访问到 在服务器上装好nginx&#xff0c;在nginx配置文件nginx.conf中配置本地想要链接对应的服务器端口信息 server {listen 8101;location / {proxy_http_version 1.1;proxy_set_header Upgrade $h…

Go 语言 fmt 模块的完整方法详解及示例

以下是 Go 语言 fmt 模块的完整方法详解及示例&#xff0c;涵盖所有核心功能&#xff1a; 一、输出函数 将数据写入标准输出、文件或字符串。 1. Print / Println / Printf 功能 Print: 写入标准输出&#xff0c;不换行。Println: 写入标准输出并换行。Printf: 格式化写入标…

在K8S中使用ArgoCD做持续部署

一、了解argocd ArgoCD是一个基于Kubernetes的GitOps持续交付工具&#xff0c;应用的部署和更新都可以在Git仓库上同步实现&#xff0c;并自带一个可视化界面。本文介绍如何使用GitArgocd方式来实现在k8s中部署和更新应用服务。关于ci这一块这里不多介绍。主要讲解argocd如何实…

可视化图解算法:删除有序(排序)链表中重复的元素

1. 题目 描述 删除给出链表中的重复元素&#xff08;链表中元素从小到大有序&#xff09;&#xff0c;使链表中的所有元素都只出现一次 例如&#xff1a; 给出的链表为1→1→2,返回1→2. 给出的链表为1→1→2→3→3返回1→2→3. 数据范围&#xff1a;链表长度满足 0≤n≤100…