音频分类的学习

1.深度学习PyTorch入门-语音分类

https://blog.csdn.net/sinat_41787040/article/details/129795496

https://github.com/musikalkemist/pytorchforaudio

https://github1s.com/musikalkemist/pytorchforaudio/blob/main/04%20Creating%20a%20custom%20dataset/urbansounddataset.py

https://github.com/musikalkemist/DeepLearningForAudioWithPython

https://github.com/musikalkemist/AudioSignalProcessingForML

https://github.com/musikalkemist/generating-sound-with-neural-networks

https://github.com/musikalkemist/Deep-Learning-Audio-Application-From-Design-to-Deployment

https://github.com/yaokaishile/AudioClassifier

GitHub - carl03q/AudioClassifier: A CNN audio classifier via spectrogram images.

2.基于Pytorch实现声音的分类

https://blog.csdn.net/weixin_45277161/article/details/135185613

https://blog.csdn.net/qq_33200967/article/details/119830756

https://github.com/yeyupiaoling/AudioClassification-Pytorch

3.基于深度学习的各种音频分类pytorch实战

https://blog.csdn.net/weixin_45717863/article/details/136237419

https://github.com/ethanyhzhang/AudioClassification-Pytorch

4.Urbansound8k声音分类深度学习实战

GitHub - musikalkemist/pytorchforaudio: Code for the "PyTorch for Audio + Music Processing" series on The Sound of AI YouTube channel.

pytorchforaudio/09 Training urban sound classifier at main · musikalkemist/pytorchforaudio · GitHub

UrbanSound8K数据集

#wget命令下载

wget https://zenodo.org/record/1203745/files/UrbanSound8K.tar.gz

5.语音识别 - PyTorch实现

https://juejin.cn/post/7107844968957345805

6.音频识别(Audio Classification)学习笔记

https://blog.csdn.net/Killer_kali/article/details/122798462

7.基于Pytorch的声音事件检测分类系统

https://blog.csdn.net/weixin_43509698/article/details/145432599

https://github.com/Shybert-AI/AudioClassificationModelZoo-Pytorch

8.使用PyTorch进行城市声音分类

https://blog.csdn.net/gitblog_00081/article/details/139518564

https://github.com/ksanjeevan/crnn-audio-classification

9.torch入门:音频分类任务(pytorch+librosa)

https://blog.csdn.net/Ceverymxt7/article/details/146146361

10.PyTorch音频分类实战(完整代码)

https://blog.csdn.net/SoulmateY/article/details/143689699

https://blog.csdn.net/python1234_/article/details/145307536

https://zhuanlan.zhihu.com/p/6235637735

  • Github:github.com/Zeyi-Lin/Py…
  • 数据集:pan.baidu.com/s/14CTI_9MD… 提取码: 1a9e
  • SwanLab实验日志:swanlab.cn/@ZeyiLin/Py…
  • 更多实验日志:swanlab.cn/@ZeyiLin/Py…

Github:https://github.com/Zeyi-Lin/PyTorch-Audio-Classification
数据集:https://pan.baidu.com/s/14CTI_9MD1vXCqyVxmAbeMw?pwd=1a9e 提取码: 1a9e
SwanLab实验日志:https://swanlab.cn/@ZeyiLin/PyTorch_Audio_Classification-simple/charts
更多实验日志:https://swanlab.cn/@ZeyiLin/PyTorch_Audio_Classification/charts

11.使用深度学习进行音频分类的端到端示例和解释

https://blog.csdn.net/deephub/article/details/114997017

12.深度学习实现50种环境声音分类

https://blog.csdn.net/Mind_programmonkey/article/details/121024085

13.esc50

https://github.com/PaddlePaddle/PaddleSpeech/tree/develop/examples/esc50

https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/docs/tutorial/cls/cls_tutorial.ipynb

14.CBAM与DenseNet121融合进行鸟类声音识别

https://blog.csdn.net/weixin_34945060/article/details/143473683

https://github.com/CarrieX6/-Xeno-Canto-

融合了CBAM与DenseNet121,使用中心损失函数及鸟声融合特征进行数据预处理、鸟声识别等任务

15.基于梅尔频谱的信号分类和识别

https://github.com/Friedrich-M/Audio-signal-classification-and-identification

数据集Urbansound8K
  • Urbansound8K是目前应用较为广泛的用于自动城市环境声分类研究的公共数据集, 包含10个分类:空调声、汽车鸣笛声、儿童玩耍声、狗叫声、钻孔声、引擎空转声、枪声、手提钻、警笛声和街道音乐声。
  • 数据集下载

16.使用BirdNET-V2.4训练自己的数据集

https://blog.csdn.net/weixin_53238517/article/details/144215320

https://github.com/birdnet-team/BirdNET-Analyzer/tree/training-with-test-data

https://github.com/birdnet-team/BirdNET-Analyzer

https://github.com/joeweiss/birdnetlib

15.鸟音频数据文件下载资源

https://hf-mirror.com/datasets/sakei/Bird_audio_in_China

https://hf-mirror.com/datasets/Trelis/bird-songs

https://github.com/DBD-research-group/BirdSet

A benchmark dataset collection for bird sound classification

https://hf-mirror.com/datasets/DBD-research-group/BirdSet

从huggingface上下载数据集具体步骤_huggingface 下载数据集-CSDN博客

eg:

      git clone https://hf-mirror.com/datasets/DBD-research-group/BirdSet

      git clone https://hf-mirror.com/datasets/sakei/Bird_audio_in_China

      git clone https://hf-mirror.com/datasets/Trelis/bird-songs

https://zhuanlan.zhihu.com/p/701195734

使用ffmpeg提取视频中的音频并保存为单声道wav_ffmpeg wav-CSDN博客

https://zhuanlan.zhihu.com/p/452368276

birdData: 大批量,多线程下载鸟声文件

https://github.com/realzza/xenopy/tree/birdData

https://github.com/AgaMiko/xeno-canto-download

GitHub - AgaMiko/xeno-canto-download: Easy and ready-to-use script to download bird sound files and jsons from www.xeno-canto.org based on search terms.

鸟纲 Aves|iPlant 植物智——植物物种信息系统

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/80976.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

美SEC主席:探索比特币上市证券交易所

作者/演讲者:美SEC主席Paul S. Atkins 编译:Liam 5月12日,由美国SEC加密货币特别工作组发起的主题为《资产上链:TradFi与DeFi的交汇点》系列圆桌会议如期举行。 会议期间,现任美SEC主席Paul S. Atkins发表了主旨演讲。…

Qt file文件操作详解

1.引言 很多应用程序都具备操作文件的能力,包括对文件进行写入和读取,创建和删除文件等等,甚至某些应用程序的就是为了操作文件,像WPS Office。基于此Qt框架中专门提供了对文件操作的类:QFile。 2.QFile文件操作 QF…

【测试开发知识储备】之Jacoco(Java Code Coverage)

文章目录 Jacoco是什么Jacoco的主要功能(一)多样化覆盖率指标分析(二) 丰富的报告生成(三)实时数据收集 Jacoco的工作原理(一)字节码增强(二)测试执行与数据收…

Docker 介绍与使用

Docker 文章目录 Docker介绍与虚拟机的比较启动速度占用资源 优势更容易迁移更容易维护更容易扩展 使用场景持续集成提供可伸缩的云服务搭建微服务架构 镜像与容器镜像构成(分层结构)镜像与容器的区别 安装 Docker常用命令介绍镜像相关容器相关 实战&…

《AI大模型应知应会100篇》第62篇:TypeChat——类型安全的大模型编程框架

第62篇:TypeChat——类型安全的大模型编程框架 摘要 在构建 AI 应用时,一个常见的痛点是大语言模型(LLM)输出的不确定性与格式不一致问题。开发者往往需要手动解析、校验和处理模型返回的内容,这不仅增加了开发成本&a…

upload-labs通关笔记-第5关 文件上传之.ini绕过

目录 一、ini文件绕过原理 二、源码审计 三、渗透实战 1、查看提示 2、制作.user.ini文件 (1)首先创建一个文本文件 (2)保存文件名为.user.ini 2、制作jpg后缀脚本 (1)创建一个文本文件 &#xf…

为什么 Linux 上默认没有 host.docker.internal

在 Linux 环境中,host.docker.internal 是 Docker 为容器提供的一个特殊 DNS 名称,用于指向宿主机的 IP 地址(类似 macOS/Windows 中的行为)。但这个功能在 Linux 上默认不启用,需要手动配置才能使用。以下是详细解释和…

C++GO语言微服务和服务发现②

01 创建go-micro项目-查看生成的 proto文件 02 创建go-micro项目-查看生成的main文件和handler ## 创建 micro 服务 命令:micro new --type srv test66 框架默认自带服务发现:mdns。 使用consul服务发现: 1. 初始consul服务发现&…

Redis--常见数据类型List列表

目录 一、概念 二、命令 2.1 LPUSH 2.2 LPUSHX 2.3 RPUSH 2.4 RPUSHX 2.5 LRANGE 2.6 LPOP 2.7 RPOP 2.8 LINDEX 2.9 LINSERT 2.10 LLEN 2.11 阻塞版本命令 三、内部编码 一、概念 列表类型是用来存储多个有序的字符串,列表中的每个字符串称为元素&…

QListWedget控件使用指南

QListWedget公共函数 函数签名功能描述QListWidget(QWidget *parent nullptr)构造函数,创建一个QListWidget对象,可指定父部件(默认为nullptr)。virtual ~QListWidget()虚析构函数,释放QListWidget对象及其资源。voi…

Seata源码—1.Seata分布式事务的模式简介

大纲 1.Seata分布式事务框架简介 2.Seata AT模式实现分布式事务的机制 3.Seata AT模式下的写隔离机制 4.Seata AT模式下的读隔离机制 5.官网示例说明Seata AT模式的工作机制 6.Seata TCC模式的介绍以及与AT模式区别 7.Seata Saga模式的介绍 8.单服务多个库的分布式事务…

【Qt】之音视频编程2:QtAV的使用篇

QtAV 基本播放控制功能实现&#xff08;C & QML&#xff09; QtAV 提供了完整的播放控制 API&#xff0c;支持 播放、暂停、停止、快进快退、截屏 等功能。以下是具体实现方法&#xff1a; 1. C 控制方式 基本播放控制 #include <QtAV> #include <QtAV/AVPlaye…

歌词滚动效果

<!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><!-- 设置标签页图标 --><link rel"shortcut icon&…

基于大模型的TIA诊疗全流程智能决策系统技术方案

目录 一、多模态数据融合与预处理系统1.1 数据接入模块1.2 数据预处理伪代码二、TIA智能预测模型系统2.1 模型训练流程2.2 混合模型架构伪代码三、术中智能监测系统3.1 实时监测流程3.2 实时预测伪代码四、智能诊疗决策系统4.1 手术方案推荐流程4.2 麻醉方案生成伪代码五、预后…

Java 日期解析与格式化:从标准格式到自然语言解析

使用 Java 搭配 Apache Commons Lang3 和 Natty 库&#xff0c;实现灵活高效的日期解析与格式化。 一、背景 将不同格式的日期统一成一个格式。日期格式可能有以下几种类型&#xff1a; 标准格式&#xff1a;2024-02-28、14/05/2022、2002年5月6日非英文月份缩写&#xff1a;…

Room持久化库:从零到一的全面解析与实战

简介 在Android开发中,Room作为官方推荐的数据库持久化库,提供了对SQLite的抽象层,使得数据库操作更加安全、高效且易于维护。 Room通过注解处理器和编译时验证,显著降低了数据库操作的复杂度,同时支持响应式编程模式,使开发者能够轻松实现数据变化的实时监听。对于企业…

MySQL(6)如何删除数据库和表?

在 MySQL 中删除数据库和表是常见的管理操作。下面将详细介绍如何使用 SQL 语句以及图形化工具来删除数据库和表。 步骤一&#xff1a;连接 MySQL 服务器 首先&#xff0c;连接到 MySQL 服务器&#xff0c;可以使用命令行工具 mysql 或图形化工具如 MySQL Workbench。 使用命…

携固态电池、新形态钢壳叠片电池等产品 豪鹏科技将亮相CIBF 2025

携固态电池、新形态钢壳叠片电池等产品 豪鹏科技将亮相CIBF 2025 来源&#xff1a; 电池百人会-电池网 豪鹏科技&#xff08;展位号:14W001&#xff09;将携固态电池、新形态钢壳叠片电池及高安全性钠离子电池等前沿技术产品亮相CIBF 2025&#xff0c;凭借多年的技术积累和产…

React学习———useEffect和useLayoutEffect

useEffect useEffect是React的一个Hook&#xff0c;用于在函数组件中处理副作用。副作用包括数据获取、订阅、手动DOM操作以及其他需要再渲染后执行的操作 基本用法 useEffect(() > {// 副作用逻辑return () > {// 可选的清理函数} }, [依赖数组])第一个参数&#xff…

“天神之眼”计算平台的算力设计(预计500-1000 TOPS)

关于比亚迪“天神之眼”计算平台的算力设计&#xff08;预计500-1000 TOPS&#xff09;&#xff0c;其技术路径和行业意义值得深入探讨。以下从实现方式、技术挑战和行业影响三个维度展开分析&#xff1a; 1. 多芯片互联的技术实现路径 &#xff08;1&#xff09;芯片选型方案…