音视频开源项目列表

音视频开源项目列表

一、多媒体处理框架

通用音视频处理

  • FFmpeg - https://github.com/FFmpeg/FFmpeg

    • 最强大的音视频处理工具库
    • 支持几乎所有格式的编解码
    • 提供命令行工具和开发库
  • GStreamer - https://gitlab.freedesktop.org/gstreamer/gstreamer

    • 跨平台多媒体框架
    • 基于管道的媒体处理
    • 丰富的插件系统
  • libav - https://github.com/libav/libav

    • FFmpeg的分支项目
    • 更专注于代码整洁性
    • API与FFmpeg类似
  • MediaPipe - https://github.com/google/mediapipe

    • Google的多媒体机器学习框架
    • 支持人脸检测、手势识别等
    • 跨平台支持

二、流媒体传输

WebRTC相关

  • WebRTC - https://webrtc.googlesource.com/src/

    • Google实时通信框架
    • 支持音视频通话、屏幕共享
    • P2P通信核心库
  • Janus Gateway - https://github.com/meetecho/janus-gateway

    • WebRTC网关服务器
    • 支持多种信令协议
    • 可扩展的插件架构
  • mediasoup - https://github.com/versatica/mediasoup

    • WebRTC SFU媒体服务器
    • 高性能C++实现
    • 支持多语言客户端
  • Kurento - https://github.com/Kurento/kurento-media-server

    • WebRTC媒体服务器
    • 支持录制、转码等功能
    • 提供丰富的API

RTMP/HLS/DASH相关

  • SRS (Simple Realtime Server) - https://github.com/ossrs/srs

    • 简单高效的流媒体服务器
    • 支持RTMP/HLS/WebRTC
    • 国产优秀开源项目
  • nginx-rtmp-module - https://github.com/arut/nginx-rtmp-module

    • Nginx的RTMP模块
    • 支持RTMP推流和播放
    • 可与Nginx生态集成
  • Node-Media-Server - https://github.com/illuspas/Node-Media-Server

    • 基于Node.js的流媒体服务器
    • 支持RTMP/HLS/DASH
    • 易于部署和扩展
  • Live555 - http://www.live555.com/liveMedia/

    • RTSP/RTP协议栈实现
    • C++编写,跨平台
    • 用于IP摄像头等场景

三、播放器

跨平台播放器

  • VLC - https://github.com/videolan/vlc

    • 最流行的开源播放器
    • 支持几乎所有音视频格式
    • 跨平台,功能强大
  • MPV - https://github.com/mpv-player/mpv

    • 轻量级高性能播放器
    • 基于FFmpeg和libass
    • 支持硬件加速
  • Kodi - https://github.com/xbmc/xbmc

    • 开源媒体中心软件
    • 支持插件扩展
    • 适合HTPC使用

移动端播放器

  • ijkplayer - https://github.com/bilibili/ijkplayer

    • Bilibili开源的移动端播放器
    • 基于FFmpeg,支持iOS/Android
    • 轻量级,性能优秀
  • ExoPlayer - https://github.com/google/ExoPlayer

    • Google官方Android播放器
    • 支持DASH、HLS等协议
    • 高度可定制
  • GSYVideoPlayer - https://github.com/CarGuo/GSYVideoPlayer

    • Android视频播放器
    • 支持多种播放内核
    • 功能丰富,易于集成

Web播放器

  • video.js - https://github.com/videojs/video.js

    • HTML5视频播放器
    • 插件系统丰富
    • 跨浏览器兼容性好
  • flv.js - https://github.com/bilibili/flv.js

    • B站开源的FLV播放器
    • 纯JavaScript实现
    • 支持HTTP-FLV播放
  • hls.js - https://github.com/video-dev/hls.js

    • JavaScript HLS播放器
    • 支持MSE技术
    • 轻量级,性能好

四、编解码器

视频编解码

  • x264 - https://www.videolan.org/developers/x264.html

    • 最流行的H.264编码器
    • 高性能,广泛使用
    • 支持多种预设和参数
  • x265 - https://github.com/videolan/x265

    • H.265/HEVC编码器
    • 更高压缩率
    • 支持HDR和10bit
  • OpenH264 - https://github.com/cisco/openh264

    • Cisco开源的H.264编解码器
    • BSD许可证
    • 适合WebRTC使用
  • libvpx - https://github.com/webmproject/libvpx

    • VP8/VP9编解码器
    • Google开发
    • WebM格式核心
  • libaom - https://aomedia.googlesource.com/aom/

    • AV1编解码器参考实现
    • 下一代视频编码标准
    • 开放媒体联盟开发
  • SVT-AV1 - https://github.com/OpenVisualCloud/SVT-AV1

    • Intel的AV1编码器
    • 高性能实现
    • 适合服务器端使用

音频编解码

  • Opus - https://github.com/xiph/opus

    • 现代音频编解码器
    • 低延迟,高质量
    • 适合实时通信
  • LAME - https://lame.sourceforge.io/

    • MP3编码器
    • 高质量实现
    • 广泛使用
  • FLAC - https://github.com/xiph/flac

    • 无损音频编解码器
    • 开源免费
    • 音乐爱好者首选
  • Speex - https://github.com/xiph/speex

    • 语音编解码器
    • 针对人声优化
    • 支持降噪等功能

五、音频处理

音频库

  • PortAudio - http://www.portaudio.com/

    • 跨平台音频I/O库
    • 支持多种音频API
    • 实时音频处理
  • RtAudio - https://github.com/thestk/rtaudio

    • C++音频I/O库
    • 简单易用的API
    • 跨平台支持
  • OpenAL - https://github.com/kcat/openal-soft

    • 3D音频API
    • 游戏音频常用
    • 支持空间音效

音频处理工具

  • SoX - https://sourceforge.net/projects/sox/

    • 音频处理瑞士军刀
    • 命令行工具
    • 支持多种音频效果
  • Audacity - https://github.com/audacity/audacity

    • 开源音频编辑器
    • 图形界面
    • 功能丰富
  • Ardour - https://github.com/Ardour/ardour

    • 专业数字音频工作站
    • 多轨录音和编辑
    • 支持插件

六、计算机视觉

图像处理

  • OpenCV - https://github.com/opencv/opencv

    • 最流行的计算机视觉库
    • 丰富的图像处理算法
    • 支持多种编程语言
  • dlib - https://github.com/davisking/dlib

    • 机器学习工具库
    • 人脸检测和识别
    • C++实现,性能优秀
  • ImageMagick - https://github.com/ImageMagick/ImageMagick

    • 图像处理工具集
    • 命令行和API
    • 支持多种图像格式

视频分析

  • OpenPose - https://github.com/CMU-Perceptual-Computing-Lab/openpose

    • 人体姿态估计
    • 实时多人检测
    • 基于深度学习
  • YOLO - https://github.com/ultralytics/yolov5

    • 目标检测框架
    • 实时性能
    • 易于训练和部署

七、实时通信

信令服务器

  • Janus - https://github.com/meetecho/janus-gateway

    • WebRTC网关
    • 支持多种协议
    • 插件架构
  • Kurento - https://github.com/Kurento/kurento-media-server

    • 媒体服务器
    • WebRTC支持
    • 录制和处理功能
  • Coturn - https://github.com/coturn/coturn

    • TURN/STUN服务器
    • NAT穿透必备
    • 高性能实现

SIP/VoIP

  • FreeSWITCH - https://github.com/signalwire/freeswitch

    • 软交换平台
    • 支持多种协议
    • 企业级通信方案
  • Asterisk - https://github.com/asterisk/asterisk

    • 开源PBX系统
    • VoIP电话系统
    • 强大的可扩展性
  • PJSIP - https://github.com/pjsip/pjproject

    • SIP协议栈
    • 跨平台支持
    • 音视频通信库

八、工具和实用程序

分析工具

  • MediaInfo - https://github.com/MediaArea/MediaInfo

    • 媒体文件信息分析
    • 支持多种格式
    • GUI和CLI版本
  • ffprobe - FFmpeg工具集的一部分

    • 媒体流分析工具
    • 详细的技术信息
    • 命令行工具
  • VLC media player - 内置分析功能

    • 编解码信息查看
    • 流媒体分析
    • 图形界面

开发工具

  • OBS Studio - https://github.com/obsproject/obs-studio

    • 开源直播和录制软件
    • 插件系统
    • 跨平台支持
  • Kdenlive - https://github.com/KDE/kdenlive

    • 开源视频编辑器
    • 非线性编辑
    • 丰富的特效
  • Shotcut - https://github.com/mltframework/shotcut

    • 跨平台视频编辑器
    • 基于MLT框架
    • 易于使用

九、移动端SDK

Android

  • CameraX - https://developer.android.com/training/camerax

    • Google相机库
    • 简化相机开发
    • 兼容性好
  • Mobile FFmpeg - https://github.com/tanersener/mobile-ffmpeg

    • 移动端FFmpeg
    • iOS/Android支持
    • 轻量级实现

iOS

  • GPUImage - https://github.com/BradLarson/GPUImage2

    • GPU加速图像处理
    • 实时滤镜
    • Swift实现
  • LFLiveKit - https://github.com/LaiFengiOS/LFLiveKit

    • iOS直播推流SDK
    • RTMP推流
    • 美颜滤镜

跨平台

  • React Native Video - https://github.com/react-native-video/react-native-video

    • React Native视频组件
    • 跨平台播放器
    • 易于集成
  • Flutter Video Player - https://pub.dev/packages/video_player

    • Flutter视频播放插件
    • 官方维护
    • 跨平台支持

十、AI音视频处理

语音识别

  • Whisper - https://github.com/openai/whisper

    • OpenAI语音识别模型
    • 多语言支持
    • 高准确率
  • DeepSpeech - https://github.com/mozilla/DeepSpeech

    • Mozilla语音识别引擎
    • 端到端深度学习
    • 开源免费

音频AI

  • Spleeter - https://github.com/deezer/spleeter

    • 音源分离工具
    • 人声提取
    • 基于深度学习
  • RVC - https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI

    • AI变声工具
    • 实时语音转换
    • Web界面

视频AI

  • Real-ESRGAN - https://github.com/xinntao/Real-ESRGAN

    • 图像超分辨率
    • 视频增强
    • 实用的AI模型
  • DeepFaceLab - https://github.com/iperov/DeepFaceLab

    • 深度换脸技术
    • 视频人脸替换
    • 强大的训练工具

这些开源项目涵盖了音视频开发的各个方面,从基础的编解码到高级的AI处理。选择合适的项目可以大大加快开发进度,同时通过阅读源码也能深入学习音视频技术。建议从简单的项目开始,逐步深入到更复杂的系统级项目。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/78330.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

通往“共识空域”的系统伦理演化

随着低空经济逐步从分布式运营向跨区域联动发展,AI无人系统不再只在本地决策,而开始涉及跨城市、跨机构的任务调度与行为协调。这一趋势带来了新的伦理挑战:多系统之间如何达成行动共识?算法背后的价值判断标准能否统一&#xff1…

Elasticsearch 常用的 API 接口

文档类 API Index API :创建并建立索引,向指定索引添加文档。例如:PUT /twitter/tweet/1 ,添加一个文档。 Get API :获取文档,通过索引、类型和 ID 获取文档。如GET /twitter/tweet/1。 DELETE API &…

【Vue】性能优化与调试技巧

个人主页:Guiat 归属专栏:Vue 文章目录 1. Vue 性能优化与调试技巧1.1 使用 v-if 替代 v-show 控制条件渲染示例代码: 1.2 组件懒加载(异步组件)示例代码:效果分析图(Mermaid 图表示&#xff09…

广义线性模型三剑客:线性回归、逻辑回归与Softmax分类的统一视角

文章目录 广义线性模型三剑客:线性回归、逻辑回归与Softmax分类的统一视角引言:机器学习中的"家族相似性"广义线性模型(GLMs)基础三位家族成员的统一视角1. 线性回归(Linear Regression)2. 逻辑回归(Logistic Regression)3. Softmax分类(Softm…

【Linux系统篇】:Linux线程控制基础---线程的创建,等待与终止

✨感谢您阅读本篇文章,文章内容是个人学习笔记的整理,如果哪里有误的话还请您指正噢✨ ✨ 个人主页:余辉zmh–CSDN博客 ✨ 文章所属专栏:Linux篇–CSDN博客 文章目录 一.线程创建二.线程等待三.线程终止四.扩展内容1.重谈pthread_…

More Effective C++学习笔记

条款1 指针与引用的区别 条款2 尽量使用C风格的类型转换 条款3 不要对数组使用多态 条款4 避免无用的缺省构造函数 条款5 谨慎定义类型转换函数 条款6 自增(increment)、自减(decrement)操作符前缀形式与后缀形式的区别 条款7 不要重载“&&”,“||”, 或“,” 条款8 理…

先知AIGC超级工场,撬动运营效率新杠杆

北京先智先行科技有限公司,作为行业内的重要参与者,拥有“先知大模型”、“先行AI商学院”以及“先知AIGC超级工场”这三款旗舰产品。这些产品在不同领域发挥着关键作用,尤其是先知AIGC超级工场,正悄然改变着内容创作与产品推广的…

十一岁少年叶珉雪用艺术点亮公益之路 个人原创公益演唱会传递大爱与担当

4月29日晚,"韶华映雪益路同行"叶珉雪个人原创公益演唱会在广东碧桂园学校歌剧院圆满落幕。 这场由该校美育成果浇灌出的艺术盛宴,生动诠释了广东碧桂园学校育人理念。11岁的叶珉雪以超越年龄的艺术掌控力,呈现了一场融合歌唱、舞蹈…

【深度学习基础】:VGG实战篇(图像风格迁移)

文章目录 前言style transfer原理原理解析损失函数 style transfer代码效果图 fast style transfer 代码效果图 前言 本篇来带大家看看VGG的实战篇,这次来带大家看看计算机视觉中一个有趣的小任务,图像风格迁移。 可运行代码位于: Style_tr…

python爬虫基础:requests库详解与案例

1.Requests模块的使用 requests模块的介绍与安装 作用:发送网络请求,返回响应数据。 中文文档:https://requests.readthedocs.io/projects/cn/zh_CN/latest/ 对于爬虫任务,使用 requests模块基本能够解决绝大部分的数据抓取的…

Spring 容器相关的核心注解​

以下是 Spring 容器中用于 ​​Bean 管理、依赖注入、配置控制​​ 的关键注解,按功能分类说明: ​​1. Bean 声明与注册​​ 注解作用示例​​Component​​通用注解,标记一个类为 Spring Bean(自动扫描注册) Compo…

C与指针5——字符串合集

常用函数 1、拷贝、长度、比较 size_t strlen();\\返回无符号整形 char* strcpy();char* strncpy();\\拷贝 int strcmp();int strncmp();\\比较 char* strcat();char* strncat();\\连接2、查找 char* strchr(const char * st,int ch);\\找字符第一次出现的位置 char* strrch…

论软件需求管理

目录 摘要(300~330字) 正文(2000~2500字,2200字为宜) 背景介绍(500字做左右) 论点论据(1500字做左右) 收尾(200字左右) 注:本篇论…

[特殊字符] 如何在比赛前调整到最佳状态:科学与策略结合的优化指

🧠 概述 在竞技体育中,赛前状态的调整对比赛结果起着决定性作用。所谓“最佳状态”,不仅指生理上的巅峰表现,更包括心理、认知、营养和恢复等多方面的协同优化。本文结合运动科学、心理学和营养学的研究成果,探讨赛前…

一种实波束前视扫描雷达目标二维定位方法——论文阅读

一种实波束前视扫描雷达目标二维定位方法 1. 专利的研究目标与实际问题意义2. 专利提出的新方法、模型与公式2.1 运动平台几何建模与回波信号构建2.1.1 距离历史建模2.1.2 回波信号模型2.2 距离向运动补偿技术2.2.1 匹配滤波与距离压缩2.3 加权最小二乘目标函数2.3.1 方位向信号…

基于 Spring Boot 瑞吉外卖系统开发(八)

基于 Spring Boot 瑞吉外卖系统开发(八) 自动填充公共字段 MyBatis-Plus公共字段自动填充,也就是在插入或者更新的时候为指定字段赋予指定的值,使用它的好处就是可以统一对这些字段进行处理,降低了冗余代码的数量。本…

【前端】从零开始的搭建结构(技术栈:Node.js + Express + MongoDB + React)book-management

项目路径总结 后端结构 server/ ├── controllers/ # 业务逻辑 │ ├── authController.js │ ├── bookController.js │ ├── genreController.js │ └── userController.js ├── middleware/ # 中间件 │ ├── authMiddleware…

【RAG】向量?知识库的底层原理:向量数据库の技术鉴赏 | HNSW(导航小世界)、LSH、K-means

一、向量化表示的核心概念 1.1 特征空间与向量表示 多维特征表示:通过多个特征维度(如体型、毛发长度、鼻子长短等)描述对象,每个对象对应高维空间中的一个坐标点,来表示狗这个对象,这样可以区分出不同种…

如何用CSS实现HTML元素的旋转效果

原文:如何用CSS实现HTML元素的旋转效果 | w3cschool笔记 (本文为科普文章,请勿标记为付费) 在网页制作中,为 HTML 元素设置旋转效果可使其更灵动,提升用户体验。本文将深入浅出地介绍如何利用 CSS 实现 H…

Spark集群搭建之Yarn模式

配置集群 1.上传并解压spark-3.1.2-bin-hadoop3.2.tgz,重命名解压之后的目录为spark-yarn。 2. 修改一下spark的环境变量,/etc/profile.d/my_env.sh 。 # spark 环境变量 export SPARK_HOME/opt/module/spark-yarn export PATH$PATH:$SPARK_HOME/bin:$SP…