FFmpeg播放器理论与实战课程【共100课时】

梅老师高级讲师讲师评分5.0学员226850课程92

FFmpeg音视频客座金牌讲师，擅长C/C++,Java,Python，有多门课程热销中。精通C/C++,Java,Android,Python,音视频，流媒体，播放器，视频服务器，直播系统。具有12年的培训经验，从C语言培训开始...

畅销套餐
精选套餐
人气套餐
尊享套餐
高薪套餐

FFmpeg第一季：小白开窍+九阳神功

FFmpeg4.3开发系列之五：SDK二次开发详解与直播实战

FFmpeg4.3开发系列之15：同步录音录屏并存储或直播实战

651人学习

￥268.00

更多 30 门课程

FFmpeg音视频流媒体开发（小白入门与工程案例实战）

FFmpeg4.3开发系列之三：流媒体直播基础理论

7471人学习

￥138.00

FFmpeg4.3系列之16：WebRTC之小白入门与视频聊天的实战

898人学习

￥238.00

FFmpeg4.3系列之21：OpenCV4小白入门与实战58例

FFmpeg+Nginx+Rtmp+HLS+Videojs搭建直播网站（理论与实战）

Qt5(C++)高级篇之1：HTTP网络编程实战

3689人学习

￥138.00

Qt5(C++)高级篇之5：QML入门与提高项目实战

Qt5(C++)高级篇之1：HTTP网络编程实战

3689人学习

￥138.00

Qt5(C++)高级篇之5：QML入门与提高项目实战

6565人学习

￥258.00

更多 11 门课程

课程介绍
课程大纲

适合人群：

所有想学习如何使用FFmpeg开发专业播放器的人士

你将会学到：

学习FFmpeg、音视频基础知识，使用Qt和Qss开发出专业的视频播放器。

课程简介：

课程介绍

学习音频、视频、编解码等基础理论。学习FFmpeg的基础知识，学习SDK，进行二次开发。使用Qt和QSS亲手开发基于FFmpeg的专业播放器。

音视频是一门很复杂的技术，涉及的概念、原理、理论非常多，很多初学者不学基础理论，而是直接做项目，往往会看到c/c++的代码时一头雾水，不知道代码到底是什么意思，这是为什么呢？因为没有学习音视频的基础理论，就比如学习英语，不学习基本单词，而是天天听英语新闻，总也听不懂。所以一定要认真学习基础理论，然后再学习播放器、转码器、非编、流媒体直播、视频监控、等等。

课程亮点

Ø 基础理论，学习音视频的基础知识、掌握播放器的基础概念；

Ø 图示讲解，所有知识点都通过具体的图文理解，更易识记；

Ø 案例教学，通过Qt实战结合播放器ffplay进行专业化开发实战；

Ø 答疑服务，远程协助解答学习疑虑，快速及时。

课程收获

ü 掌握音视频和播放器的基础知识；

ü 掌握Qt开发播放器的界面知识，并学会ffplay开源播放器的移植及封装技巧；

ü 播放器控制功能，包括快进、快退、音量调节等。

讲师介绍

梅老师

从事音视频与流媒体行业18年；曾在永新视博、中科大洋、百度、美国Harris广播事业部等公司就职，经验丰富；曾亲手主导广电直播全套项目，精通h.264/h.265/aac，曾亲自参与百度app上的网页播放器等实战产品。

目前全身心自主创业，主要聚焦音视频+流媒体行业，精通音视频加密、流媒体在线转码快编等热门产品。

常见问题：

问：FFmpeg的学习，我只会几条命令行，跟老师能深入吗？

答：可以，肯定可以。老师带大家一起探索FFmpeg的奥秘，剖析FFmpeg的SDK，可以二次开发。

问：音视频自学，我放弃了。跟老师学，我能真正入门吗？

答：可以。音视频纯小白可以入门，可以学会。可以的，梅老师从事音视频与流媒体行业18年，一定能带您学会音视频，进入音视频的开发世界。梅老师曾在永新视博、中科大洋、百度、美国Harris广播事业部等公司就职，经验丰富；曾亲手主导广电直播全套项目

问：学了这门课程，我可以开发自己的播放器吗？

答：如果真正理解掌握，可以开发完全自主的基于FFmpeg的专业播放器。

展开更多

课程大纲-FFmpeg播放器理论与实战课程

第1章音视频小白入门经典(1小时57分钟14节)
1-1
5G+音视频“5G”: 万物互联音视频产业的发展规律一直是需求和技术创新双轮驱动，并且互为因果。在 AI 时代，技术创新将不断挖掘音视频产业的潜力，使其有更强的信息承载能力和更具潜力的应用价值，从而不断推进产业升级。随着5G商用起步，音视频产业将迎来哪些商机？在5G将会影响的领域中，音视频产业是重要部分。5G: “零延迟”“5G+音视频产业”将会深入挖掘音视频产业的潜力，加速与云计算、人工智能等领域的深度融合，不断催生新的业态和新的商业模式。现场表演&教堂应用博物馆公共安全命令与控制中心商业管理近年来，IP视频网络领域最重要的发展之一是高质量视频的传输，无论视频网络中的域名数量如何，都能高达4K / 60/4：4：4 + HD——接近零延迟（低于1毫秒）。
「仅限付费用户」点击下载“音视频小白入门--1wm音视频到底是什么.pdf”
[13:31]开始学习
1-2
音视频自学的困惑音视频技术的开发也越来越受到重视，但是由于音视频开发涉及知识面比较广，入门门槛相对较高，让许许多多开发者望而生畏。虽然网上有很多的博文总结了音视频技术的学习路线，但是相关的知识都相对独立，有讲“音视频解码相关”的、有讲“OpenGL相关”的、也有讲“FFmpeg相关的”、还有讲“RTP/RTCP、RTMP、HLS、QUIC等通信相关的”，但是对于新手来说，把所有的知识衔接串联起来，并很好的理解所有的知识，却是非常困难的。本人在学习音视频开发的过程中，深刻体会到了由于知识的分散、过渡断层带来的种种困惑和痛苦，因此希望通过自己的理解，可以把音视频开发相关的知识总结出来，并形成系列文章，循序渐进，剖析各个环节，一则对自己所学做一个总结和巩固，二则希望可以帮助想入门音视频开发的开发者小伙伴们。
「仅限付费用户」点击下载“课程学习资料：课件源码.rar”
[07:05]开始学习
1-3
视频到底是什么视频是什么视频（Video）泛指将一系列静态影像以电信号的方式加以捕捉、纪录、处理、储存、传送与重现的各种技术。连续的图像变化每秒超过24帧（frame,fps）画面以上时，根据视觉暂留原理，人眼无法辨别单幅的静态画面；看上去是平滑连续的视觉效果，这样连续的画面叫做视频。视频技术最早是为了电视系统而发展，但现在已经发展为各种不同的格式以利消费者将视频记录下来。网络技术的发达也促使视频的纪录片段以串流媒体的形式存在于因特网之上并可被电脑接收与播放。视频帧帧，是视频的一个基本概念，表示一张画面，如上面的翻页动画书中的一页，就是一帧。一个视频就是由许许多多帧组成的。帧率帧率，即单位时间内帧的数量，单位为：帧/秒或fps（frames per second）。如动画书中，一秒内包含多少张图片，图片越多，画面越顺滑，过渡越自然。
[16:02]开始学习
1-4
颜色空间RGB和YUV这里我们只讲常用到的两种色彩空间。1）RGB：RGB的颜色模式应该是我们最熟悉的一种，在现在的电子设备中应用广泛。通过R G B三种基础色，可以混合出所有的颜色；2）YUV：这里着重讲一下YUV，这种色彩空间并不是我们熟悉的。这是一种亮度与色度分离的色彩格式。早期的电视都是黑白的，即只有亮度值，即Y。有了彩色电视以后，加入了UV两种色度，形成现在的YUV，也叫YCbCr。 1）Y：亮度，就是灰度值。除了表示亮度信号外，还含有较多的绿色通道量；2）U：蓝色通道与亮度的差值；3）V：红色通道与亮度的差值。
[07:08]开始学习
1-5
音频到底是什么音频数据的承载方式最常用的是脉冲编码调制，即 PCM。在自然界中，声音是连续不断的，是一种模拟信号，那怎样才能把声音保存下来呢？那就是把声音数字化，即转换为数字信号。我们知道声音是一种波，有自己的振幅和频率，那么要保存声音，就要保存声音在各个时间点上的振幅。而数字信号并不能连续保存所有时间点的振幅，事实上，并不需要保存连续的信号，就可以还原到人耳可接受的声音。根据奈奎斯特采样定理：为了不失真地恢复模拟信号，采样频率应该不小于模拟信号频谱中zuigao频率的2倍。根据以上分析，PCM的采集步骤分为以下步骤：模拟信号 -> 采样 -> 量化 -> 编码 -> 数字信号音频到底是什么？音频这个专业业术语，人类能够听到的所有声音都称之为音频，采样率和采样位数采样率，即采样的频率。上面提到，采样率要大于原声波频率的2倍，人耳能听到的zuigao频率为20kHz，所以为了满足人耳的听觉要求，采样率至少为40kHz，通常为44.1kHz，更高的通常为48kHz。注意：人耳听觉频率范围[20Hz, 20KHz]采样位数，涉及到上面提到的振幅量化。波形振幅在模拟信号上也是连续的样本值，而在数字信号中，信号一般是不连续的，所以模拟信号
[09:49]开始学习
1-6
声道码率采样率声道数声道数，是指支持能不同发声（注意是不同声音）的音响的个数。码率码率，是指一个数据流中每秒钟能通过的信息量，单位bps（bit per second）。码率 = 采样率 * 采样位数 * 声道数音频格式是指要在计算机内播放或是处理音频文件，也就是要对声音文件进行数、模转换，这个过程同样由采样和量化构成，人耳所能听到的声音，zui低的频率是从 20Hz 起一直到zui高频率 20KHZ，20KHz 以上人耳是听不到的，因此音频文件格式的zui大带宽是 20KHZ，故而采样速率需要介于 40~50KHZ 之间，而且对每个样本需要更多的量化比特数。音频数字化的标准是每个样本 16 位-96dB 的信噪比，采用线性脉冲编码调制 PCM，每一量化步长都具有相等的长度。在音频文件的制作中，正是采用这一标准。常见的音频格式有：CD 格式、WAVE（*.WAV）、 AIFF、MP3、MIDI、 AAC、WMA、OggVorbis。
「仅限付费用户」点击下载“音视频小白入门--1wm音视频到底是什么.pdf”
[06:44]开始学习
1-7
视频编码基础这里的编码和上面音频中提到的编码(数字化编码)不是同一个概念，而是指压缩编码。我们知道，在计算机的世界中，一切都是0和1组成的，音频和视频数据也不例外。由于音视频的数据量庞大，如果按照裸流数据存储的话，那将需要耗费非常大的存储空间，也不利于传送。而音视频中，其实包含了大量0和1的重复数据，因此可以通过一定的算法来压缩这些0和1的数据。特别在视频中，由于画面是逐渐过渡的，因此整个视频中，包含了大量画面/像素的重复，这正好提供了非常大的压缩空间。因此，编码可以大大减小音视频数据的大小，让音视频更容易存储和传送。那么，未经编码的原始音视频，数据量至底有多大？以一个分辨率1920×1080，帧率30的视频为例：共：1920×1080=2,073,600（Pixels 像素），每个像素点是24bit；也就是：每幅图片2073600×24=49766400 bit，8 bit（位）=1 byte（字节）；所以：49766400bit=6220800byte≈6.22MB。这是一幅1920×1080图片的原始大小（6.22MB），再乘以帧率30。也就是说：每秒视频的大小
[13:57]开始学习
1-8
音频编码基础原始的PCM音频数据也是非常大的数据量，因此也需要对其进行压缩编码。和视频编码一样，音频也有许多的编码格式，如：WAV、MP3、WMA、APE、FLAC等等，音乐发烧友应该对这些格式非常熟悉，特别是后两种无损压缩格式。但是，我们今天的主角不是他们，而是另外一个叫AAC的压缩格式。本节以AAC格式为例，直观的了解音频压缩格式。 AAC是新一代的音频有损压缩技术，一种高压缩比的音频压缩算法。在MP4视频中的音频数据，大多数时候都是采用AAC压缩格式。 AAC格式主要分为两种：ADIF、ADTS。1）ADIF：Audio Data Interchange Format。音频数据交换格式。这种格式的特征是可以确定的找到这个音频数据的开始，不需进行在音频数据流中间开始的解码，即它的解码必须在明确定义的开始处进行。这种格式常用在磁盘文件中。ADIF只有一个统一的头，所以必须得到所有的数据后解码2）ADTS：Audio Data Transport Stream。音频数据传输流。这种格式的特征是它是一个有同步字的比特流，解码可以在这个流中任何位置开始。它的特征类似于mp3数据流格式。
[07:50]开始学习
1-9
音视频封装容器细心的读者可能已经发现，前面我们介绍的各种音视频的编码格式，没有一种是我们平时使用到的视频格式，比如：mp4、rmvb、avi、mkv、mov... 没错，这些我们熟悉的视频格式，其实是包裹了音视频编码数据的容器，用来把以特定编码标准编码的视频流和音频流混在一起，成为一个文件。例如：mp4支持H264、H265等视频编码和AAC、MP3等音频编码。 mp4是目前流行的视频格式，在移动端，一般将视频封装为mp4格式。
[06:32]开始学习
1-10
多媒体到底是什么多媒体技术是指通过计算机对文字、数据、图形、图像、动画、声音等多种媒体信息进行综合处理和管理，使用户可以通过多种感官与计算机进行实时信息交互的技术，又称为计算机多媒体技术。[3.2] 真正的多媒体技术真正的多媒体技术所涉及的对象是计算机技术的产物，而其他的单纯事物，如电影、电视、音响等，均不属于多媒体技术的范畴。多媒体技术中的媒体主要是指前者，就是利用电脑把文字、图形、影象、动画、声音及视频等媒体信息都数位化，并将其整合在一定的交互式界面上，使电脑具有交互展示不同媒体形态的能力。它极大的改变了人们获取信息的传统方法，符合人们在信息时代的阅读方式。[3.3] 什么是媒体？媒体（Media）就是指信息的载体，其本质是信息传播的技术和手段。
[04:55]开始学习
1-11
多媒体概念特点优势什么是多媒体?所谓多媒体，就是指能够同时处理两种以上感觉媒体的计算机系统，其目标是为用户提供更丰富的应用体验。感觉媒体：感觉媒体是指直接作用于人的感觉器官、从而为人的感知系统所接受的信息形态或媒体形式。感觉媒体主要有文字、声音、图形、图像、动画、视频等形态。多媒体技术的第一个特征：是媒体类型或媒体技术的多样性。一个可以被称为多媒体的应用系统，必须至少集成了两种不同类型的媒体及其相关技术。多媒体技术的第二个特征：是媒体内容的同步性（synchronization）。在多媒体应用系统中，多种媒体是融合在一起的，它们是以一种协同的方式工作的。多媒体技术的第三个特征：是交互性（ Interactive）。
[09:30]开始学习
1-12
数字电视基础数字电视，是从电视节目录制、播出到发射、接收全部采用数字编码与数字传输技术的新一代电视。它具有许多优点，如：可实现双向交互业务、抗干扰能力强、频率资源利用率高等，它可提供优质的电视图像和更多的视频服务(如交互电视、远程教育、会议电视、电视商务、影视点播等)。数字电视（Digital Television）简称DTV，是从节目采集、节目制作、节目传输一直到用户端都以数字方式处理信号的电视系统，即从演播室到发射、传输、接收的全部环节都使用数字信号，或者是通过0、1数字串所构成的数字序列进行传播。数字电视是继黑白模拟电视、彩色模拟电视之后的第三代电视类型，是相对模拟电视而言的概念。和模拟电视相比，数字电视画质更高，功能更强，音效更佳，内容也更丰富，通常还具备交互性和通信功能。电视数字化是电视发展史上又一次重大的技术革命。
[07:58]开始学习
1-13
短视频基础短视频是指在各种新媒体平台上播放的、适合在移动状态和短时休闲状态下观看的、高频推送的视频内容，几秒到几分钟不等。内容融合了技能分享、幽默搞怪、时尚潮流、社会热点、街头采访、公益教育、广告创意、商业定制等主题。由于内容较短，可以单独成片，也可以成为系列栏目。[5.2] 短视频特点不同于微电影和直播，短视频制作并没有像微电影一样具有特定的表达形式和团队配置要求，具有生产流程简单、制作门槛低、参与性强等特点，又比直播更具有传播价值，超短的制作周期和趣味化的内容对短视频制作团队的文案以及策划功底有着一定的挑战。优秀的短视频制作团队通常依托于成熟运营的自媒体或IP，除了高频稳定的内容输出外，也有强大的粉丝渠道；短视频的出现丰富了新媒体原生广告的形式。
[06:14]开始学习
1-14
章节测试
[练习]开始学习
第2章音视频开发常用工具(1小时1分钟5节)
2-1
VLC简介VLC支持多种常见音视频格式，支持多种流媒体传输协议，也可当做本地流媒体服务器使用，功能十分强大。官网下载地址：https://www.videolan.org/ VLC多媒体播放器（最初命名为VideoLAN客户端）是VideoLAN计划的多媒体播放器。它支持众多音频与视频解码器及文件格式，并支持DVD影音光盘，VCD影音光盘及各类流式协议。VLC的功能很强大，它不仅仅是一个视频播放器，也可作为小型的视频服务器，更可以一边播放一边转码，把视频流发送到网络上。
「仅限付费用户」点击下载“音视频小白入门--2wm音视频开发常用工具.pdf”
[15:32]开始学习
2-2
MediaInfo简介MediaInfo 用来分析视频和音频文件的编码和内容信息。MediaInfo 是自由软件 (免费使用、免费获得源代码，许可协议：GNU GPL/LGPL)使用MediaInfo可以获得多媒体文件的哪些信息?内容信息：标题，作者，专辑名，音轨号，日期，总时间……视频：编码器，长宽比，帧频率，比特率……音频：编码器，采样率，声道数，语言，比特率……文本：语言和字幕段落：段落数，列表MediaInfo支持哪些文件格式?
[11:36]开始学习
2-3
FlvAnalyser简介直播推流的时候需要用到RTMP的视频数据格式，RTMP的视频格式和FLV很像，通过查看FLV的格式文档，可以分析FLV格式来解析RTMP格式。RTMP中的数据就是由FLV的TAG中的数据区构成。FLV是流媒体封装格式，我们可以将其数据看为二进制字节流。总体上看，FLV包括文件头（File Header）和文件体（File Body）两部分，其中文件体由一系列的Tag及Tag Size对组成。
[14:10]开始学习
2-4
Elecard简介Elecard Stream Analyzer是一款简单小巧的码流分析工具，通过该软件，用户可以快速的分析查看视频序列码流；软件操作简单，使用方便，用户只需将视频文件导入软件内，系统就会自动帮您分析文件，分析后就会显示视频码的文件大小、码流类型、数据包数等内容了，方便用户对视频的质量进行初步的评估，有效的改善视频的拍摄质量以及制作相应的修改方案； Elecard StreamEye Tools是一款分析视音频的好工具。比较常用的是:Elecard Stream AnalyzerElecard StreamEyeElecard YUV Viewer2、码流码流（Data Rate）是指视频文件在单位时间内使用的数据流量，也叫码率，是视频编码中画面质量控制中最重要的部分。
[08:20]开始学习
2-5
FFmpeg简介ffmpeg是一个跨平台的音视频处理库，为了跨平台那么就需要编译出适用于各个平台的ffmpeg库。一般在windows平台下会进行windows开发和安卓开发，所以本文的目的就是在windows平台下编译用于windows和安卓使用的ffmpeg库FFmpeg是一套可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序。FFmpeg是一套可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序。它包括了领先的音/视频编码库libavcodec等。libavformat：用于各种音视频封装格式的生成和解析，包括获取解码所需信息以生成解码上下文结构libavcodec：用于各种类型声音/图像编解码；libavutil：包含一些公共的工具函数；libswscale：用于视频场景比例缩放、色彩映射转换；libpostproc：用于后期效果处理；1.ffmpeg：该项目提供的一个工具，可用于格式转换、解码或电视卡即时编码等2.ffsever：一个 HTTP 多媒体即时广播串流服务器；ffplay：是一个简单的播放器，使用ffmpeg 库解析和解码，通过SDL显示；
[12:05]开始学习
第3章音频基础理论(51分钟6节)
3-1
音频基本概念[1.1] 音频的基本概念声音的三要素:频率、振幅、波形1.1 频率声波的频率，即声音的音调，人类听觉的频率（音调）范围为20Hz--20KHz1.2. 振幅即声波的响度，通俗的讲就是声音的高低，一般男生的声音振幅（响度）大于女生。1.3 波形即声音的音色，同样的频率和振幅下，钢琴和小提琴的声音听起来完全不同的，因为他们的音色不同。几个基本概念比特率： 表示经过编码（压缩）后的音频数据每秒钟需要用多少个比特来表示，单位常为kbps。响度和强度： 声音的主观属性响度表示的是一个声音听来有多响的程度。 响度主要随声音的强度而变化，但也受频率的影响。 总的说，中频纯音听来比低频和高频纯音响一些。采样和采样率：
「仅限付费用户」点击下载“音视频小白入门--3音频基础理论-wm.pdf”
[14:37]开始学习