FFmpeg读取Assets资源文件

在Android开发中我们经常把原生资源文件放在assets目录下以供需要时读取,通过API提供的resources.assets.open(filename)/openFd(filenam)方法可以非常方便获得InputStream或FileDescriptor(文件标识符),但是在使用FFmpeg读取Assets文件时却遇到了困难。主要原因在于FFmpeg读取媒体文件时是通过传入的url来判断IO协议的,也就是说如果想要使FFmpeg能够正确读取Assets文件就需要选择合适的IO协议来构造url并传入avformat_open_input(...)方法中,然而实际操作起来貌似问题多多。

AssetFileDescriptor

调用resources.assets.openFd(filename)可以返回AssetFileDescriptor,那么FFmpeg是否可以通过文件标识符(以下简称fd)来打开媒体文件呢?答案是肯定的。但是对于assets文件会存在一个问题,assets返回的AssetFileDescriptor中带有mStartOffset需要处理,也就是说实际的有效数据需要从mStartOffset处开始读取。

Stackoverflow上有同样的提问:

How to properly pass an asset FileDescriptor to FFmpeg using JNI in Android

实现方式

  1. 在native层获取实际的fd后使用pipe协议或file协议拼装url

int fd = jniGetFDFromFileDescriptor(env, fileDescriptor);
char path[20];
sprintf(path, "/proc/self/fd/%d", fd);

在调用avformat_open_input(...)方法前手动创建AVFormatContext并设置skip_initial_bytes参数。

fmtCtx = avformat_alloc_context();
fmtCtx->skip_initial_bytes = offset;
fmtCtx->iformat = av_find_input_format("mp3");

注:avformat_open_input用于打开媒体文件并获取相关的文件信息,对于该函数更详细的分析可以参考雷神的文章FFmpeg源代码简单分析:avformat_open_input()。实际上,我们也可以不指定iformat,指定了

iformat的好处是FFmpeg将不再对媒体文件的格式进行探测。

问题

当使用上述方案时,发现并不能正常的解码mp4(mov格式)视频文件,Stackoverflow上的评论也有人遇到同样的问题,比较奇怪的是虽然解码失败但是可以获取视频文件的基本信息,查看FFmpeg输出日志:
 

//这里仅贴出较为关键的日志
[FFMPEG]--:type:'ftyp' parent:'root' sz: 32 8 15677739
[FFMPEG]--:ISO: File Type Major Brand: isom
[FFMPEG]--:type:'free' parent:'root' sz: 8 40 15677739
[FFMPEG]--:type:'mdat' parent:'root' sz: 7606147 48 15677739
[FFMPEG]--:type:'moov' parent:'root' sz: 7384 7606195 15677739
....
//sample与chunk的映射关系
[FFMPEG]--:AVIndex stream 0, sample 0, offset 30, dts 0, size 83337, distance 0, keyframe 1
[FFMPEG]--:AVIndex stream 0, sample 1, offset 1494b, dts 512, size 118, distance 1, keyframe 
....
[FFMPEG]--:nal_unit_type: 7(SPS), nal_ref_idc: 3
[FFMPEG]--:nal_unit_type: 8(PPS), nal_ref_idc: 3
[FFMPEG]--:stream 0, sample 0, dts 0
[FFMPEG]--:stream 1, sample 0, dts 0
//解析NAL报错,NAL用于存储视频流(H264)数据
[FFMPEG]--:Invalid NAL unit size (1920229220 > 83333).
[FFMPEG]--:Error splitting the input into NAL units.
....

从FFmpeg的日志中我们可以发现,FFmpeg在解析mp4文件信息时并没有出错,正确的识别了ftypmdatmoov等关键atom,在后续解析中也正常的解析了sample(采样)与chunk(数据块)的映射关系(stsc),但是在解码阶段却报出明显的Invalid NAL unit size异常。

分析

assets目录下的媒体文件是否被Android特殊处理了?

上述的现象首先想到的是assets目录下的资源文件是否被Android特殊处理过,最后导致FFmpeg在通过fd读取文件解码时发生错误。从AssetFileDescriptor的官方描述中可以获知Android好像并没有对assets下的文件做特殊的处理。

File descriptor of an entry in the AssetManager. This provides your own opened FileDescriptor that can be used to read the data, as well as the offset and length of that entry's data in the file.

然而在Android音视频开发中,我们经常使用MediaCodec的setDataSource(fd)方法来向MediaCodec传递媒体数据,MediaCodec却仍然可以正常的读取assets资源文件,难道在使用Android的AssetFileDescriptor文件标识符时需要特殊的处理?

MediaCodec是如何处理AssetFileDescriptor的?
搜索源码可以查找到MediaExtractor#setDataSource所调用的native方法为NuMediaExtractor::setDataSource,该方法最后将fd封装为FileSource对象。
NuMediaExtractor.cpp
 

status_t NuMediaExtractor::setDataSource(int fd, off64_t offset, off64_t size) {...if (mImpl != NULL) {return -EINVAL;}//创建FileSourcesp<FileSource> fileSource = new FileSource(dup(fd), offset, size);...return OK;
}

FileSource中读取数据的操作就是调用普通的linux内核函数read,这一过程并没有对fd做任何特殊的处理。

FileSource.cpp

ssize_t FileSource::readAt_l(off64_t offset, void *data, size_t size) {//seek到指定的offsetoff64_t result = lseek64(mFd, offset + mOffset, SEEK_SET);if (result == -1) {ALOGE("seek to %lld failed", (long long)(offset + mOffset));return UNKNOWN_ERROR;}//seek后从fd中读取指定大小的数据到data中return ::read(mFd, data, size);
}

【免费分享】音视频学习资料包、大厂面试题、技术视频和学习路线图,资料包括(C/C++,Linux,FFmpeg webRTC rtmp hls rtsp ffplay srs 等等)有需要的可以点击788280672加群免费领取~

那么FFmpeg是如何处理AssetFileDescriptor的?是否与MediaCodec不同?

FFmpeg对应的file协议处理在libavforamt/file.c中:

//4.3.1源码,109行
static int file_read(URLContext *h, unsigned char *buf, int size)
{FileContext *c = h->priv_data;int ret;size = FFMIN(size, c->blocksize);//同样是调用的read函数ret = read(c->fd, buf, size);if (ret == 0 && c->follow)return AVERROR(EAGAIN);if (ret == 0)return AVERROR_EOF;return (ret == -1) ? AVERROR(errno) : ret;
}

比较二者处理逻辑,FFmpeg在读取数据时也是使用的read函数,不同的是file_read函数中并没有seek相关的逻辑,这是因为libavformat/file.c中封装的是最基础的IO操作,并不会写有其他无关的逻辑,FFmpeg将所有的IO协议封装为URLProtocl结构体,我们可以简单看下file协议的定义:
 

const URLProtocol ff_file_protocol = {.name                = "file",.url_open            = file_open,.url_read            = file_read,//file_read函数指针.url_write           = file_write,.url_seek            = file_seek,//seek.url_close           = file_close,.........default_whitelist   = "file,crypto,data"
};

FFmpeg与MediaCodec在读取AssetFileDescriptor时都是使用的read函数,但是我们暂时无法确定FFmpeg内部seek的逻辑是否存在问题,由此怀疑FFmpeg是不是没有正确的处理AssetFileDescriptor的startOffset。
测试AVFormatContext中的skip_initial_bytes是否存在问题

  • 我们首先测试正常情况下offset为0的fd,我们可以使用Android中的ParcelFileDescriptor来将一个本地路径转换为fd:

Android应用层:

val fd = ParcelFileDescriptor.open(File(videoPath), ParcelFileDescriptor.MODE_READ_ONLY)

Native层:

fmtCtx = avformat_alloc_context();
fmtCtx->skip_initial_bytes = 0;
fmtCtx->iformat = av_find_input_format("mp4");

结果:正常解码

  • 测试offset不为0,我们可以使用十六进制工具打开视频文件手动的在文件头部添加几个字节来模拟offset的情况

Android应用层调用与上述相同

Native层需要设置skip_initial_bytes变量:

fmtCtx = avformat_alloc_context();
fmtCtx->skip_initial_bytes = 3;//在文件头部手动添加的字节数
fmtCtx->iformat = av_find_input_format("mp4");

结果:不能正常解码,可以获取媒体文件基本信息,日志与上述“问题”中的日志相同。
(如果你不具备测试条件,可以使用我的测试分支来检验结果,clone代码后可直接运行)
通过上面一些列的分析,几乎可以确定:FFmpeg在处理mp4(mov格式)的媒体文件时,如果设置了AVFormatContextskip_initial_bytes变量,FFmpeg将不能正确的读取和解码文件。
原因
通过查阅avformat_open_input函数可以看到下述与skip_initial_bytes变量相关的代码:
 

...
if ((ret = init_input(s, filename, &tmp)) < 0)goto fail;
...
avio_skip(s->pb, s->skip_initial_bytes);
...    
if (!(s->flags&AVFMT_FLAG_PRIV_OPT) && s->iformat->read_header)if ((ret = s->iformat->read_header(s)) < 0)goto fail;
...

在调用了重要函数init_input之后,avformat_open_input调用了avio_skip(s->pb, s->skip_initial_bytes);函数,说明在正确识别IO协议和探测文件格式(如何没有设置iformat)后,avformat_open_input将文件seek到了指定的offset位置,并没有其余的处理逻辑。
随后将会调用AVInputformat中的read_header函数指针,read_header函数指针指向对应文件格式的函数,在mov格式中的read_header函数为mov_read_headermov_read_header函数非常重要,内部将会调用mov_read_default()函数以8字节为单位循环地读取数据并查找是否有与mov_default_parse_table表中相匹配的atom,当查找到trak(可以理解为视频文件的媒体流,比如视频流或音频流)时即会调用mov_build_index()函数来进一步解析stsc(上文提到的sample 与chunk的映射关系)。在后续解码阶段调用av_frame_read()函数时,mov.c将会依赖stsc中的映射关系来查找和读取指定的chunk。
 

//4.3.1版本,mov.c 
static void mov_build_index(MOVContext *mov, AVStream *st) {....//3935行AVIndexEntry *e;....e->pos = current_offset;//直接赋值了解析stsc得到的chunk位置e->timestamp = current_dts;e->size = sample_size;e->min_distance = distance;e->flags = keyframe ? AVINDEX_KEYFRAME : 0;//这里打印的是我们上述分析的日志,还记得吗?av_log(mov->fc, AV_LOG_TRACE, "AVIndex stream %d, sample %u, offset %"PRIx64", dts %"PRId64", ""size %u, distance %u, keyframe %d\n", st->index, current_sample,current_offset, current_dts, sample_size, distance, keyframe);....}//av_frame_read函数最终也会调用到相应媒体格式的read_packet函数,雷神也有分析的文章,这里不再赘述
static int mov_read_packet(AVFormatContext *s, AVPacket *pkt)
{....//7887行if (st->discard != AVDISCARD_ALL) {//这里的sample->pos为上述stsc中解析得到的pos,而且seek模式为SEEK_SETint64_t ret64 = avio_seek(sc->pb, sample->pos, SEEK_SET);....}....
}

相信熟悉mov格式或文件IO的朋友基本已经看到问题所在了,avformat_open_input虽然在read_header之前seek了指定的skip_initial_bytes,但是在read_header解析chunk的offset时并没有加上我们文件的skip_initial_bytes,而mov.c在后续read_packet操作时又是根据read_header解析到的位置重新seek,最终导致从av_read_frame获得的AVPacket中的数据是错误的数据,所以给到编码器也就无法正常解码。

解决

解决方案比较简单,因为在mov.c解析atom时只传递了AVIOContext,所以我在AVIOContext中添加了同样的

skip_initial_bytes字段,当调用mov_build_index并在AVIndexEntry(采样映射关系的结构体)赋值pos时加上相应的skip_initial_bytes。我已将这种方案提交到了Github上,并详细说明了修改的文件,同时我也基于WhatTheCodec工程编写了新的demo,经过我最近的测试,并没有发现其他的问题。如有其他问题,欢迎大家交流并互相学习。
Github: github.com/YiChaoLove/…
Demo: github.com/YiChaoLove/…

pipe协议

在上述Stackoverflow的提问的回答中有提到使用pipe协议,实际上,这种方式也是可行的,但是我在实现的过程中发现了几个需要注意的问题,由于篇幅有限,我在这里便直接描述问题。

使用pipe协议需要注意缓冲区大小

pipe协议通常用于linux进程间通讯,但是pipe缓冲区是有大小限制的,在《深入理解Linux内核》一书中有提到其大小为16个页,每个页大小为4KB,那么按照LInux系统的规则来计算则为64KB,Android是基于LInux的操作系统,所以在Android中使用pipe协议来传递数据时也需要遵循pipe的调用规范来使用。我们可以在应用层新建单独的线程来向pipe的一端写入数据,而FFmpeg是读的一端。
为了更具有通用性,我在native层手动创建了pipe,把pipe的输出端fd给到FFmpeg,输入端fd由应用层持有并在IO线程中写入数据,这样,我们便可以利用pipe协议非常灵活的写入数据,甚至可以把内存中的视频数据直接传入FFmpeg中。详细代码见MediaFileBuilder.kt中的from(inputStream: InputStream, shortFormatName: String) 方法。

pipe协议对于某些视频(mov格式)文件无效?

当使用pipe时你有可能会遇到有些视频并不能正确的读取和解码,下面是一个类似的报错日志:

....
[FFMPEG]--:Before avformat_find_stream_info() pos: 7613571 bytes read:7613571 seeks:0 nb_streams:2
....
[FFMPEG]--:format: start_time: 0 duration: 7.234 (estimate from stream) bitrate=0 kb/s
[FFMPEG]--:Could not find codec parameters for stream 0 (Video: h264 (avc1 / 0x31637661), none, 720x960, 8285 kb/s): unspecified pixel format
[FFMPEG]--:Could not find codec parameters for stream 1 (Audio: aac (mp4a / 0x6134706D), 44100 Hz, 2 channels, 128 kb/s): unspecified sample format
[FFMPEG]--:After avformat_find_stream_info() pos: 7613571 bytes read:7613571 seeks:0 frames:0
....

日志报错在avformat_find_stream_info函数不能正确的找到编码器参数,经过对这些视频文件的分析和比较,我发现,对于moovmdat之后的视频文件,使用pipe协议将无法正常读取和解码,使用faststart参数将moov调整到mdat之前便可以正常读取和解码。
 

ffmpeg -i video.mp4 -c copy -movflags +faststart output.mp4

faststart参数多用于流媒体优化,mdat为实际存储视频数据的atom,moov用于存储视频信息,如果

moov在其之后,那么播放器在播放视频时就需要一直向后查找搜索moov。将moov放在文件头部(ftyp之后)有利于播放器快速获取视频信息,moov放在尾部那么播放器将不得不先read之前所有的数据,以FFmpeg为例,这一过程将会发生在上文提到的:

mov_read_header函数非常重要,内部将会调用mov_read_default()函数以8字节为单位循环地读取数据并查找是否有与mov_default_parse_table表中相匹配的atom

说到这里,你可能已经明白原因了,使用pipe协议为半双工单向通讯,如果视频文件的moovmdat之后,那么在avforamt_open_input读取完视频信息后,实际上FFmpeg已经read到了数据的结尾,而且pipe协议不支持seek,数据从缓冲区中读取后无法再次读取,所以这种情况下将不能够正确读取和解码视频文件。

总结

本文着重的分析了在使用AssetFileDescriptor向FFmpeg传递数据时遇到的问题,这一问题实际为FFmpeg在解析mov格式文件时不能正确处理skip_initial_bytes所致。最后我分享了在使用pipe协议时遇到的问题与解决方案。上述这两个问题的解决可能会大大方便FFmpeg在Android上的使用,虽然MediaCodec在音视频开发(Android)的部分场景中已经渐渐的取代了FFmpeg,但是FFmpeg的通用性、稳定性和兼容性使之仍然可能在未来的Android音视频开发中长期存在。
上述文章观点或心得仅代表个人,也可能有错误之处,如果你对文章中提及的内容有问题或质疑,欢迎issues。如果你觉得这篇文章对你的开发或学习有帮助,欢迎在FFmpegForAndroidAssetFileDescriptor上star。文中有提到mov格式,可以参考:

  • docs.fileformat.com/video/mov/
  • developer.apple.com/library/arc…



作者:Good_Boy
原文链接 FFmpeg读取Assets资源文件 - 掘金

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/233406.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PHPStudy快速搭建网站并结合内网穿透远程访问本地站点

文章目录 [toc]使用工具1. 本地搭建web网站1.1 下载phpstudy后解压并安装1.2 打开默认站点&#xff0c;测试1.3 下载静态演示站点1.4 打开站点根目录1.5 复制演示站点到站网根目录1.6 在浏览器中&#xff0c;查看演示效果。 2. 将本地web网站发布到公网2.1 安装cpolar内网穿透2…

Google Earth Engine(GEE)深度学习入门教程- GEE导出篇

GEE导出篇 官方教程&#xff1a;TFRecord 和地球引擎 在GEE的JS Code Editor中&#xff0c;我们按照我们的需要去处理对应的遥感影像&#xff0c;得到处理后Image影像。为了导出后读取数据&#xff0c;在导出前一定清楚每个波段的名称&#xff08;不然没法读取&#xff09;。…

数环通12月产品更新:新增数据表相关功能、优化编辑器,15+应用进行更新

为了满足用户不断增长的需求&#xff0c;我们持续努力提升产品的功能和性能&#xff0c;以更好地支持用户的工作。 数环通12月的最新产品更新已经正式发布&#xff0c;带来了一系列强大的功能&#xff0c;以提升您的工作效率和系统的可靠性。 更新快速预览 新增&优化功能&a…

小梅哥Xilinx FPGA学习笔记20——无源蜂鸣器驱动设计与验证(音乐发生器设计)

目录 一&#xff1a;章节导读 二&#xff1a;无源蜂鸣器驱动原理 三&#xff1a;PWM 发生器模块设计 3.1 PWM 发生器模块框图 3.2 PWM 发生器模块接口功能描述 3.3 PWM波生成设计文件代码 3.4 测试仿真文件 3.5 测试仿真结果 3.6 板级调试与验证之顶层文件设计 四&am…

【Project】TPC-Online Module (manuscript_2024-01-07)

PRD正文 一、概述 本模块实现隧道点云数据的线上汇总和可视化。用户可以通过注册和登录功能进行身份验证&#xff0c;然后上传原始隧道点云数据和经过处理的数据到后台服务器。该模块提供数据查询、筛选和可视化等操作&#xff0c;同时支持对指定里程的分段显示和点云颜色更改…

系列十一、(三)Sentinel控制台

一、Sentinel控制台 二、实时监控 2.1、概述 实时监控&#xff0c;顾名思义是用来实时监控的&#xff0c;具体监控的是接口请求通过的QPS和拒绝的QPS&#xff0c;默认情况下没有访问记录&#xff0c;所以看不到任何记录&#xff0c;需要访问接口才会有记录。另外需要注意&…

C++ 模板进阶

目录 一、非类型模板参数 二、模板的特化 1、函数模板特化 2、类模板特化 全特化 偏特化 3、例题 三、模板分离编译 1、定义 2、解决方法 3、模板总结 一、非类型模板参数 模板参数分类类型形参与非类型形参。 类型形参即&#xff1a;出现在模板参数列表中&#xf…

662. 二叉树最大宽度

题目 给你一棵二叉树的根节点 root &#xff0c;返回树的 最大宽度 。 树的 最大宽度 是所有层中最大的 宽度 。 每一层的 宽度 被定义为该层最左和最右的非空节点&#xff08;即&#xff0c;两个端点&#xff09;之间的长度。将这个二叉树视作与满二叉树结构相同&#xff0…

【Python学习】Python学习5-条件语句

目录 【Python学习】Python学习5-条件语句 前言if语句if语句判断条件简单的语句组参考 文章所属专区 Python学习 前言 本章节主要说明Python的条件语句&#xff0c;Python条件语句是通过一条或多条语句的执行结果&#xff08;True或者False&#xff09;来决定执行的代码块。 …

日志服务管理和inode号

一、系统日志管理 1.1系统日志的介绍 在现实生活中&#xff0c;记录日志也非常重要&#xff0c;比如银行的转账记录&#xff0c;飞机上的黑盒子&#xff0c;那么将系统和应用发生的事件记录至日志中&#xff0c;以助于排错和分析使用 日志记录的内容包括&#xff1a; 历史事…

设计模式② :交给子类

文章目录 一、前言二、Template Method 模式1. 介绍2. 应用3. 总结 三、Factory Method 模式1. 介绍2. 应用3. 总结 参考内容 一、前言 有时候不想动脑子&#xff0c;就懒得看源码又不像浪费时间所以会看看书&#xff0c;但是又记不住&#xff0c;所以决定开始写"抄书&qu…

代码随想录算法训练营day6|242.有效的字母异位词、349.两个数组的交集、202.快乐数

哈希表理论基础 建议&#xff1a;大家要了解哈希表的内部实现原理&#xff0c;哈希函数&#xff0c;哈希碰撞&#xff0c;以及常见哈希表的区别&#xff0c;数组&#xff0c;set 和map。 什么时候想到用哈希法&#xff0c;当我们遇到了要快速判断一个元素是否出现集合里的时…

【React系列】React中的CSS

本文来自#React系列教程&#xff1a;https://mp.weixin.qq.com/mp/appmsgalbum?__bizMzg5MDAzNzkwNA&actiongetalbum&album_id1566025152667107329) 一. React中的css方案 1.1. react 中的 css 事实上&#xff0c;css 一直是 React 的痛点&#xff0c;也是被很多开发…

自动生成表结构screw

采用的组件 screw 操作流程&#xff1a; 1、新建springboot 项目 2、引入相关的依赖 <!-- screw核心 --><dependency><groupId>cn.smallbun.screw</groupId><artifactId>screw-core</artifactId><version>1.0.4</version><…

2023 年精选:每个 DevOps 团队都应该了解的 5 种微服务设计模式

微服务彻底改变了应用程序开发世界&#xff0c;将大型整体系统分解为更小、更易于管理的组件。这种架构风格的特点是独立、松散耦合的服务&#xff0c;带来了从可扩展性、模块化到更高的灵活性等众多优势。 DevOps 团队如何最好地利用这种方法来实现最高效率&#xff1f;答案在…

分布式基础概念

分布式基础概念 1 微服务 微服务架构风格&#xff0c;就像是把一个单独的应用程序开发为一套小服务&#xff0c;每个小服务运行在自己的进程中&#xff0c;并使用轻量级机制通信&#xff0c;通常是HTTP API。这些服务围绕业务能力来构建&#xff0c;并通过完全自动化部署机制…

ElasticSearch 集群搭建与状态监控cerebro

单机的elasticsearch做数据存储&#xff0c;必然面临两个问题:海量数据存储问题、单点故障问题。为了解决存储能力上上限问题就可以用到集群部署。 海量数据存储问题:将索引库从逻辑上拆分为N个分片(shard)&#xff0c;存储到多个节点单点故障问题:将分片数据在不同节点备份 (r…

[每周一更]-(第82期):选购NAS中重要角色RAID

网络附加存储&#xff08;NAS&#xff09;在现代数字生活中扮演着至关重要的角色&#xff0c;而对于NAS的选择中&#xff0c;关注RAID的重要性更是不可忽视的。 数据存储和安全越来越受关注&#xff1b; 为什么要使用NAS&#xff1f; 集中式存储&#xff1a; NAS提供了一个集中…

【计算机病毒传播模型】报告:区块链在车联网中的应用

区块链在车联网中的应用 写在最前面题目 - 26 车联网安全汇报演讲稿-删减2后&#xff0c;最终版&#xff08;1469字版本&#xff09;汇报演讲稿-删减1后&#xff08;2555字版本&#xff09;汇报演讲稿-删减前&#xff08;3677字版本&#xff09;1 概述1.1 车联网1.2 区块链1.3 …

Linux离线安装MySQL(rpm)

目录 下载安装包安装MySQL检测安装结果服务启停MySQL用户设置 下载安装包 下载地址&#xff1a;https://downloads.mysql.com/archives/community/ 下载全量包如&#xff1a;(mysql-8.1.0-1.el7.x86_64.rpm-bundle.tar) 解压&#xff1a;tar -xzvf mysql-8.1.0-1.el7.x86_64.…