PCM数据的采集和播放

xiaoxiao2021-03-01  44

一、初识PCM

以下介绍来自百度百科

PCM 脉冲编码调制是Pulse Code Modulation的缩写。脉冲编码调制是数字通信的编码方式之一。主要过程是将话音、图像等模拟信号每隔一定时间进行取样,使其离散化,同时将抽样值按分层单位四舍五入取整量化,同时将抽样值按一组二进制码来表示抽样脉冲的幅值。

简而言之,语音、图像经过采样、量化之后进行二进制编码,最后得到的二进制码即为PCM数据。

二、Android平台上的实现

1、采集

对于音频的采集使用AudioRecord:

The AudioRecord class manages the audio resources for Java applications to record audio from the audio input hardware of the platform

AudioRecord用于管理音频源,从音频输入硬件记录音频。 下面开始一步步来实现:

权限

<uses-permission android:name="android.permission.RECORD_AUDIO" /> <uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE" />

创建文件

audioFile = new File(Environment.getExternalStorageDirectory().getAbsolutePath() + "/test.pcm"); if (audioFile.exists()) { audioFile.delete(); } audioFile.createNewFile(); OutputStream os = new FileOutputStream(audioFile);

创建的PCM文件用于存储采集的音频,输出流用于将音频数据写入到文件。

创建AudioRecord对象

AudioRecord有两个构造方法,其中一个被@SystemApi标记,故一般使用另外一个:

public AudioRecord(int audioSource, int sampleRateInHz, int channelConfig, int audioFormat,int bufferSizeInBytes) audioSource 记录源,在 MediaRecorder.AudioSource中可看到所有类型,此处传入MediaRecorder.AudioSource.MIC。sampleRateInHz 采样频率,单位Hz,常见的有44100,22050、16000,、和11025 ,其中44100可以保证在所有设备上正常工作,此处取该值。channelConfig 音频通道设置,有AudioFormat.CHANNEL_IN_MONOAudioFormat.CHANNEL_IN_STEREO,前者可以保证在所有设备上正常工作,此处取该值。audioFormat 音频格式,有AudioFormat.ENCODING_PCM_8BIT、AudioFormat.ENCODING_PCM_16BIT和AudioFormat.ENCODING_PCM_FLOAT,精度依次递增,此处取16bit。bufferSizeInBytes 缓冲区大小,单位是byte,可调用以下方法获取: getMinBufferSize(int sampleRateInHz, int channelConfig, int audioFormat)

###开始记录

audioRecord.startRecording(); byte bytes[] = new byte[minBufferSize]; while (isRecord) { int length = audioRecord.read(bytes, 0, minBufferSize); if (length > 0) { os.write(bytes); } }

停止记录

audioRecord.stop(); audioRecord.release();

2、播放

创建播放器

使用AudioTrack播放PCM,在SDK23前后,创建的方法不一样:

int sampleRateInHz = 44100; int channelConfig = AudioFormat.CHANNEL_OUT_MONO; int audioFormat = AudioFormat.ENCODING_PCM_16BIT; int minBufferSize = AudioTrack.getMinBufferSize(sampleRateInHz , channelConfig , audioFormat); int length = minBufferSize + 1024; if (Build.VERSION.SDK_INT >= 23) { player = new AudioTrack.Builder() .setAudioFormat(new AudioFormat.Builder() .setEncoding(audioFormat) .setSampleRate(sampleRateInHz) .setChannelMask(channelConfig) .build()) .setBufferSizeInBytes(length) .build(); } else { player = new AudioTrack(AudioManager.STREAM_MUSIC, sampleRateInHz, channelConfig, audioFormat, length, MODE_STREAM); }

上面的几个参数与创建AudioRecord时是相似且对应的,但是注意channelConfig有in和out的区别。 关于length这个参数,最初使用的如下方式:

int length = (int) audioFile.length();

实测发现过大或者过小都有可能引发“play() called on uninitialized AudioTrack”的异常,现在的写法是借鉴了stackoverflow的解决方法。

给播放器写入数据

InputStream is = new FileInputStream(audioFile); int read; while ((read = is.read(bytes)) > 0) { player.write(bytes, 0, read); }

很眼熟吧,其实就是Java输入流的基本用法。

播放

调用player.play();

停止播放

if (player != null && player.getPlayState() == AudioTrack.PLAYSTATE_PLAYING) { player.stop(); player.release(); }

把与停止无关的判断也一并写在这里了,因为实际开发时是很有必要进行这样的判断的。

后记

一直以来都对音视频领域比较感兴趣,奈何工作上一直没有机会基础,无意间看见Jhuster大神的Android 音视频开发入门指南,决定利用闲暇时间入坑,在此表示感谢。

源码 Thanks Android 音视频开发入门指南 Android音频处理

转载请注明原文地址: https://www.6miu.com/read-3450197.html

最新回复(0)