音频术语

此音频相关术语词汇表包含广泛使用的通用术语和 Android 专用术语。如需查看术语的规范定义,请参阅中央Android 平台词汇表

通用术语

通用音频相关术语具有约定俗成的含义。

数字音频

数字音频术语与使用以数字形式编码的音频信号处理声音有关。如需了解详情,请参阅数字音频

AC-3
杜比音频编解码器。如需了解详情,请参阅杜比数字
声学
研究声音的机械特性,例如设备上换能器(例如,扬声器、麦克风)的物理位置如何影响感知到的音频质量。
衰减
小于或等于 1.0 的乘法因子,应用于音频信号以降低信号电平。与增益进行比较。
发烧友
注重卓越音乐再现体验的人,尤其愿意为音质做出重大权衡(例如,费用、组件尺寸、房间设计)。如需了解详情,请参阅发烧友
AVB
一种通过以太网实时传输数字音频的标准。如需了解详情,请参阅音频视频桥接
每样本位数或位深
每个样本的信息位数。
声道
音频信息的单个流,通常对应于录音或播放的某个位置。
向下混合
减少声道数,例如从立体声到单声道或从 5.1 声道到立体声。通过丢弃声道、混合声道或更高级的信号处理来实现。简单的混合而不进行衰减或限制可能导致溢出和削波。与向上混合进行比较。
DSD
Direct Stream Digital。基于脉冲密度调制的专有音频编码。脉冲编码调制 (PCM) 将波形编码为多个位的各个音频样本序列,而 DSD 将波形编码为极高采样率(没有样本概念)的位序列。PCM 和 DSD 都通过独立的序列来表示多个声道。DSD 比用作处理的内部表示更适合内容分发,因为它可能难以将传统的数字信号处理 (DSP) 算法应用于 DSD。DSD 用于Super Audio CD (SACD) 和用于 USB 的 DSD over PCM (DoP) 中。如需了解详情,请参阅Direct Stream Digital
duck
当另一个流变为活动状态时,暂时降低某个流的音量。例如,如果在播放音乐时收到通知,则音乐会在播放通知时降低音量。与静音进行比较。
FIFO
先进先出。实现数据FIFO排队的硬件模块或软件数据结构。在音频上下文中,队列中存储的数据通常是音频帧。FIFO 可以通过循环缓冲区来实现。
一组样本,每个声道一个,在某个时间点。
每缓冲区帧数
一次从一个模块传递到下一个模块的帧数。音频 HAL 接口使用每缓冲区帧数的概念。
增益
大于或等于 1.0 的乘法因子,应用于音频信号以增加信号电平。与衰减进行比较。
高清音频
高清晰度音频。高分辨率音频的同义词(但与 Intel High Definition Audio 不同)。
耳机
罩在耳朵上的扬声器,没有麦克风。与头戴式耳机进行比较。
头戴式耳机
带有麦克风的耳机。与耳机进行比较。
Hz
采样率或帧率的单位。
高分辨率音频
表示的位深和采样率高于 CD(立体声 16 位 PCM,44.1 kHz),并且没有有损数据压缩。等同于高清音频。如需了解详情,请参阅高分辨率音频
交错
一种用于多声道数字音频的表示形式,可在声道之间交替数据。例如,以交错格式表示的立体声数字音频会交替左右声道数据。
延迟
信号通过系统时的时间延迟。
无损
一种无损数据压缩算法,可在编码和解码过程中保持位精度,其中解码先前编码数据的结果等同于原始数据。无损音频内容分发格式的示例包括CDWAV 中的 PCM 以及 FLAC。创作过程可能会降低比特深度或采样率,使其低于母带的比特深度或采样率;保留母带分辨率和位精度的分发格式是高分辨率音频的主题。
有损
一种有损数据压缩算法,旨在编码和解码过程中保留媒体最重要的特征,其中解码先前编码数据的结果在感知上与原始数据相似但不完全相同。有损音频压缩算法的示例包括 MP3 和 AAC。由于模拟值来自连续域,而数字值是离散的,因此 ADC 和 DAC 是相对于幅度的有损转换。另请参阅透明度
单声道
一个声道。
多声道
请参阅环绕声。严格来说,立体声是多于一个声道,可以被认为是多声道;但是,这种用法容易引起混淆,因此应避免使用。
静音
临时强制音量为零,独立于常用的音量控制。与闪避进行比较。
过载
因未能及时接受提供的数据而引起的可听故障。有关详细信息,请参阅缓冲区欠载。与欠载进行比较。
声像
将信号定向到立体声或多声道场内的所需位置。
PCM
脉冲编码调制。数字音频最常见的低级编码。音频信号以规则的时间间隔(称为采样率)进行采样,然后根据比特深度量化为特定范围内的离散值。例如,对于 16 位 PCM,采样值是介于 -32768 和 +32767 之间的整数。
渐变
逐渐增加或减少特定音频参数的级别,例如音量或效果的强度。暂停和恢复音乐时,通常应用音量渐变以避免硬性可听见的过渡。
采样
表示音频值在某个时间点的单个声道的数字。
采样率或帧率
每秒帧数。虽然帧率更准确,但采样率通常用于表示帧率。
声音化
使用声音来表达反馈或信息,例如触摸声音和键盘声音。
SPL
声压级,一种相对的声压测量值。
立体声
两个声道。与多声道进行比较。
立体声扩展
应用于立体声信号的效果,以产生听起来更饱满和更丰富的另一个立体声信号。该效果也可以应用于单声道信号,在这种情况下,它是一种上混。
环绕声
一种增强听众感知左右立体声之外的声音位置能力的技术。
透明度
有损数据压缩的理想结果。如果人类受试者在感知上无法将其与原始数据区分开来,则有损数据转换是透明的。有关详细信息,请参阅透明度
欠载
因未能及时提供所需数据而引起的可听故障。有关详细信息,请参阅缓冲区欠载。与过载进行比较。
上混
增加声道数量,例如从单声道到立体声或从立体声到环绕声。通过复制、声像或更高级的信号处理来实现。与下混进行比较。
USAC
统一语音和音频编码。一种用于低比特率应用的音频编解码器。有关详细信息,请参阅统一语音和音频编码
虚拟器
尝试空间化音频声道的特效,例如尝试模拟更多扬声器或产生声源具有位置的错觉。
音量
响度,音频信号的主观强度。

设备间互连

设备间互连技术将音频和视频组件在设备之间连接起来,并且在外部连接器处清晰可见。HAL 实现者和最终用户应了解这些术语。

蓝牙
短程无线技术。有关音频相关的 蓝牙配置文件蓝牙协议 的详细信息,请参阅用于音乐的 A2DP、用于电话的 SCO 以及 音频/视频远程控制配置文件 (AVRCP)
DisplayPort
视频电子标准协会 (VESA) 的数字显示接口。
硬件锁
一种小型装置,尤其是一种悬挂在另一个设备上的装置。有关详细信息,请参阅硬件锁
FireWire
请参阅IEEE 1394
HDMI
高清晰度多媒体接口。用于传输音频和视频数据的接口。对于移动设备,使用 micro-HDMI(D 型)或 MHL 连接器。
IEEE 1394
一种用于实时低延迟应用的串行总线,例如音频。也称为 FireWire。有关详细信息,请参阅IEEE 1394
Intel HDA
英特尔高清晰度音频(不要与通用的高清晰度音频高分辨率音频混淆)。用于前面板连接器的规范。有关详细信息,请参阅英特尔高清晰度音频
接口
接口 将信号从一种表示形式转换为另一种表示形式。常见的接口包括 USB 音频接口和 MIDI 接口。
线路电平
在音频组件之间传递的模拟音频信号的强度,而不是换能器。有关详细信息,请参阅线路电平
MHL
移动高清连接。移动音频视频接口,通常通过 micro-USB 连接器。
耳机连接器
将设备连接到有线耳机、头戴式耳机或线路电平放大器的迷你或超迷你组件。
SlimPort
从 micro-USB 到 HDMI 的适配器。
S/PDIF
索尼/飞利浦数字接口格式。用于未压缩 PCM 和 IEC 61937 的互连。有关详细信息,请参阅S/PDIF。S/PDIF 是 AES3 的消费级变体。
Thunderbolt
与 USB 和 HDMI 竞争以连接高端外围设备的多媒体接口。有关详细信息,请参阅Thunderbolt
TOSLINK
S/PDIF 一起使用的光纤音频电缆。有关详细信息,请参阅TOSLINK
USB
通用串行总线。有关详细信息,请参阅USB

设备内互连

设备内互连技术连接给定设备内的内部音频组件,并且在不拆卸设备的情况下不可见。HAL 实现者可能需要了解这些,但最终用户不需要。有关设备内互连的详细信息,请参阅以下文章

ALSA 片上系统 (ASoC) 中,这些统称为数字音频接口 (DAI)

音频信号路径

音频信号路径术语与音频数据从应用到换能器或从换能器到应用的信号路径有关。

ADC
模数转换器。将模拟信号(在时间和幅度上连续)转换为数字信号(在时间和幅度上离散)的模块。从概念上讲,ADC 由周期性的采样保持和量化器组成,尽管不一定以这种方式实现。ADC 通常前面有一个低通滤波器,以消除任何无法使用所需采样率表示的高频分量。有关详细信息,请参阅模数转换器
AP
应用处理器。移动设备上的主要通用计算机。
编解码器
编码器-解码器。将音频信号从一种表示形式编码和解码为另一种表示形式(通常为模拟到 PCM 或 PCM 到模拟)的模块。严格来说,编解码器保留用于同时编码和解码的模块,但可以宽松地用于仅指代其中之一。有关详细信息,请参阅音频编解码器
DAC
数模转换器。将数字信号(在时间和幅度上离散)转换为模拟信号(在时间和幅度上连续)的模块。通常后面跟着一个低通滤波器,以消除数字量化引入的高频分量。有关详细信息,请参阅数模转换器
DSP
数字信号处理器。可选组件,通常位于应用处理器之后(对于输出)或应用处理器之前(对于输入)。主要目的是卸载应用处理器并以更低的功耗成本提供信号处理功能。
PDM
脉冲密度调制。用于通过数字信号表示模拟信号的一种调制形式,其中 1 与 0 的相对密度表示信号电平。通常由数模转换器使用。有关详细信息,请参阅脉冲密度调制
PWM
脉冲宽度调制。用于通过数字信号表示模拟信号的一种调制形式,其中数字脉冲的相对宽度表示信号电平。通常由模数转换器使用。有关详细信息,请参阅脉冲宽度调制
换能器
将物理现实世界量中的变化转换为电信号。在音频中,物理量是声压,换能器是扬声器和麦克风。有关详细信息,请参阅换能器

采样率转换

采样率转换术语与从一个采样率转换为另一个采样率的过程有关。

降采样
重采样,其中接收器采样率 < 源采样率。
奈奎斯特频率
可以由给定采样率 1/2 的离散信号表示的最大频率分量。例如,人类听力范围延伸至大约 20 kHz,因此数字音频信号必须具有至少 40 kHz 的采样率才能表示该范围。实际上,常用的采样率为 44.1 kHz 和 48 kHz,奈奎斯特频率分别为 22.05 kHz 和 24 kHz。有关详细信息,请参阅奈奎斯特频率听力范围
重采样器
采样率转换器的同义词。
重采样
转换采样率的过程。
采样率转换器
执行重采样的模块。
接收器
重采样器的输出。
重采样器的输入。
升采样
重采样,其中接收器采样率 > 源采样率。

电话

AEC
声学回声消除。一种减少信号回声的方法。有关详细信息,请参阅回声抑制和消除
ANC
主动噪声控制。一种通过主动添加不需要的辅助信号的反相来提高主信号质量的方法。有关详细信息,请参阅主动噪声控制
拨号器
为电话提供用户界面的应用。
HCO
听力延续。一种 TTY 模式,其中消息以文本形式发送,并以语音形式接收。
侧音
从本地麦克风到本地听筒的可听反馈。有关详细信息,请参阅侧音
TDD
聋人电信设备。一种用于听力或言语障碍人士的特定类型的电传打字机 (TTY)。
TTY
电传打字机。通常与 TDD 交替使用。
UE
用户设备。消费者电话设备。
UMTS
通用移动通信系统。一种移动蜂窝系统。
VCO
语音延续。一种 TTY 模式,其中消息以音频形式发送,并以文本形式接收。

Android 特定术语

Android 特定术语包括仅在 Android 音频框架中使用的术语以及在 Android 中具有特殊含义的通用术语。

ALSA
高级 Linux 声音架构。适用于 Linux 的音频框架,也影响了其他系统。有关通用定义,请参阅ALSA。在 Android 中,ALSA 指的是内核音频框架和驱动程序,而不是用户模式类。另请参阅TinyALSA
音频设备
由 HAL 实现支持的音频 I/O 端点。
AudioEffect, AudioEffect
输出(后处理)效果和输入(预处理)效果的实现框架和类。该类在 android.media.audiofx.AudioEffect 中定义。
AudioFlinger
Android 声音服务器实现。AudioFlinger 在 mediaserver 进程中运行。有关通用定义,请参阅声音服务器
音频焦点
用于管理多个独立应用之间的音频交互的一组 API。有关详细信息,请参阅处理音频输出中的更改以及 android.media.AudioManager 的焦点相关方法和常量。
AudioMixer
AudioFlinger 中负责组合多个音轨并应用衰减(音量)和效果的模块。有关通用定义,请参阅音频混合(录制音乐)(讨论了作为硬件设备或软件应用的混音器,而不是系统内的软件模块)。
音频策略
负责所有需要首先做出策略决定的操作的服务,例如打开新的 I/O 流、更改后重新路由以及流音量管理。
AudioRecord
用于从音频输入设备(如麦克风)接收数据的主要低级客户端类。数据通常为 PCM 格式。该类在 android.media.AudioRecord 中定义。
AudioResampler
AudioFlinger 中负责采样率转换的模块。
音频源, AudioSource
指示捕获音频输入所需的用例的常量枚举。该类在 android.media.MediaRecorder.AudioSource 中定义。从 API 级别 21 及更高版本开始,首选音频属性
AudioTrack
用于将数据发送到音频输出设备(如扬声器)的主要低级客户端类。数据通常为 PCM 格式。该类在 android.media.AudioTrack 中定义。
audio_utils
用于 PCM 格式转换、WAV 文件 I/O 和 非阻塞 FIFO 等功能的音频实用程序库,该库在很大程度上独立于 Android 平台。
客户端
通常是应用或应用客户端。但是,AudioFlinger 客户端可以是 mediaserver 系统进程内运行的线程,例如在播放由 MediaPlayer 对象解码的媒体时。
HAL
硬件抽象层。HAL 是 Android 中的通用术语;在音频中,它是 AudioFlinger 和内核设备驱动程序之间的层,具有 C API(取代了 C++ libaudio)。
FastCapture
AudioFlinger 内的线程,当配置为降低延迟时,该线程将音频数据发送到较低延迟的快速音轨并驱动输入设备。
FastMixer
AudioFlinger 内的线程,当配置为降低延迟时,该线程接收和混合来自较低延迟快速音轨的音频数据并驱动主输出设备。
快速音轨
AudioTrackAudioRecord 客户端,在某些设备和路由上具有较低的延迟但较少的功能。
MediaPlayer
AudioTrack 更高级别的客户端类。播放编码内容或包含多媒体音频和视频音轨的内容。该类在 android.media.MediaPlayer 中定义。
media.log
仅在自定义版本中可用的 AudioFlinger 调试功能。用于将音频事件记录到循环缓冲区,其中事件可以在需要时追溯转储。
mediaserver
包含媒体相关服务(包括 AudioFlinger)的 Android 系统进程。
NBAIO
非阻塞音频输入和输出。AudioFlinger 端口的抽象。该术语可能具有误导性,因为 NBAIO API 的某些实现支持阻塞。NBAIO 的主要实现用于不同类型的管道。
普通混音器
AudioFlinger 内的线程,为大多数功能齐全的 AudioTrack 客户端提供服务。直接驱动输出设备或使用管道将其子混音馈送到 FastMixer。
OpenSL ES
Khronos Group 的音频 API 标准。API 级别为 9 及更高版本的 Android 版本支持基于 OpenSL ES 1.0.1 子集的原生音频 API。
专业音频
功能标志 android.hardware.audio.pro 的缩写。要求记录在 Android CDD 的5.10 专业音频部分中。功能 android.hardware.audio.pro 中的 pro 指的是可预测的实时性能水平,而不是预期用户。
实时(名词),实时的(形容词)

实时计算系统保证在所需的时间限制内对相关事件做出响应。设备实现对实时计算的支持是满足专业音频中描述的 android.hardware.audio.pro 功能要求的必要但不充分的先决条件。

实时性能在音频以外的其他领域也具有优势,例如游戏、图形、相机、视频、传感器处理、虚拟现实 (VR) 和增强现实 (AR)。

静音模式
用户可设置的功能,用于使手机铃声和通知静音,而不影响媒体播放(音乐、视频、游戏)或闹钟。
SoundPool
AudioTrack 更高级别的客户端类。播放采样音频剪辑。对于触发 UI 反馈和游戏声音等内容很有用。该类在 android.media.SoundPool 中定义。
Stagefright
媒体播放引擎。请参阅媒体
StateQueue
AudioFlinger 内的模块,负责在线程之间同步状态。NBAIO 用于传递数据,而 StateQueue 用于传递控制信息。
策略
具有相似行为的流类型组。由音频策略服务使用。
流类型
表示音频输出用例的枚举。音频策略实现使用流类型以及其他参数来确定音量和路由决策。有关流类型列表,请参阅 android.media.AudioManager
T 型接收器
请参阅音频调试
TinyALSA, tinyalsa
TinyALSA 是 ALSA 内核之上的小型用户模式 API,具有 BSD 许可证。tinyalsa 是 TinyALSA 库中软件包的名称。建议 HAL 实现使用该库。
ToneGenerator
AudioTrack 更高级别的客户端类。播放双音多频 (DTMF) 信号。有关详细信息,请参阅双音多频信令以及 android.media.ToneGenerator 中的类定义。
音轨
音频流。由 AudioTrackAudioRecord 类控制。
音量衰减曲线
从通用音量索引到给定输出的特定衰减因子的设备特定映射。
音量索引
表示流的所需相对音量的无单位整数。android.media.AudioManager 的音量相关 API 元素在音量索引而不是绝对衰减因子中运行。