一、概述
本节我们讨论延迟求和波束形成算法,包括原理分析及代码实现。 更多资料和代码可以进入 https://t.zsxq.com/qgmoN ,同时欢迎大家提出宝贵的建议,以共同探讨学习。
二、原理分析
2.1 原理:
首先对不同麦克风信号之间的相对延迟进行补偿,然后叠加延时后的信号形成一个单一的输出。
式中,表示波束形成器的权值向量,
表示转置,
表示共轭转置。因此,波束形成是对各个麦克风接收信号进行加权因子调节并相加的过程。对各个麦克风来说,信号在一瞬间的幅值相同,一般只做信号的相位调整,不做幅度改变。由此可知,如果空间中仅存在一个
方向的波信号
,当权重矢量取
时,则输出信号最大值
。这时阵列各路信号加权相干叠加,为经典的固定波束形成(Fixed Beamforming)。
2.2 缺点:
如果噪声源是相干的,降噪效果会强烈地依赖于噪声信号的到达方向,延迟求和波束形成在混响环境中的性能往往是不够好的。
2.3 优点:
由于可以有效地减轻非相干噪声,成本低且有一定效果,该类波束形成器仍然被广泛使用。需要注意的是,对信号的延时过程中,会遇到延时样点为分数的情形(如延时2.4个样点),这时就需要对信号进行分数时延,参考:“分数时延滤波器”;DSB简单易于实现,基于上述延时求和的思想,衍生出来其他几种简单的BF算法:delay sub(延时相减)和自适应零点的双麦BF等。
三、仿真代码
import numpy as np
import soundfile as sf
import scipy
import matplotlib.pyplot as pltfft_size = 256
freq_bin = 129def calculate_circular_array_steering_vector(angle, r=0.0463, N=6, fs=16000, fft_size=256, c=343):steering_vector = np.zeros((N, fft_size//2 + 1), dtype=complex)for f in range(int(fft_size/2+1)):for n in range(N):frequency = fs * f / fft_sizeif frequency == 0:phase_delay = 0steering_vector[n, f] = np.exp(1j * phase_delay)else:lambda_val = c / frequencytheta_mic = -2 * np.pi * n / N + 2 * np.pitheta_signal = np.pi * angle / 180phase_delay = 2 * np.pi * np.cos(theta_signal - theta_mic) * r / lambda_valsteering_vector[n, f] = np.exp(1j*phase_delay)return steering_vectordef calculate_circular_array_steering_vector_anticlockwise(angle, r=0.0463, N=6, fs=16000, fft_size=256, c=343):steering_vector = np.zeros((N, fft_size // 2 + 1), dtype=complex)for f in range(int(fft_size / 2 + 1)):for n in range(N):frequency = fs * f / fft_sizeif frequency == 0:phase_delay = 0steering_vector[n, f] = np.exp(1j * phase_delay)else:lambda_val = c / frequencytheta_mic = 2 * np.pi * n / Ntheta_signal = np.pi * angle / 180phase_delay = 2 * np.pi * np.cos(theta_signal - theta_mic) * r / lambda_valsteering_vector[n, f] = np.exp(1j * phase_delay)return steering_vectordef delay_and_sum(a, data):data1 = np.multiply(np.conjugate(a), data)data2 = np.sum(data1, axis=0) / 6return data2def main():# 读取WAV文件data, samplerate = sf.read('output/simulate_role1_0_t60_0.2_role2_180_t60_0.2.wav')# 定义帧长和帧移frame_length = int(samplerate * 0.016) # 25ms帧长frame_step = int(samplerate * 0.008) # 10ms帧移# 创建汉明窗hamming_window = scipy.signal.windows.hamming(frame_length)hamming_window = np.reshape(hamming_window, [frame_length, 1])sample_num = data.shape[0] - frame_length + 1HH = calculate_circular_array_steering_vector(180)# 手动分帧和加窗frames = []out1 = np.zeros(int(fft_size/2), dtype=float)for i in range(0, sample_num, frame_step):frame = data[i:i + frame_length, :]windowed_frame = frame * hamming_windowfft_frame = np.fft.fft(windowed_frame, axis=0)fft_frame1 = np.transpose(fft_frame[:freq_bin, :])fft_frame1 = delay_and_sum(HH, fft_frame1)fft_frame11 = fft_frame1fft_frame21 = np.concatenate((fft_frame11, fft_frame11[1:-1][::-1].conj()))fft_frame21 = np.transpose(fft_frame21)ifft_frame1 = np.fft.ifft(fft_frame21)short_data1 = ifft_frame1[:int(fft_size/2)] + out1out1 = ifft_frame1[int(fft_size/2):]frames.extend(short_data1)frames1 = np.array(frames).reshape((-1)).realsf.write("output/simulate_role1_0_t60_0.2_role2_180_t60_0.2_out_das_t180.wav", frames1, 16000)main()
四、结果
4.1 0度方向
4.2 180度方向
五、总结
从结果上看,延迟求和波束形成效果不佳,主要是低频信号基本没有效果,而语音信号基本上信息集中在中低频,下节我们将介绍其他效果更好的波束形成算法。