Python在音频（Audio）领域中，如何进行数据扩充呢？-德赢Vwin官网网

Python在音频（Audio）领域中，如何进行数据扩充呢？

Python 音频的数据扩充

经典的深度学习网络AlexNet使用数据扩充（Data Augmentation）的方式扩大数据集，取得较好的分类效果。在深度学习的图像领域中，通过平移、翻转、加噪等方法进行数据扩充。但是，在音频（Audio）领域中，如何进行数据扩充呢？

音频的数据扩充，主要有以下四种方式：

音频剪裁（Clip）

音频旋转（Roll）

音频调音（Tune）

音频加噪（Noise）

音频解析基于librosa音频库；矩阵操作基于scipy和numpy科学计算库。

以下是Python的实现方式

音频剪裁

import librosa

from scipy.io import wavfile y, sr = librosa.load("../data/love_illusion.mp3")

# 读取音频print y.shape, sr wavfile.write("../data/love_illusion_20s.mp3", sr, y[20 * sr:40 * sr])

# 写入音频

音频旋转

import cv2

import librosa

from scipy.io import wavfile y, sr = librosa.load("../data/raw/love_illusion_20s.mp3")

# 读取音频ly = len(y) y_tune = cv2.resize(y, (1, int(len(y) * 1.2))).squeeze() lc = len(y_tune) - ly y_tune = y_tune[int(lc / 2):int(lc / 2) + ly]print y.shape, sr wavfile.write("../data/raw/xxx_tune.mp3", sr, y_tune)

# 写入音频

音频调音

import cv2

import librosa

from scipy.io import wavfile y, sr = librosa.load("../data/raw/love_illusion_20s.mp3")

# 写入音频

音频加噪

import librosa

from scipy.io import wavfile

import numpy as np

y, sr = librosa.load("../data/raw/love_illusion_20s.mp3")

# 读取音频wn = np.random.randn(len(y)) y = np.where(y != 0.0, y + 0.02 * wn, 0.0)

# 噪声不要添加到0上！print y.shape, sr wavfile.write("../data/raw/love_illusion_20s_w.mp3", sr, y)

# 写入音频

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

音频

音频

+关注

关注
29

文章
2868

浏览量
81490
python

python

+关注

关注
56

文章
4792

浏览量
84624

原文标题：Python音频的数据扩充

文章出处：【微信号：machinelearningai，微信公众号：机器学习算法与人工智能】欢迎添加关注！文章转载请注明出处。

在labview中如何进行数据存储？

在labview中如何进行数据存储？

发表于 07-26 09:19

请问问手机与电脑之间在没有网络的情况下如何进行数据传输！

请问问手机与电脑之间在没有网络的情况下如何进行数据传输！

发表于 05-31 21:15

HX711如何进行数据处理？

HX711如何进行数据处理？

发表于 11-21 22:03

利用Python进行数据分析之时间序列基础

《利用Python进行数据分析》 112时间序列基础

发表于 03-20 09:30

如何利用Python进行数据分析

《利用Python进行数据分析》 122高阶GroupBy应用

发表于 04-23 07:29

如何进行数字信号处理呢？有哪几个基本步骤呢？

数字信号处理是如何定义的？如何进行数字信号处理呢？有哪几个基本步骤呢？

发表于 06-22 06:46

串口通信中外设与开发板串口通信是如何进行数据传输的？

串口通信中外设与开发板串口通信是如何进行数据传输的？在使用外设时怎样将外设的数据返回给开发板呢？

发表于 07-07 07:58

STM32 USART串口是如何进行数据处理的呢

STM32 USART串口接收数据的具体步骤有哪些？STM32 USART串口是如何进行数据处理的呢？

发表于 11-25 08:56

PC机的串口调试助手与STM32是如何进行数据收发的

怎样通过PC机的串口调试助手将数据发送至STM32呢？PC机的串口调试助手与STM32是如何进行数据收发的？

发表于 12-09 07:17

什么是信号处理?如何进行数字信号处理呢？

什么是信号处理?如何进行数字信号处理呢？在我们的周围存在着为数众多的"信号"。如：从茫茫宇宙中的天体发出的微弱电波信号，移动电话发出

发表于 03-06 10:13 •3370次阅读

Python在信息安全领域中的运用

Python在信息安全领域中的运用

发表于 09-07 09:51 •27次下载

<b class='flag-5'>Python</b><b class='flag-5'>在</b>信息安全<b class='flag-5'>领域中</b>的运用

数据库教程之如何进行数据库设计

本文档的主要内容详细介绍的是数据库教程之如何进行数据库设计内容包括了：1 数据库设计概述，2 数据库需求分析，3 数据库结构设计，4

发表于 10-19 10:41 •21次下载

<b class='flag-5'>数据</b>库教程之如<b class='flag-5'>何进行数据</b>库设计

数据库系统概论之如何进行数据库编程的资料概述

本文档的主要内容详细介绍的是数据库系统概论之如何进行数据库编程的资料概述主要内容包括了：1、嵌入式SQL 2、存储过程3、ODBC编程

发表于 11-15 15:12 •13次下载

<b class='flag-5'>数据</b>库系统概论之如<b class='flag-5'>何进行数据</b>库编程的资料概述

在风格迁移中如何进行数据增强

这是一篇关于风格迁移中如何进行数据增强的论文。在introduction部分，informal--formal 的风格迁移问题，最大的障碍是训练数据的不足。为了解决此问题，本篇论文提出三种数据

发表于 01-13 09:41 •2527次阅读

蓝牙midi和蓝牙音频或者蓝牙audio有什么区别呢

、什么是蓝牙midi，这个一般问这个问题的人，基本都懂，蓝牙midi实际就是在标准midi协议的基础上扩充为无线连接而已，原先的midi是靠usb传输，现在换成蓝牙 3、什么是蓝牙audio，这个就更简单了，蓝牙音箱或者蓝牙耳

发表于 01-09 15:22 •1159次阅读

搜索历史

Python在音频（Audio）领域中，如何进行数据扩充呢？

评论

在labview中如何进行数据存储？

请问问手机与电脑之间在没有网络的情况下如何进行数据传输！

HX711如何进行数据处理？

利用Python进行数据分析之时间序列基础

如何利用Python进行数据分析

如何进行数字信号处理呢？有哪几个基本步骤呢？

串口通信中外设与开发板串口通信是如何进行数据传输的？

STM32 USART串口是如何进行数据处理的呢

PC机的串口调试助手与STM32是如何进行数据收发的

什么是信号处理?如何进行数字信号处理呢？

Python在信息安全领域中的运用

数据库教程之如何进行数据库设计

数据库系统概论之如何进行数据库编程的资料概述

在风格迁移中如何进行数据增强

蓝牙midi和蓝牙音频或者蓝牙audio有什么区别呢