G

GP

V1

2023/04/27阅读:14主题:默认主题

通过可视化一文看懂 Kaggle 鸟声识别 竞赛

通过可视化一文看懂 Kaggle-鸟声识别竞赛

🐤EDA|🐦可视化+ 音频探索🔉

本文转载自Kaggle论坛 BURHANUDDIN LATSAHEB

引言

笔记本概述: 1.对不同鸟类声音及其不同特征进行广泛的EDA 2.目标是通过声音使用机器学习来识别东非鸟类。

BirdCLEF 2023 竞赛简介:

鸟类不仅是迷人的生物,而且是一个环境健康的重要指标。BirdCLEF 2023 竞赛,由 Kaggle 主办,旨在通过声音推动鸟类识别领域的研究和创新。

在这个竞赛中,参赛者将面临一个挑战,需要开发可以准确识别音频录音中的鸟类的算法。数据集包括来自世界各地的超过 100 万个音频录音,总时长超过 1000 小时。每个录音都用相应的鸟类进行了标记,参赛者的任务是开发一个机器学习模型,可以准确地对新的、未知的录音进行物种分类。

BirdCLEF 2023 竞赛为研究人员和数据科学家提供了一个独特的机会,推动生物声学领域的发展,为世界各地的鸟类种群保护做出贡献。无论您是一位经验丰富的机器学习从业者还是刚刚起步的人,这个比赛都将为您带来具有挑战性和丰厚回报的机会。

📊EDA 📊

💡 观察训练元数据:

在训练元数据中,总共有 12 列和 16941 行。 训练数据包含 16941 个值,其中 454(0.2%)为缺失值。 总共有 12 列:3 数字,9 分类 训练元数据中有 454 个缺失值。

1.1 训练元数据信息

💡💡 训练数据集的进一步观察

纬度和经度有 227(1.34%)个缺失值 经度填充和评级略有偏差 主要标签,次要标签,类型,科学名称,通用名称,作者,文件名具有高偏心性

1.2 交互式地图图

1.2.1 散点图

1.2.2 Map Box(开放街景图)

1.2.3 Map Box(地形视图)

1.3 EBird 分类法

音频勘探

音频文件: 音频文件是一种数字文件格式,用于存储录制的声音或音乐。它可以通过扬声器或耳机播放,并常用于各种应用,如音乐、电影、电视、广播等多种媒体形式。音频文件有很多不同的格式,如 MP3、WAV、OGG、AAC 和 FLAC。

如何可视化音频文件??

我们可以用许多不同的方式在二维空间中查看音频,如:

波形:

在音频处理中,波形是声音信号的图形表示,显示信号随着时间的变化。它是一个绘制了声波振幅在 y 轴和时间在 x 轴的图表。波形可用于可视化和分析音频信号的属性,如频率、振幅、相位和持续时间。

频谱图(Spectograms):

频谱图是音频记录如何随时间变化的光谱频率的可视化表示。它是一种分析声音信号的方法,了解信号如何随时间变化,以及在任何给定时间点信号中有哪些频率。频谱图的 x 轴表示时间,y 轴表示频率。频谱图中每个点的颜色强度或亮度表示该时刻频率的振幅或能量。

Mel 频谱图:

Mel 频谱图是一种使用 Mel 刻度确定频率分箱间距的频谱图。Mel 刻度是一个感知音高间隔相等的音高刻度。通过使用 Mel 刻度,频率分箱在较低频率时距离较近,在较高频率时距离较远,这更符合人类对声音的感知方式。

色度图(Chromagram):

色度图是音频信号的音高内容的可视化表示,其中每列对应一个特定的频段或音高类。它是声音中能量分布的二维表示,绘制为时间和音高类的函数。色度图是通过将音频信号的短时傅里叶变换(STFT)计算并将结果的频谱图投影到音高类基础上来计算的,通常使用 12 个对数间隔的滤波器来表示西方音乐刻度的 12 个音高类。

MFCC:

MFCC 是 Mel 频率倒谱系数的简称,是语音处理、音乐信息检索等相关领域常用的一种特征提取技术。从音频信号的短时傅里叶变换(STFT)中提取 MFCC,它涉及将信号分解为小的、重叠的段,对每个段执行傅里叶变换,以获得其频谱。然后将 Mel 刻度应用到频谱上,将其转化为近似人类听觉系统对声音感知的对数刻度。

2.1 音频探索

2.1.1 白头文鸟(Black-and-white Mannikin)

主要标签:bawman1

科学名称:Spermestes bicolor

2.1.2 非洲黑头黄鹂(African Black-headed Oriole)

主要标签 : abhori1

科学名称 : Oriolus larvatus

鸟声音频

2.1.3 非洲赤眼鸫(African Bare-eyed Thrush)

主要标签 : abethr1

科学名称 : Turdus tephronotus

音频

2.1.4 非洲灰飞鹟(African Gray Flycatcher)

主要标签 : afgfly1

科学名称 : Bradornis microrhynchus

音频

2.1.5 非洲鹰(African Goshawk)

主要标签 : afrgos1

科学名称 : Accipiter tachiro

音频


                                                    END

邀你一起参加 Kaggle竞赛

更多竞赛相关的辅导和咨询,请关注 Kaggle炼丹鹅 17366617181

分类:

人工智能

标签:

数据挖掘

作者介绍

G
GP
V1