官方服务微信:dat818 购买与出租对接

qq音乐识别歌曲在哪里,识别歌曲音乐软件,qq识别歌曲的软件下载

3万

主题

2

回帖

9万

积分

管理员

积分
91101
发表于 7 小时前 | 显示全部楼层 |阅读模式
    音乐是自然界自带的一种现象,它所蕴含的信息量具有多层次且十分复杂的特点。随着多媒体技术以及数据存储传输技术的快速发展,互联网上的数字音乐呈现出爆炸性的增长态势。这种爆炸性的增长使得在海量的音乐数据库中去寻找自己想要的音乐片段变得特别困难。我们推出了全新的“哼唱识别”服务,即可以通过哼唱旋律节奏或者哼唱歌词来进行识别。

    重要的话

    音乐推出了最新版本的“哼唱识别”服务,目的是让用户不再受此烦恼的困扰。哼唱识别是音乐识别的一个分支,它给用户提供了一种全新的识别方式。哼唱识别主要由两个部分构成:

    对纯哼唱进行识别,其中包括用哼声来代替歌词,也包括用拟声来代替歌词,甚至还包括用吹口哨的方式唱出某一段旋律。

    2. 对带歌词的哼唱样本进行识别;

    『你寻的音乐在哪里』

    曾经说过:想象你在听一段音乐旋律且深陷其中,你希望再次听到它,或者想给挚爱买他最喜欢的曲调唱片,可你不知道歌名或作者。接着你开始询问朋友,哼唱旋律,然而很遗憾,没人能帮到你,就这样你迷失了。数年过去,那奇妙的旋律突然在脑海中响起,而你始终不知道它的名字。相信这并非仅发生在一个人身上,这是一个极为古老的问题,一直代代相传延续至今。

    『哼旋律的哼唱识别』

    纯哼唱识别是一种基于内容的音乐信息检索系统。它利用 MIDI 提取技术把旋律信息进行表征。接着在数据库中去寻找与表征出的旋律信息相匹配的歌曲。

    哼唱过程中遇到的主要问题与难点有以下:

    1.哼唱的时间过于短;

    2.哼唱的旋律、节奏不一定都准确;

    3.哼唱的途中有卡顿,或掺有杂音。

    对于用户风格各异的哼唱样本,升级后的哼唱识别算法能更好地解决这些问题。音乐拥有庞大曲库,并且有得天独厚的 midi 旋律提取算法,所以能够建立全面的哼唱数据库。对于用户变速、变调、噪音参杂等哼唱样本,会采用降噪以及不同的相似度计算模块,以此来提高算法的鲁棒性。最后,计算相似度得分,返回给用户最佳的匹配结果。

    『哼歌词的哼唱识别』

    至于带歌词的哼唱识别,我们通常会遇到以下问题:

    1. 噪音、多余的背景音;

    2. 音频的不流畅性;

    3. 哼唱完全不着调。

    对此,音乐运用了支持多语言的 ASR 技术,这种技术可以尽可能避免上述问题,并且能够把人类的语音内容转变为相应的文字,接着与库中的歌词片段进行匹配,从而有效地提升了准确率。通常来讲,只要唱出来的词足够精准,即便旋律不一定准确也能够找得到。

    『相关实验测试』

    我们抽取一些随机的用户哼唱样本来进行测试。为了保证测试结果的准确性,对于不同的 app,我们使用相同的测试设备、测试方法以及测试环境,分别对 Top-N(按照返回概率选取头部 N 个结果,这里 N 分别取 1 和 5)的结果进行评测。

    测试环境:安静的会议室。

    测试设备:播放音频设备为 Pro;识别设备为 * 2。

    测试方法是:Pro 播放音频,同时使用两台设备,这两台设备分别打开不同的 app,然后进行等距哼唱识别。

    测试存在有结果和无结果这两种状态。对于测试的结果,会运用多方面的指标来进行评估,这些指标包含:召回率,还有准确率,以及精确率,以及 F1 score

    以下是测试结果的图表:

    Top1结果分析:

    音乐的召回率为 100%,应用 B 的召回率为 96%,应用 A 的召回率为 72%,应用 C 的召回率为 28%,且召回率的大小关系为 音乐(100%)>应用 B(96%)>应用 A(72%)>应用 C(28%)

    音乐的正确率为 47%,应用 A 的正确率为 35%,应用 B 的正确率为 22%,应用 C 的正确率为 8%。

    应用 A 的精确率为 48.61%,音乐的精确率为 47%,应用 B 的精确率为 22.92%,应用 C 的精确率为 28.57%,且 48.61%>47%>22.92%>28.57%

    在对比的结果里,关于 Top1 的情况。音乐的召回率以及正确率都比其他产品要领先很多。并且当 音乐的召回率达到 100%时,它与召回率仅为 72%的应用 A 在精确率方面几乎是一样的。

    Top5结果分析:

    召回率:QQ音乐(100%)>应用B(96%)>应用A(72%)>应用C(28%)

    音乐的正确率为 60%,应用 A 的正确率为 38%,应用 B 的正确率为 26%,应用 C 的正确率为 8%。

    音乐的精确率为 60%,应用 A 的精确率是 52.78%,应用 B 的精确率为 27%,应用 C 的精确率是 28.57%,且 60%>52.78%>27%>28.57%

    在top5的对比结果中,QQ音乐的所有指标都名列第一名。

    对于上述结果,我们运用 F1-Score 来进行评分,F1-Score 也就是精准率与召回率的调和平均数,通过此评分方式得到了下面的图表。

    我们可以看出,音乐的 F1-Score 达到了 0.75 以及 0.639 。F1-Score 的最大值是 1,最小值是 0,数值越大越好。音乐的 F1-Score 相较于第二名分别高出 0.141 分和 0.059 分。音乐与第三、第四名拉开了很大的差距。并且,在召回率为 100%的情况下,音乐的精确率依然处于领先地位。

    『总结』

    实践是检验真理的唯一标准。从上面的实验结果来看,音乐在某些方面表现得非常突出,能够称得上是一骑绝尘。在国际音频检索评测大赛(MIREX)中,该选手夺得过“音频指纹”世界冠军以及“旋律抽取”世界冠军并打破世界纪录。首次参与-to-Audio 比赛后,取到超越团队(2019)和 Queen Mary 团队(2020)的成绩。音乐凭借其实力,认证了其独家自研的“哼唱识别”技术已达到世界领先水平。希望 音乐将来能给我们带来更多惊喜!

    最后尾声

    上文回顾:

更多帖子推荐

您需要登录后才可以回帖 登录 | 立即注册

Archiver|手机版|小黑屋|关于我们

Copyright © 2001-2025, Tencent Cloud.    Powered by Discuz! X3.5    京ICP备20013102号-30

违法和不良信息举报电话:86-13718795856 举报邮箱:hwtx2020@163.com

GMT+8, 2025-4-27 10:48 , Processed in 0.079649 second(s), 17 queries .