小米声音识别算法再创高峰 国际性能排名第一
9月13日消息,近日,小米公司的声音识别算法取得了令人瞩目的突破,成为全球性能最出色的模型之一。这一成就是在Google发布的音频标记任务中取得的,该任务被认为是音频领域的ImageNet,具有极高的影响力和权威性。 Google将AudioSet数据集划分为三个子集,前两个子集合并成了"AudioSet-2M"。在这个庞大的训练集中,小米的声音识别算法首次突破了50 mAP(平均精度),刷新了音频标记技术的指标,位居国际性能排名第一。值得一提的是,小米还发布了一个Mini版本的模型,适用于资源有限的场景,虽然参数量仅为原模型的九分之一,但性能却优于其他所有机构的模型。
这一技术突破意味着小米的声音识别算法能力得到了显著提升,将有望在小米的智能硬件设备中得到广泛应用。这将使这些设备更加敏锐地捕捉和识别周围环境的声音,从而提高硬件的智能化水平,为用户创造更便捷的智能生活体验。 据本站了解,小米的声音识别算法不仅可以应用于智能手机,还广泛用于智能家居设备。例如,小米手机上的“小米闻声”功能可以监测各种环境声音,如火警、婴儿哭声和水壶声,并通过手机通知栏将其转化为文字推送,使听力受损的用户也能享受便捷的智能生活。此外,小米的智能家居设备,如摄像头和音箱,也都采用了声音识别技术,用于监测宝宝哭声、火警等重要的家居环境声音,提供更安全和智能的居家体验。
小米还将这一声音识别技术应用于机器人的研发中,大幅提升了机器人的感知能力。小米的人形机器人CyberOne和仿生四足机器人CyberDog 2都能识别多种环境声音,使其具备更强大的动态响应能力。 小米作为一个拥有强大AIoT平台生态的公司,为声音识别算法的应用提供了广阔的空间,这也是小米技术研发的优势之一。目前,小米的声学语音技术已经应用于超过5000款智能产品,包括手机、音箱、电视、耳机、手表和机器人等79个品类。而小米旗下的智能语音助手小爱同学的月活跃用户数量也已达到1.15亿,是世界上最活跃的语音助手之一。 总的来说,小米的声音识别算法的突破不仅将提升智能硬件的性能,还为行业的前沿研究提供了重要的技术价值,推动了音频领域的发展。小米在底层技术的深耕和科技创新方面表现出了强大的实力,将继续在全球科技领域发挥重要作用。 |