再登第一!天玑8300连续两个月成性能榜霸主,神U实力同档无敌!
根据最新一期的安兔兔性能榜单,OPPO Find X7通过搭载天玑9300芯片的出色表现,在旗舰手机性能榜上傲视群雄,荣登榜首。与此同时,所有搭载天玑9300芯片的终端机型也均在该榜单中占据了一席之地。这一结果再次印证了天玑9300“旗舰芯皇”的称号并非空穴来风。在次旗舰手

更新日期:2023-02-20
来源:系统之家
近日,网易云音乐2篇论文《TG-Critic: A Timbre-Guided Model for Reference-Independent Singing evaluation》《TrOMR:Transformer-based Polyphonic Optical Music Recognition》入选ICASSP2023,论文提出的两种算法模型均优于现有最先进模型。
一种是歌唱评价算法模型TG-Critic,利用它可以仅依靠一段演唱音频判断歌手演唱水平,实验结果表明,算法模型评估的歌曲与人工专家评价“演唱水平好”的歌曲,相似度达91%;另一种是识别图像乐谱的算法模型,通过模型识别图片中的五线谱,实验结果在复音乐谱上的错误率最高也仅为2.1%。
据了解,ICASSP(International Conference on Acoustics, Speech and Signal Processing)即国际声学、语音与信号处理会议,是IEEE主办的全世界最大的,也是最全面的信号处理及其应用方面的顶级会议,在国际上享有盛誉并具有广泛的学术影响力。此次入选,代表了网易云音乐在国际舞台上,展示出了在音乐音频领域的技术实力。
而且凭借在音乐技术领域的积累创新,网易云音乐也不断将前沿领域研究成果应用于实践。依靠目前准确率最高的歌曲质量评价算法,歌唱评价将不再依赖人力手工准备模板物料,歌手也不再需要模仿模板以获取高分,更鼓励歌手的个性化演绎。而且相比卡拉ok中的传统歌唱评价,该模型未来将用于更加丰富的使用场景,如歌曲分发、优质歌手挖掘、声音社交等等领域。而利用识别图像乐谱的算法模型,可以将模糊的图片乐谱准确识别,方便转换为利用率更高的格式,服务于音乐人、用户在欣赏、教育、创作等场景的需要。
三大技术创新拆解“开口跪”,将全球最优算法准确率至少提升4%
当歌唱老师和专家听到一首歌,就能迅速可以判断出歌手的演唱水平,而普通人则会用“开口跪”表达夸赞。当人们评价歌声质量时,人声的音色是影响判断的重要因素。受其启发,网易云音乐首创提出了一个音色为指导的歌唱评价模型:TG-Critic,将全球最优算法准确率提升4%以上。
据介绍,网易云音乐音频实验室在歌唱评价模型的设计过程中引入了三个主要创新点:
1.首次在模型中显式引入音色信息辅助歌声评价:研究表明,歌手的"音色"是影响人们对于歌声感受的重要因素。但不同于音准、节奏等较为简单的属性,音色是一系列复杂而抽象的感受的集合,因此其提取过程更为复杂,更难被模型直接捕捉到。至今为止的歌声自动评价系统中,还没有研究聚焦音色特征对于模型预测的影响。 为了填补这一空缺,团队创新性地使用原本为“歌手识别”任务设计的预训练模型,提取与音色相关的高级特征,并将其用作歌声评价模型的输入。尽管这些特征原本并非为歌声质量设计,但是来自质量标签为“好”和“差”的样本的特征,在高维空间中分别呈现出较明显的聚集现象,证明了其与歌声质量的相关性。
2.迁移高分辨率网络结构处理声谱特征:除了音色特征输入,团队从音频样本中提取CQT声谱特征作为模型的主要输入。为了解决卷积网络局部性带来的问题,团队将图像分割领域较为常用的“高分辨率网络”迁移到歌声评价任务中,分别通过高、中、低三个不同的分辨率分支分别处理特征。通过高分辨率特征捕捉局部信息(如演唱技巧、小瑕疵等)、低分辨率特征捕捉长距离信息(气息稳定性、音准等),从而实现保持高效性的同时,提升模型提取有用信息的能力。
3.提出循环自动数据标注降低人工成本: 对于一个模型的训练,可靠的标注数据尤为重要。团队收集了3万余条歌声数据样本,以及其对应的机器打分(针对音准、节奏等)、红心数、评论数等可以一定程度反映歌声质量的元数据。通过一个循环迭代过程,只需要人工标注其中小部分样本,便能获得足够可靠的自动数据标签,大大降低了标注所需的人工成本。
实验结果表明,在各类公开数据集上,网易云音乐提出的TG-Critic均达到国际最先进水平,相比已有算法,准确率提升至少4%,部分数据集提升10%以上。而且应用于网易云音乐业务测听的结果显示:在音乐人业务:运营评估歌曲推荐值≥3共159首歌曲中,算法评价为“演唱水平好”共144首,准确率达90.5%;在直播业务:运营提供100首算法判定“演唱水平好”歌曲的人工验证,准确率91%;在500+全演唱水平分类实验中,准确率81.2%。
据了解,TG-Critic歌曲质量评价模型将进一步减少人力依赖并扩大应用场景在直播、音乐人等内容分发场景,可协助人工挑选优质内容,可服务于作品审核、分发或推荐,优质歌手挖掘在社交、游戏等C端场景,可提供“开口跪挑战”等运营玩法。
懂AI又懂乐理,看图识谱技术上的又一次突破
随着深度学习方法的应用,OCR(图像文字识别 )近年得到了长足的进步,而OMR(图像乐谱识别)却始终处于研究应用的初级阶段。由于这个方向属于交叉学科,既要懂视觉算法又要懂乐理。目前市面上的商业或开源软件都不具备可用的准确率。
因此,网易云音乐音视频实验室采用基于端到端的算法识别路线,优化识别流程:1)拿到一个乐谱图片,检测图片中的曲谱位置坐标;2)提取曲谱区域,进行曲谱识别,识别出乐谱中的内容信息,如下图:
针对该乐谱识别模型,网易云音乐音频实验室也做了多方面的创新,大大提高了准确性。例如,将Transformer引入到乐谱识别任务中,通过该结构可以实现更大的感受野,有利于对长序列进行预测,提升识别准确率;同时,将乐谱的信息维度将乐谱符号分为:乐谱符号全局表征+乐谱符号局部表征+音符音高。这样的拆分方式更利于机器理解和学习。
值得注意的是,团队还精心设计了一套乐谱图片拍摄的方案。为了收集大量真实的数据,使用手机作为拍照工具,模仿最真实的拍照场景,对明、暗光场景的纸质乐谱进行拍照,以及对显示在显示屏上的乐谱进行拍照。
实验结果表示,网易云音乐的乐谱识别算法的准确性已经超过目前最好的端到端音乐谱识别方法,大幅降低错误率。下图中第一行为正确的乐谱识别结果,第二行为目前最好的复音乐谱识别方法的识别结果,第三行为本技术提出方案的识别结果,红框标记的为错误区域。
据介绍,该方法可以准确地将图片乐谱转换为midi、musicxml等格式,未来可用于音乐辅助教育、听歌搜谱等场景中,致力于在音乐欣赏、教育、创作等场景上,为音乐人、用户提供更好的服务。
再登第一!天玑8300连续两个月成性能榜霸主,神U实力同档无敌!
根据最新一期的安兔兔性能榜单,OPPO Find X7通过搭载天玑9300芯片的出色表现,在旗舰手机性能榜上傲视群雄,荣登榜首。与此同时,所有搭载天玑9300芯片的终端机型也均在该榜单中占据了一席之地。这一结果再次印证了天玑9300“旗舰芯皇”的称号并非空穴来风。在次旗舰手
存储产业链迎来复苏,中国存储企业江波龙联合元成苏州打通全线业务
在 5G、云计算以及 AI 等新兴产业快速发展背景下,半导体存储芯片具备广阔的市场空间。而存储芯片的核心集成电路包括芯片设计、制造、封装和测试几个环节,随着半导体技术日益成熟,各个环节目前已分别发展成独立成熟的子行业。存储企业竞争激烈,江波龙脱颖而出如果将
三星Galaxy Z Flip5:以颠覆性的技术革新和用户体验赢得青睐
在不久前过去的2023年中,折叠屏机型依然延续了近几年的强劲增长势头,成为了智能手机市场逐渐回暖的一股重要力量。纵观去年各大厂商推出的折叠屏新品,设计的成熟度和功能的全面性都在不断提升。特别是身为折叠屏开创者和引领者的三星,推出的第五代折叠屏产品再次彰显
新年应该怎么玩?来中国移动,解锁专属新年大礼!
新年的钟声即将敲响,这个黄金假期怎么过?是与家人来一场说走就走的新春旅行,奔赴山川湖海、日月星辰的浪漫;还是与亲友聚会,在烟火星辰下共享团圆家宴。而无论你选择哪种方式庆祝春节,最重要的是与家人在一起度过最美好的时刻。今年,不妨让我们打破常规,一起探索新
英语听说必备三大核心力,阿尔法蛋AI听说宝D1一站配齐!
谈起英语听说练习,很多家长都十分头疼,比起读和写,能完全听懂英语,并且能说一口流畅的口语显得更为难得。家长也认为,孩子掌握了听说能力,才是真正学会了英语。今天就看看英语听说必备的三大核心力,用阿尔法蛋AI听说宝D1可以一次性掌握,能达到这个程度,那英语学习提升就
学生党福利来袭 三星Galaxy手机寒假好价 乐购盛惠
伴随着各大高校的放假通知,忙碌了一年的莘莘学子也迎来了属于自己的悠闲长假。在这个漫长的假期里,除了学习时间外,不论是享受个人独处时光,还是拜年走亲访友都离不开一部性能强劲的手机陪伴在左右。时下,三星商城开启了“寒假好价 乐购盛惠”活动,只需完成学生身
RTX 40 SUPER系显卡神搭好物盘点,华硕电源霸榜来袭!
近日,随着RTX 4080 SUPER显卡的正式登场开售,全新一代RTX 40 SUPER显卡阵容也完整展现在了玩家面前。强劲性能表现无疑是游戏玩家们的至高追求,而适配的高品质电源,则是畅爽电竞的前提条件。对此,来自华硕的数款高品质电源装备,显然是DIY的必备之选。ROG雷鹰AURA 1
新年新气象 三星Galaxy S24龙年赠礼更有“AI”
农历龙年的脚步越来越近,年节赠礼,贵在圆满,如果能够表达出一份特别的新意,更是锦上添花。全新发布的三星Galaxy S24拥有时尚精致的外形和性能出众的硬件配置,无论是赠予亲友还是犒赏自己,都是一款令人惊喜满满的新年礼物。加上由Galaxy AI带来的一系列创新应用,
2024年FFALCON雷鸟新品发布会:ACE计划·新征程
2024年伊始,科技圈热闹非凡。华为、小米等大厂纷纷召开新品发布会,展示自家最新科技成果,打响了开年第一枪。然而,在这股“高大上”的发布会潮流中,FFALCON雷鸟却选择了一条不同寻常的路,没有炫目的灯光,没有豪华的排场,就在直播间里以「ACE计划·新征程」为主题
2024春晚直播怎么看?当贝D5X看春晚直播超方便
在这辞旧迎新的时刻,我们除了与家人团聚,还能感受到浓厚的年味,其中最让人期待的莫过于观看春晚了。2024年央视春晚的主持人和节目单暂时还未官宣。不过路透已经有众多明星齐聚一堂了,让人们对春晚的期待值达到了顶峰。那么,如何观看2024年央视春晚直播?还有各家地
Wi-Fi Alliance总裁兼首席执行官Kevin Robinson:Wi-Fi 7有望迅速普及,超越前代技术
C114讯 1月31日消息(刘定洲)2024年1月8日,美国消费电子展(CES 2024)前夕,备受业界瞩目的Wi-Fi CERTIFIED 7(Wi-Fi 7认证计划)正式推出。这意味着Wi-Fi 7设备正式进入认证和上市销售阶段。博通、康普、英特尔、联发科等全球网络大厂均表达了对Wi-Fi CERTIFIED 7的强烈支
强势进化掌控未来,华硕天选X 2024预售开启!
作为华硕旗下知名电竞产品,无论是笔记本还是台式机,华硕天选系列一直以来都广受许多玩家关注。为迎合广大用户畅爽舒适的游戏体验需求,新一代华硕天选 X 2024高性能电竞台机已于2024年1月29日在京东开启预售。此次升级的华硕天选X2024电竞台式机,为玩家提供两种规格
随享春节假期,三星The Freestyle见证新年欢聚时刻
春节近,年味浓。新春佳节欢庆时刻,全家齐聚一堂,一台高品质投影仪或可用璀璨光影点亮温馨年味。The Freestyle三星随享智能投影仪自上市以来,就颇受年轻消费者的喜爱与信赖,其便携灵巧的外形设计、颇具沉浸感的影音效果与丰富的服务生态,让用户随时随地尽享大屏多
实至名归!追觅科技斩获2023年全球领航者大会“全球年度企业”
近日,在“潮起·奔流——2023全球领航者大会”上,智能清洁电器领导品牌追觅科技凭借卓越的技术实力、产品创新能力和出海竞争力斩获“全球年度企业”大奖,可谓实至名归。据介绍,此次全球领航者年度企业的评选,综合考虑商业模式领先度、技术创新力、市场占有率、行业
过年PS5玩个尽兴!细数适合团圆的“年味儿”游戏
春节临近,大街小巷都弥漫着浓浓的年味,超市里循环的拜年歌时时刻刻提醒着大伙儿,马上就是春节了。想必各位朋友和我想的一样,这兔年的班咱就上到这儿了,我现在一心只想回家过年!说到回家过年,大家脑海里浮现的无非就是走亲访友、聚会唱K,年年都一样。今年就不一样