通博TBET
全部
All
当前位置: 首页 > 新闻资讯 > 谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧
相关新闻
  • LOGO的设计流程和要点有哪些?

    2026-05-27 18:09

    相对来说,LOGO对于企业网站建设来说是非常重要的,如果做得好会给用户留下良好深刻的印象,更容易使公众认识及记忆。那么企业LOGO设计流程和要点有哪些呢?北京网站建设设计通博TBET小编为大家

  • 互联网企业“创新”究竟有多难?

    2026-05-20 07:42

    创新早已是全球商业的点金石,是成功人士口中频率出现颇高的关键词。我们崇拜创新神话,我们在崇拜创新神话的同时,渴望破解创新密码。在全球亿万创业大军中,在商界的运筹帷幄中,甚至在投资人挑剔毒辣的

  • 细说网站设计中的那些事

    2026-05-15 16:57

    网站建设设计的成功,能让网站和用户之间产生互动,是提供娱乐和信息的重要部分。一个好的网站建设应该展示他们的所有作品案例,来自满意客户的推荐,以及一些定价套餐等。更好的是,这些公司还有专门的工

  • 网站开发的设计需要创新还是更专业的内容才能更吸引用户

    2026-05-06 16:49

    对于网站开发中设计的部分,一直是从业人员和企业在网站中最为关注的一项重要环节,人们需要了解界面与装饰物间的区别。让元素运动起来。是简单微妙的交互方式,给与用户他们最需要的反馈内容。网站开发的

  • “工业互联网”大数据的“前车之鉴”

    2026-05-05 10:39

    央广网5月18日随着制造业互联网金融发展的纵深推进,网络化、制造数字化、智能化转型的步伐逐渐加快。而APP应用也正在从消费领域向工业领域加速渗透。今天通博TBET北京网站开发团队小编告诉你工业

谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧

返回列表
发布时间:2026-05-23 15:20
北京时间4月16日早间消息,谷歌研究人员开发了一种深度学习系统,可以帮助电脑在嘈杂环境中更好地识别和区分一个人的声音。
集团网站建设案例

本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。