OpenAI的音频雄心挑战硅谷的屏幕霸权

OpenAI 正大力进军音频人工智能领域,其目标远不止于提升 ChatGPT 的语音质量。据《The Information》最近的一份报道披露,在过去两个月里,该公司已整合了多个工程、产品和研究团队,以全面升级其音频模型。此举旨在为一款预计在一年左右后推出的“音频优先”个人设备做准备。
这一战略转变反映了科技行业的整体趋势——即迈向一个屏幕退居幕后、音频成为主要交互界面的未来。智能音箱已使语音助手进入超过三分之一的美国家庭。 Meta近期为其雷朋智能眼镜推出了一项新功能,利用五麦克风阵列帮助用户在嘈杂环境中听清对话,从而将佩戴者的面部转化为定向聆听设备。与此同时,谷歌于6月开始测试“音频概览”功能,将搜索结果转化为语音摘要;特斯拉则正在将xAI的Grok聊天机器人集成到其车辆中,打造一款能够通过自然语音管理从导航到气候控制等各项功能的对话式助手。
下注于此的不仅是行业巨头。众多初创企业也怀揣着同样的核心信念涌现,尽管成果参差不齐。Humane AI Pin的开发者曾投入数亿美元,但这款无屏幕可穿戴设备最终却成了广为引用的警示案例。 Friend AI项链号称能记录生活并提供陪伴,却引发了严重的隐私担忧和存在主义焦虑。如今,包括Sandbar以及由Pebble创始人埃里克·米吉科夫斯基(Eric Migicovsky)领导的一家公司在内的至少两家企业,正在开发计划于2026年推出的AI戒指,届时用户将能真正实现“对自己的手说话”。
尽管设计各异,但其核心理念始终如一:音频将是未来的交互界面。每一个环境——你的家、你的车,甚至你自身——都在被转化为一个控制界面。
据报道,OpenAI预计于2026年初推出的新款语音模型将具备更自然的语音效果,能像真实的对话伙伴一样应对插话,甚至能在用户说话时同步回应——这是当前模型所不具备的能力。据悉,该公司还计划推出一系列设备,可能包括智能眼镜或无屏幕扬声器,旨在让这些设备更像伴侣而非单纯的工具。
这一发展并非完全出人意料。正如《The Information》所指出的,前苹果设计主管乔尼·艾维(Jony Ive)——他在OpenAI于5月以65亿美元收购其公司io后加入了OpenAI的硬件项目——一直致力于降低对设备的依赖。他将“音频优先”的设计视为弥补以往消费电子产品缺陷的契机。
相关文章
StrictlyVC旧金山站将汇聚TDK Ventures、Replit等企业的领军人物
今年首场StrictlyVC活动即将登陆旧金山,时间比你想象的要早。 4月30日,我们在菲律宾文化中心(Sentro Filipino Cultural Center)举办的聚会门票仍在热售中,届时将有阵容强大的演讲嘉宾阵容。除了StrictlyVC一贯以人脉拓展和社区互动著称外,本次旧金山活动对于寻求最新融资洞见的AI创新者和创始人而言,将具有特别重要的价值。谁将登台门票现已开售,但如果您此前未
Notion 将其工作区转变为人工智能代理的枢纽
生产力软件公司 Notion 正迈入智能代理时代。在周三的一场直播产品发布会上,以协作式笔记应用而闻名的 Notion 推出了一款全新的开发者平台。该平台不仅扩展了其定制 AI 代理的功能,还能与外部代理连接,并允许团队构建能够从任何数据库提取数据的自动化多步骤工作流。通过构建一个编排层——即一个能在多个工具和数据源之间协调AI工作的系统——Notion将自身定位为不仅仅是一款具备AI功能的笔记应
能否请您提供需要改写的文章标题?
过去,想要拍一张专业的头像照,意味着要聘请摄影师、租用摄影棚,并至少腾出一个小时的时间。如今,越来越多的AI驱动平台承诺,您可以省去所有这些步骤,依然能获得一张精致且可直接发布的照片。有些平台确实兑现了这一承诺,但更多则不然。一张物有所值的AI人像照与一场金钱浪费之间的区别,通常归结于一个问题:最终成像真的像你吗?分辨率、背景和处理速度固然重要,但如果屏幕上凝视着你的那个人只是个与你肤色相近的陌生
相关专题推荐
评论 (0)
0/500

OpenAI 正大力进军音频人工智能领域,其目标远不止于提升 ChatGPT 的语音质量。据《The Information》最近的一份报道披露,在过去两个月里,该公司已整合了多个工程、产品和研究团队,以全面升级其音频模型。此举旨在为一款预计在一年左右后推出的“音频优先”个人设备做准备。
这一战略转变反映了科技行业的整体趋势——即迈向一个屏幕退居幕后、音频成为主要交互界面的未来。智能音箱已使语音助手进入超过三分之一的美国家庭。 Meta近期为其雷朋智能眼镜推出了一项新功能,利用五麦克风阵列帮助用户在嘈杂环境中听清对话,从而将佩戴者的面部转化为定向聆听设备。与此同时,谷歌于6月开始测试“音频概览”功能,将搜索结果转化为语音摘要;特斯拉则正在将xAI的Grok聊天机器人集成到其车辆中,打造一款能够通过自然语音管理从导航到气候控制等各项功能的对话式助手。
下注于此的不仅是行业巨头。众多初创企业也怀揣着同样的核心信念涌现,尽管成果参差不齐。Humane AI Pin的开发者曾投入数亿美元,但这款无屏幕可穿戴设备最终却成了广为引用的警示案例。 Friend AI项链号称能记录生活并提供陪伴,却引发了严重的隐私担忧和存在主义焦虑。如今,包括Sandbar以及由Pebble创始人埃里克·米吉科夫斯基(Eric Migicovsky)领导的一家公司在内的至少两家企业,正在开发计划于2026年推出的AI戒指,届时用户将能真正实现“对自己的手说话”。
尽管设计各异,但其核心理念始终如一:音频将是未来的交互界面。每一个环境——你的家、你的车,甚至你自身——都在被转化为一个控制界面。
据报道,OpenAI预计于2026年初推出的新款语音模型将具备更自然的语音效果,能像真实的对话伙伴一样应对插话,甚至能在用户说话时同步回应——这是当前模型所不具备的能力。据悉,该公司还计划推出一系列设备,可能包括智能眼镜或无屏幕扬声器,旨在让这些设备更像伴侣而非单纯的工具。
这一发展并非完全出人意料。正如《The Information》所指出的,前苹果设计主管乔尼·艾维(Jony Ive)——他在OpenAI于5月以65亿美元收购其公司io后加入了OpenAI的硬件项目——一直致力于降低对设备的依赖。他将“音频优先”的设计视为弥补以往消费电子产品缺陷的契机。
StrictlyVC旧金山站将汇聚TDK Ventures、Replit等企业的领军人物
今年首场StrictlyVC活动即将登陆旧金山,时间比你想象的要早。 4月30日,我们在菲律宾文化中心(Sentro Filipino Cultural Center)举办的聚会门票仍在热售中,届时将有阵容强大的演讲嘉宾阵容。除了StrictlyVC一贯以人脉拓展和社区互动著称外,本次旧金山活动对于寻求最新融资洞见的AI创新者和创始人而言,将具有特别重要的价值。谁将登台门票现已开售,但如果您此前未
Notion 将其工作区转变为人工智能代理的枢纽
生产力软件公司 Notion 正迈入智能代理时代。在周三的一场直播产品发布会上,以协作式笔记应用而闻名的 Notion 推出了一款全新的开发者平台。该平台不仅扩展了其定制 AI 代理的功能,还能与外部代理连接,并允许团队构建能够从任何数据库提取数据的自动化多步骤工作流。通过构建一个编排层——即一个能在多个工具和数据源之间协调AI工作的系统——Notion将自身定位为不仅仅是一款具备AI功能的笔记应
能否请您提供需要改写的文章标题?
过去,想要拍一张专业的头像照,意味着要聘请摄影师、租用摄影棚,并至少腾出一个小时的时间。如今,越来越多的AI驱动平台承诺,您可以省去所有这些步骤,依然能获得一张精致且可直接发布的照片。有些平台确实兑现了这一承诺,但更多则不然。一张物有所值的AI人像照与一场金钱浪费之间的区别,通常归结于一个问题:最终成像真的像你吗?分辨率、背景和处理速度固然重要,但如果屏幕上凝视着你的那个人只是个与你肤色相近的陌生





首页






