Дом
Амбициозные планы OpenAI в области аудио бросают вызов господству Кремниевой долины в сфере экранных технологий

OpenAI активно развивает направление аудио-ИИ, и речь идет о гораздо большем, чем просто улучшение голоса ChatGPT. Согласно недавнему отчету издания The Information, за последние два месяца компания объединила несколько инженерных, продуктовых и исследовательских команд для модернизации своих аудиомоделей. Эти усилия направлены на подготовку к выпуску персонального устройства с приоритетом на аудио, запуск которого ожидается примерно через год.
Этот стратегический сдвиг отражает общее направление развития технологической индустрии — движение к будущему, в котором экраны уходят на второй план, а аудио становится основным интерфейсом. Благодаря умным колонкам голосовые помощники уже появились в более чем трети американских домохозяйств. Meta недавно представила функцию для своих умных очков Ray-Ban, которая использует массив из пяти микрофонов, чтобы помочь пользователям слышать разговоры в шумной обстановке, фактически превращая лицо пользователя в устройство направленного прослушивания. Между тем, в июне Google начала тестировать «Audio Overviews», преобразуя результаты поиска в устные резюме, а Tesla интегрирует чат-бота Grok от xAI в свои автомобили, чтобы создать диалогового помощника, который управляет всем — от навигации до климат-контроля — с помощью естественной речи.
Не только гиганты индустрии делают эту ставку. Появилось множество стартапов с тем же основным убеждением, хотя и с неоднозначными результатами. Создатели Humane AI Pin потратили сотни миллионов, прежде чем их носимое устройство без экрана стало широко цитируемым предостерегающим примером. Кулон Friend AI, обещающий записывать вашу жизнь и служить компаньоном, вызвал серьезные опасения по поводу конфиденциальности и экзистенциальный дискомфорт. Сейчас как минимум две компании, включая Sandbar и компанию под руководством основателя Pebble Эрика Мигиковского, разрабатывают кольца с ИИ, запуск которых запланирован на 2026 год, позволяющие пользователям буквально разговаривать со своей рукой.
Хотя дизайн устройств различается, основной принцип остается неизменным: звук — это интерфейс будущего. Любая среда — ваш дом, ваша машина и даже вы сами — превращается в панель управления.
Сообщается, что новая аудиомодель OpenAI, ожидаемая в начале 2026 года, будет отличаться более естественным звучанием речи, уметь реагировать на перебивания, как настоящий собеседник, и даже говорить, пока говорит пользователь — способность, которой лишены нынешние модели. Говорят также, что компания планирует выпустить набор устройств, в который, возможно, войдут очки или динамики без экрана, призванные служить скорее компаньонами, чем простыми инструментами.
Это развитие событий не является полностью неожиданным. Как отмечает The Information, бывший руководитель отдела дизайна Apple Джони Айв, присоединившийся к инициативе OpenAI по разработке аппаратного обеспечения после приобретения его компании io за 6,5 миллиарда долларов в мае, уделяет приоритетное внимание снижению зависимости от устройств. Он рассматривает дизайн, ориентированный на аудио, как возможность исправить недостатки предыдущей бытовой электроники.
Связанная статья
Claude использовался для создания вредоносных пакетов npm: более 670 скомпрометированных пакетов ставят под угрозу открытый исходный код
Недавний инцидент в сфере кибербезопасности продемонстрировал, как крупные языковые модели (LLM) используются в качестве инструмента для разработки вредоносного ПО. Исследователь в области безопасност
Компания Reliance обнародовала план инвестиций в искусственный интеллект на сумму 110 млрд долларов на фоне ускорения технологического развития в Индии
Мукеш Амбани, миллиардер и председатель правления индийского конгломерата Reliance, объявил в четверг о плане стоимостью 10 трлн рупий (около 110 млрд долларов) по созданию инфраструктуры для искусств
Компания Zhiyuan WITA завершила проект «Naked» по взаимодействию с роботами, подав первую отчетную документацию
Сектор интеллектуальных роботов достиг важной вехи. Согласно последнему заявлению Управления киберпространства Шанхая, разработанная компанией Zhiyuan большая модель WITA успешно прошла процедуру реги
Рекомендации по связанным специальным темам
Комментарии (0)

OpenAI активно развивает направление аудио-ИИ, и речь идет о гораздо большем, чем просто улучшение голоса ChatGPT. Согласно недавнему отчету издания The Information, за последние два месяца компания объединила несколько инженерных, продуктовых и исследовательских команд для модернизации своих аудиомоделей. Эти усилия направлены на подготовку к выпуску персонального устройства с приоритетом на аудио, запуск которого ожидается примерно через год.
Этот стратегический сдвиг отражает общее направление развития технологической индустрии — движение к будущему, в котором экраны уходят на второй план, а аудио становится основным интерфейсом. Благодаря умным колонкам голосовые помощники уже появились в более чем трети американских домохозяйств. Meta недавно представила функцию для своих умных очков Ray-Ban, которая использует массив из пяти микрофонов, чтобы помочь пользователям слышать разговоры в шумной обстановке, фактически превращая лицо пользователя в устройство направленного прослушивания. Между тем, в июне Google начала тестировать «Audio Overviews», преобразуя результаты поиска в устные резюме, а Tesla интегрирует чат-бота Grok от xAI в свои автомобили, чтобы создать диалогового помощника, который управляет всем — от навигации до климат-контроля — с помощью естественной речи.
Не только гиганты индустрии делают эту ставку. Появилось множество стартапов с тем же основным убеждением, хотя и с неоднозначными результатами. Создатели Humane AI Pin потратили сотни миллионов, прежде чем их носимое устройство без экрана стало широко цитируемым предостерегающим примером. Кулон Friend AI, обещающий записывать вашу жизнь и служить компаньоном, вызвал серьезные опасения по поводу конфиденциальности и экзистенциальный дискомфорт. Сейчас как минимум две компании, включая Sandbar и компанию под руководством основателя Pebble Эрика Мигиковского, разрабатывают кольца с ИИ, запуск которых запланирован на 2026 год, позволяющие пользователям буквально разговаривать со своей рукой.
Хотя дизайн устройств различается, основной принцип остается неизменным: звук — это интерфейс будущего. Любая среда — ваш дом, ваша машина и даже вы сами — превращается в панель управления.
Сообщается, что новая аудиомодель OpenAI, ожидаемая в начале 2026 года, будет отличаться более естественным звучанием речи, уметь реагировать на перебивания, как настоящий собеседник, и даже говорить, пока говорит пользователь — способность, которой лишены нынешние модели. Говорят также, что компания планирует выпустить набор устройств, в который, возможно, войдут очки или динамики без экрана, призванные служить скорее компаньонами, чем простыми инструментами.
Это развитие событий не является полностью неожиданным. Как отмечает The Information, бывший руководитель отдела дизайна Apple Джони Айв, присоединившийся к инициативе OpenAI по разработке аппаратного обеспечения после приобретения его компании io за 6,5 миллиарда долларов в мае, уделяет приоритетное внимание снижению зависимости от устройств. Он рассматривает дизайн, ориентированный на аудио, как возможность исправить недостатки предыдущей бытовой электроники.
Claude использовался для создания вредоносных пакетов npm: более 670 скомпрометированных пакетов ставят под угрозу открытый исходный код
Недавний инцидент в сфере кибербезопасности продемонстрировал, как крупные языковые модели (LLM) используются в качестве инструмента для разработки вредоносного ПО. Исследователь в области безопасност
Компания Reliance обнародовала план инвестиций в искусственный интеллект на сумму 110 млрд долларов на фоне ускорения технологического развития в Индии
Мукеш Амбани, миллиардер и председатель правления индийского конгломерата Reliance, объявил в четверг о плане стоимостью 10 трлн рупий (около 110 млрд долларов) по созданию инфраструктуры для искусств
Компания Zhiyuan WITA завершила проект «Naked» по взаимодействию с роботами, подав первую отчетную документацию
Сектор интеллектуальных роботов достиг важной вехи. Согласно последнему заявлению Управления киберпространства Шанхая, разработанная компанией Zhiyuan большая модель WITA успешно прошла процедуру реги











