A OpenAI revela suas capacidades de inteligência vocal em sua API

A OpenAI anunciou na quinta-feira que sua API agora inclui várias novas funcionalidades de inteligência vocal, projetadas para ajudar desenvolvedores a criar aplicativos capazes de falar, transcrever e traduzir conversas.
O novo modelo GPT-Realtime-2 da empresa é outro modelo vocal, desenvolvido para produzir uma simulação vocal realista que pode participar de conversas com os usuários. No entanto, diferente de seu predecessor (GPT-Realtime-1.5), esta versão incorpora o raciocínio do nível GPT-5, que a OpenAI afirma ter sido desenvolvido para lidar com solicitações mais complexas dos usuários.
A empresa também está lançando o GPT-Realtime-Translate, que, como o nome indica, oferece serviços de tradução em tempo real que acompanham o usuário durante as conversas. Esta funcionalidade suporta mais de 70 idiomas de entrada e 13 idiomas de saída.
Finalmente, a empresa introduziu uma nova capacidade de transcrição chamada GPT-Realtime-Whisper, que fornece funcionalidade de conversão de fala em texto em tempo real, capturando as palavras à medida que as interações ocorrem.
“Juntos, os modelos que estamos lançando levam o áudio em tempo real de interações simples de chamada e resposta para interfaces vocais que realmente podem realizar tarefas: ouvir, raciocinar, traduzir, transcrever e agir à medida que a conversa se desenrola”, afirmou a empresa.
Quem se beneficiará dessas atualizações? As empresas que buscam expandir suas capacidades de atendimento ao cliente são um público óbvio. No entanto, a OpenAI também observa que as novas funcionalidades serão úteis em uma ampla gama de áreas, incluindo educação, mídia, eventos e plataformas para criadores.
Por mais úteis que esses ferramentas sejam do ponto de vista empresarial, também existe o potencial de uso indevido. A empresa afirma ter implementado medidas de segurança para evitar que suas novas funcionalidades sejam usadas para spams, fraudes ou outros tipos de abuso on-line. Trigger específicos foram incorporados no sistema para que “as conversas possam ser interrompidas caso seja detectado que violam nossas diretrizes de conteúdo prejudicial”, segundo a OpenAI.
Todos os novos modelos vocais estão incluídos na API em tempo real da OpenAI. O Translate e o Whisper são cobrados por minuto, enquanto o GPT-Realtime-2 é cobrado com base no consumo de tokens.
Artigo relacionado
Satya Nadella está pronto para aproveitar o novo acordo com a OpenAI
Na quarta-feira, um analista da Wall Street perguntou diretamente ao CEO da Microsoft, Satya Nadella, como a nova parceria com a OpenAI afetaria os resultados financeiros da empresa.Nadella descreveu o novo acordo como uma vitória para todos. “Estam
A OpenAI traça os contornos da economia da IA com fundos de riqueza pública, impostos sobre robôs e a semana de quatro dias
Enquanto os governos lutam para lidar com o impacto econômico das máquinas superinteligentes, a OpenAI divulgou um conjunto de propostas de políticas que delineiam como a riqueza e o trabalho poderiam
Greg Brockman revela como Elon Musk deixou a OpenAI
No final de agosto de 2017, figuras-chave da OpenAI — na época, um pequeno laboratório de pesquisa sem fins lucrativos — se reuniram para discutir como criariam uma entidade com fins lucrativos para c
Recomendações de tópicos especiais relacionados
Comentários (0)

A OpenAI anunciou na quinta-feira que sua API agora inclui várias novas funcionalidades de inteligência vocal, projetadas para ajudar desenvolvedores a criar aplicativos capazes de falar, transcrever e traduzir conversas.
O novo modelo GPT-Realtime-2 da empresa é outro modelo vocal, desenvolvido para produzir uma simulação vocal realista que pode participar de conversas com os usuários. No entanto, diferente de seu predecessor (GPT-Realtime-1.5), esta versão incorpora o raciocínio do nível GPT-5, que a OpenAI afirma ter sido desenvolvido para lidar com solicitações mais complexas dos usuários.
A empresa também está lançando o GPT-Realtime-Translate, que, como o nome indica, oferece serviços de tradução em tempo real que acompanham o usuário durante as conversas. Esta funcionalidade suporta mais de 70 idiomas de entrada e 13 idiomas de saída.
Finalmente, a empresa introduziu uma nova capacidade de transcrição chamada GPT-Realtime-Whisper, que fornece funcionalidade de conversão de fala em texto em tempo real, capturando as palavras à medida que as interações ocorrem.
“Juntos, os modelos que estamos lançando levam o áudio em tempo real de interações simples de chamada e resposta para interfaces vocais que realmente podem realizar tarefas: ouvir, raciocinar, traduzir, transcrever e agir à medida que a conversa se desenrola”, afirmou a empresa.
Quem se beneficiará dessas atualizações? As empresas que buscam expandir suas capacidades de atendimento ao cliente são um público óbvio. No entanto, a OpenAI também observa que as novas funcionalidades serão úteis em uma ampla gama de áreas, incluindo educação, mídia, eventos e plataformas para criadores.
Por mais úteis que esses ferramentas sejam do ponto de vista empresarial, também existe o potencial de uso indevido. A empresa afirma ter implementado medidas de segurança para evitar que suas novas funcionalidades sejam usadas para spams, fraudes ou outros tipos de abuso on-line. Trigger específicos foram incorporados no sistema para que “as conversas possam ser interrompidas caso seja detectado que violam nossas diretrizes de conteúdo prejudicial”, segundo a OpenAI.
Todos os novos modelos vocais estão incluídos na API em tempo real da OpenAI. O Translate e o Whisper são cobrados por minuto, enquanto o GPT-Realtime-2 é cobrado com base no consumo de tokens.
Satya Nadella está pronto para aproveitar o novo acordo com a OpenAI
Na quarta-feira, um analista da Wall Street perguntou diretamente ao CEO da Microsoft, Satya Nadella, como a nova parceria com a OpenAI afetaria os resultados financeiros da empresa.Nadella descreveu o novo acordo como uma vitória para todos. “Estam
A OpenAI traça os contornos da economia da IA com fundos de riqueza pública, impostos sobre robôs e a semana de quatro dias
Enquanto os governos lutam para lidar com o impacto econômico das máquinas superinteligentes, a OpenAI divulgou um conjunto de propostas de políticas que delineiam como a riqueza e o trabalho poderiam
Greg Brockman revela como Elon Musk deixou a OpenAI
No final de agosto de 2017, figuras-chave da OpenAI — na época, um pequeno laboratório de pesquisa sem fins lucrativos — se reuniram para discutir como criariam uma entidade com fins lucrativos para c





Lar






