구글, 오프라인 AI 음성 입력 앱 출시
업데이트 (4월 7일 오후 10시 30분 , 태평양 표준시): 해당 회사는 앱 스토어 목록을 업데이트하여 안드로이드 버전 관련 내용을 삭제했습니다. 하지만 동시에 iOS용 키보드 기능이 곧 출시될 예정이라고 밝혔습니다.
월요일, 구글은 'Google AI Edge Eloquent'라는 이름의 새로운 iOS용 오프라인 우선 음성 입력 앱을 조용히 출시하며, Wispr Flow, SuperWhisper, Willow와 같은 경쟁사들과 경쟁 구도를 형성했습니다.
이 무료 앱은 젬마(Gemma) 기반 자동 음성 인식(ASR) 모델이 다운로드되면 바로 음성 입력을 시작할 수 있게 해줍니다. 실시간 텍스트 변환 결과를 표시하며, 일시 정지하면 "음", "아"와 같은 불필요한 말을 자동으로 제거하고 텍스트를 다듬어 줍니다.
전사본 아래에는 "핵심 내용", "공식적", "짧게", "길게"와 같은 옵션을 통해 텍스트 형식을 조정할 수 있습니다.

이미지 출처:TechCrunch 스크린샷
클라우드 연결을 해제하면 로컬 전용 처리 모드를 활성화할 수 있습니다. (클라우드 모드가 켜져 있으면 앱은 텍스트 정제를 위해 클라우드상의 Gemini 모델을 사용합니다.) Google AI Edge Eloquent는 선택적으로 Gmail 계정에서 특정 키워드, 이름, 전문 용어를 가져올 수 있습니다. 또한 사용자 정의 단어를 사전에 추가할 수도 있습니다.
이 앱은 모든 음성 입력 세션의 기록을 보관하며, 사용자는 이를 검색할 수 있습니다. 또한 마지막 세션의 지표(음성 입력 단어 수, 분당 단어 수, 총 단어 수 등)를 표시합니다.
"Google AI Edge Eloquent는 자연스러운 음성을 세련되고 전문적인 텍스트로 변환하도록 설계된 고급 받아쓰기 앱입니다. 말더듬이나 채움말까지 모두 기록하는 기본 소프트웨어와 달리, Eloquent는 AI를 활용해 사용자의 의도를 파악합니다. '음', '어' 같은 말더듬이나 문장 중간에 삽입된 수정 내용을 자동으로 편집하여 깔끔하고 정확한 문장을 제공합니다,"라고 회사의 앱 스토어 설명에 나와 있습니다.

제가 말하려던 건 "Transcription"이었습니다. 이 앱은 아직 초기 단계에 있습니다.이미지 출처:TechCrunch 제공 스크린샷
현재는 iOS 전용이지만, 앱 스토어 설명에는 안드로이드 버전도 언급되어 있습니다. (구글에 자세한 내용을 문의했으며, 확인되는 대로 이 기사를 업데이트할 예정입니다.)
설명에 따르면, Eloquent는 "원활한 안드로이드 통합"을 약속하며, 모든 텍스트 입력창에서 시스템 전체의 기본 키보드로 설정할 수 있게 해줍니다. 또한, 이 앱은 안드로이드용 Wispr Flow의 구현 방식과 유사하게 어디서나 쉽게 녹음 기능을 이용할 수 있도록 플로팅 버튼 기능을 지원할 예정입니다.
음성 인식 모델이 발전함에 따라 AI 기반 음성 인식 앱의 인기가 높아지고 있습니다. 이번 실험적 출시를 통해 구글은 이 경쟁이 치열한 시장에 진출하게 되었습니다. 테스트가 성공하면 향상된 음성 인식 기능이 안드로이드에 통합될 수도 있습니다.
관련 기사
구글, 인도에서 크롬용 제미니 서비스 출시
수요일, 구글은 크롬용 제미니(Gemini) 통합 기능을 인도, 캐나다, 뉴질랜드를 포함한 새로운 지역으로 확대한다고 발표했습니다. 이번 업데이트를 통해 데스크톱 사용자는 사이드바를 통해 제미니에 접속할 수 있게 되며, 여기서 구글의 AI 챗봇에게 화면상의 콘텐츠에 대해 질문하거나, 지메일(Gmail), 킵(Keep), 드라이브(Drive), 유튜브(You
미스트랄, 오픈소스 음성 생성 모델 공개
프랑스의 AI 기업 미스트랄(Mistral)은 목요일, 음성 AI 비서 및 고객 지원과 같은 기업용 애플리케이션을 위해 설계된 새로운 오픈소스 텍스트-투-스피치(TTS) 모델을 공개했다. 이 모델을 통해 기업들은 영업 및 고객 소통을 위한 음성 에이전트를 구축할 수 있게 되었으며, 미스트랄은 이를 통해 일레븐랩스(ElevenLabs), 딥그램(Deepgra
유튜브, 정치인·공직자·언론인을 대상으로 AI 딥페이크 탐지 기능 확대
화요일, 유튜브는 딥페이크 탐지 기술을 일부 정부 관계자, 정치 후보자 및 언론인 대상으로 확대한다고 발표했다. 이 도구는 AI로 생성된 유사 영상을 식별하며, 시범 운영 참여자들은 유튜브 정책을 위반한다고 판단되는 무단 콘텐츠의 삭제를 요청할 수 있다.이 탐지 시스템은 초기 테스트 단계를 거친 후, 작년 유튜브 파트너 프로그램에 가입된 약 400만 명의
관련 특별 주제 추천
의견 (0)
0/500
업데이트 (4월 7일 오후 10시 30분 , 태평양 표준시): 해당 회사는 앱 스토어 목록을 업데이트하여 안드로이드 버전 관련 내용을 삭제했습니다. 하지만 동시에 iOS용 키보드 기능이 곧 출시될 예정이라고 밝혔습니다.
월요일, 구글은 'Google AI Edge Eloquent'라는 이름의 새로운 iOS용 오프라인 우선 음성 입력 앱을 조용히 출시하며, Wispr Flow, SuperWhisper, Willow와 같은 경쟁사들과 경쟁 구도를 형성했습니다.
이 무료 앱은 젬마(Gemma) 기반 자동 음성 인식(ASR) 모델이 다운로드되면 바로 음성 입력을 시작할 수 있게 해줍니다. 실시간 텍스트 변환 결과를 표시하며, 일시 정지하면 "음", "아"와 같은 불필요한 말을 자동으로 제거하고 텍스트를 다듬어 줍니다.
전사본 아래에는 "핵심 내용", "공식적", "짧게", "길게"와 같은 옵션을 통해 텍스트 형식을 조정할 수 있습니다.

이미지 출처:TechCrunch 스크린샷
클라우드 연결을 해제하면 로컬 전용 처리 모드를 활성화할 수 있습니다. (클라우드 모드가 켜져 있으면 앱은 텍스트 정제를 위해 클라우드상의 Gemini 모델을 사용합니다.) Google AI Edge Eloquent는 선택적으로 Gmail 계정에서 특정 키워드, 이름, 전문 용어를 가져올 수 있습니다. 또한 사용자 정의 단어를 사전에 추가할 수도 있습니다.
이 앱은 모든 음성 입력 세션의 기록을 보관하며, 사용자는 이를 검색할 수 있습니다. 또한 마지막 세션의 지표(음성 입력 단어 수, 분당 단어 수, 총 단어 수 등)를 표시합니다.
"Google AI Edge Eloquent는 자연스러운 음성을 세련되고 전문적인 텍스트로 변환하도록 설계된 고급 받아쓰기 앱입니다. 말더듬이나 채움말까지 모두 기록하는 기본 소프트웨어와 달리, Eloquent는 AI를 활용해 사용자의 의도를 파악합니다. '음', '어' 같은 말더듬이나 문장 중간에 삽입된 수정 내용을 자동으로 편집하여 깔끔하고 정확한 문장을 제공합니다,"라고 회사의 앱 스토어 설명에 나와 있습니다.

제가 말하려던 건 "Transcription"이었습니다. 이 앱은 아직 초기 단계에 있습니다.이미지 출처:TechCrunch 제공 스크린샷
현재는 iOS 전용이지만, 앱 스토어 설명에는 안드로이드 버전도 언급되어 있습니다. (구글에 자세한 내용을 문의했으며, 확인되는 대로 이 기사를 업데이트할 예정입니다.)
설명에 따르면, Eloquent는 "원활한 안드로이드 통합"을 약속하며, 모든 텍스트 입력창에서 시스템 전체의 기본 키보드로 설정할 수 있게 해줍니다. 또한, 이 앱은 안드로이드용 Wispr Flow의 구현 방식과 유사하게 어디서나 쉽게 녹음 기능을 이용할 수 있도록 플로팅 버튼 기능을 지원할 예정입니다.
음성 인식 모델이 발전함에 따라 AI 기반 음성 인식 앱의 인기가 높아지고 있습니다. 이번 실험적 출시를 통해 구글은 이 경쟁이 치열한 시장에 진출하게 되었습니다. 테스트가 성공하면 향상된 음성 인식 기능이 안드로이드에 통합될 수도 있습니다.
구글, 인도에서 크롬용 제미니 서비스 출시
수요일, 구글은 크롬용 제미니(Gemini) 통합 기능을 인도, 캐나다, 뉴질랜드를 포함한 새로운 지역으로 확대한다고 발표했습니다. 이번 업데이트를 통해 데스크톱 사용자는 사이드바를 통해 제미니에 접속할 수 있게 되며, 여기서 구글의 AI 챗봇에게 화면상의 콘텐츠에 대해 질문하거나, 지메일(Gmail), 킵(Keep), 드라이브(Drive), 유튜브(You
미스트랄, 오픈소스 음성 생성 모델 공개
프랑스의 AI 기업 미스트랄(Mistral)은 목요일, 음성 AI 비서 및 고객 지원과 같은 기업용 애플리케이션을 위해 설계된 새로운 오픈소스 텍스트-투-스피치(TTS) 모델을 공개했다. 이 모델을 통해 기업들은 영업 및 고객 소통을 위한 음성 에이전트를 구축할 수 있게 되었으며, 미스트랄은 이를 통해 일레븐랩스(ElevenLabs), 딥그램(Deepgra
유튜브, 정치인·공직자·언론인을 대상으로 AI 딥페이크 탐지 기능 확대
화요일, 유튜브는 딥페이크 탐지 기술을 일부 정부 관계자, 정치 후보자 및 언론인 대상으로 확대한다고 발표했다. 이 도구는 AI로 생성된 유사 영상을 식별하며, 시범 운영 참여자들은 유튜브 정책을 위반한다고 판단되는 무단 콘텐츠의 삭제를 요청할 수 있다.이 탐지 시스템은 초기 테스트 단계를 거친 후, 작년 유튜브 파트너 프로그램에 가입된 약 400만 명의





집






