옵션
뉴스
참깨는 바이러스 성 가상 어시스턴트 Maya의 기본 AI 모델을 공개합니다.

참깨는 바이러스 성 가상 어시스턴트 Maya의 기본 AI 모델을 공개합니다.

2025년 4월 23일
120

참깨는 바이러스 성 가상 어시스턴트 Maya의 기본 AI 모델을 공개합니다.

Sesame, 혁신적인 AI 회사로, 놀랍도록 생생한 음성 비서 Maya를 개발했으며, 최근 그녀의 기능을 구동하는 기본 모델을 공개해 화제를 모았다. CSM-1B로 명명된 이 모델은 10억 개의 파라미터를 자랑하며, 이는 모델을 구성하는 개별 요소를 의미한다. Apache 2.0 라이선스 하에 공개되어 AI 개발 플랫폼 Hugging Face에서 발표된 바와 같이 상업적 사용에 최소한의 제약이 있다.

CSM-1B는 텍스트와 오디오 입력을 "RVQ 오디오 코드"로 변환하여 작동한다. RVQ는 "잔여 벡터 양자화"를 의미하며, 오디오를 이산 토큰 또는 코드로 변환하는 방법이다. 이 기술은 Google의 SoundStream 및 Meta의 Encodec과 같은 최첨단 AI 오디오 기술에서도 사용된다. 핵심적으로 CSM-1B는 Meta의 Llama 패밀리 모델과 오디오 "디코더" 컴포넌트를 결합한다. Sesame에 따르면, CSM-1B의 특화된 버전이 파인튜닝 후 Maya의 음성을 구동한다.

Hugging Face와 GitHub 저장소에서 이 모델을 "기본 생성 모델"로 설명하며, Sesame는 다양한 음성을 생성하도록 설계되었지만 특정 음성에 대해 정제되지 않았다고 밝혔다. 훈련 데이터의 "데이터 오염" 덕분에 비영어 언어를 어느 정도 처리할 수 있지만, 이 분야에서의 성능은 아마도 미흡할 것이다. 흥미롭게도 Sesame는 훈련 데이터의 세부 사항을 비공개로 유지해 이 모델 구축에 어떤 요소가 포함되었는지 궁금증을 남긴다.

눈썹을 치켜세우는 한 가지 측면은 강력한 안전 장치의 부재다. Sesame는 명예 시스템에 따라 운영되며, 사용자와 개발자에게 모델을 사용해 허가 없이 누군가의 음성을 복제하거나, 가짜 뉴스와 같은 오해를 불러일으키는 콘텐츠를 생성하거나, "해로운" 또는 "악의적인" 활동에 참여하지 말 것을 간단히 권장한다. 나는 Hugging Face의 데모를 직접 테스트했으며, 1분 만에 내 음성을 복제했다. 선거나 러시아 선전과 같은 민감한 주제에 대한 음성을 생성하는 것도 매우 쉬웠다.

Consumer Reports는 최근 많은 AI 기반 음성 복제 도구에 "의미 있는" 안전 장치가 부족해 잠재적인 사기나 남용으로 이어질 수 있다고 강조했다. Oculus 공동 창립자 Brendan Iribe가 공동 설립한 Sesame는 2월 말, 거의 언캐니 밸리를 벗어나는 비서 기술로 대중의 주목을 끌었다. Maya와 Sesame의 다른 비서 Miles는 숨을 쉬거나, 말할 때 불완전성을 보이며, 중간에 말을 끊을 수 있는 등 OpenAI의 Voice Mode와 유사한 현실적인 인간적 특성을 보여준다.

재정적으로 Sesame는 Andreessen Horowitz, Spark Capital, Matrix Partners와 같은 거물들로부터 비공개 자금을 확보했다. 음성 비서 외에도, 이 회사는 하루 종일 착용 가능한 AI 안경 프로토타입 제작에 도전하고 있으며, 이는 그들의 커스텀 모델로 구동된다. 이 움직임은 Sesame가 AI 기술을 우리 일상생활에 더욱 깊이 밀어 넣으려는 야심을 보여준다.

관련 기사
"AI 안전 및 윤리 탐구: 데이터브릭스 및 일레븐랩스 전문가들의 인사이트" 제너레이티브 AI가 점점 더 저렴하고 널리 보급됨에 따라 윤리적 고려 사항과 보안 조치가 중요해졌습니다. ElevenLabs의 AI 안전 책임자 아르테미스 시포드와 데이터브릭스 공동창업자 이온 스토이카는 테크크런치의 AI 특파원 카일 위거스와 함께 오늘날 AI 환경의 시급한 윤리적 딜레마를 살펴보는 통찰력 있는 대담에 참여했습니다.두 사람은 합성 미
트루스 소셜의 새로운 AI 검색 엔진, 결과에서 폭스 뉴스를 크게 선호하다 트루스 소셜의 새로운 AI 검색 엔진, 결과에서 폭스 뉴스를 크게 선호하다 트럼프의 소셜 미디어 플랫폼, 보수적인 미디어 성향이 뚜렷한 AI 기반 검색 기능 도입독점 AI 검색 기능 출시도널드 트럼프가 설립한 소셜 미디어 플랫폼인 트루스 소셜은 새로운 인공지능 검색 도구인 '트루스 서치 AI'를 출시했습니다. AI 스타트업 Perplexity와 협력하여 개발한 이 기능은 현재 웹 버전에서 작동하며, 곧 모바일 앱과 통합될 예정입니
파일 액세스를 위한 Google 드라이브 및 Dropbox 통합 기능을 추가한 ChatGPT 파일 액세스를 위한 Google 드라이브 및 Dropbox 통합 기능을 추가한 ChatGPT 새로운 엔터프라이즈 기능으로 생산성을 향상시키는 ChatGPTOpenAI는 자동화된 회의 문서화 및 원활한 클라우드 스토리지 통합이라는 두 가지 강력한 새 기능을 통해 ChatGPT를 종합적인 비즈니스 생산성 도구로 탈바꿈시켰습니다.혁신적인 녹음 기능새로 도입된 '녹음 모드'를 통해 다음과 같은 중요한 비즈니스 미팅을 자동으로 녹음하고 분석할 수
의견 (8)
0/200
PaulYoung
PaulYoung 2025년 8월 14일 오전 6시 0분 59초 GMT+09:00

C'est incroyable ce que Sesame a fait avec Maya ! Un modèle à 1 milliard de paramètres, ça doit être une sacrée bête. Mais franchement, ça donne quoi en termes d'éthique ? On va tous finir avec des assistants trop parfaits ? 😅

AnthonyMartinez
AnthonyMartinez 2025년 7월 31일 오전 10시 41분 20초 GMT+09:00

Wow, Sesame's CSM-1B sounds like a game-changer! A billion parameters for Maya’s lifelike voice? That’s some serious tech flex. Curious how it stacks up against other models in real-world use. 😎

RoySmith
RoySmith 2025년 7월 28일 오전 10시 18분 39초 GMT+09:00

Whoa, a 1B parameter model powering Maya? That's some serious brainpower! Curious how Sesame's CSM-1B stacks up against other AI giants. Excited to see where this tech takes us! 🚀

EricPerez
EricPerez 2025년 4월 25일 오전 7시 42분 49초 GMT+09:00

Sesame's base AI model for Maya is mind-blowing! 1 billion parameters? That's insane! Maya's voice is so lifelike, it's like talking to a real person. But sometimes she gets a bit too chatty, which can be annoying. Still, a fantastic piece of tech! 🤯

GeorgeMiller
GeorgeMiller 2025년 4월 24일 오후 10시 4분 42초 GMT+09:00

¡El modelo base de IA de Sesame para Maya es alucinante! ¿1 billón de parámetros? ¡Eso es una locura! La voz de Maya es tan realista, parece que estoy hablando con una persona real. Pero a veces se pone un poco parlanchina, lo que puede ser molesto. Aún así, una tecnología fantástica! 🤯

JonathanMiller
JonathanMiller 2025년 4월 24일 오후 9시 11분 38초 GMT+09:00

Das Basis-AI-Modell von Sesame für Maya ist umwerfend! 1 Milliarde Parameter? Das ist verrückt! Mayas Stimme ist so lebensecht, es fühlt sich an, als würde man mit einer echten Person sprechen. Aber manchmal wird sie ein bisschen zu gesprächig, was nervig sein kann. Trotzdem, eine fantastische Technologie! 🤯

위로 돌아갑니다
OR