구글의 음악 앱 환각으로 창업자가 가상의 사운드슬라이스를 실현하게 된 계기
이달 초, 음악 교육 플랫폼 Soundslice의 창립자인 Adrian Holovaty는 몇 주 동안 자신을 당황하게 만들었던 사건을 해결했습니다. ChatGPT 세션의 스크린샷으로 보이는 이상한 이미지가 사이트에 계속 나타난 것입니다.
수수께끼를 풀고 나서야 그는 ChatGPT가 회사의 가장 큰 홍보 수단 중 하나가 되었음을 알게 되었지만, 안타깝게도 앱의 실제 기능에 대한 잘못된 정보를 퍼뜨리고 있다는 사실도 알게 되었습니다.
홀로바티는 인기 있는 오픈소스 Python 웹 프레임워크인 장고 프로젝트의 공동 창시자로 널리 알려져 있습니다(2014년에 프로젝트 관리에서 물러났지만). 그는 2012년에 사운드슬라이스를 설립했으며, 테크크런치와의 인터뷰에서 이 회사가 "자랑스럽게 부트스트랩을 적용했다"고 밝혔습니다. 요즘은 음악 활동과 창업에 집중하고 있습니다.
사운드슬라이즈는 학생과 교사 모두가 사용하는 음악 교육 앱입니다. 특히 악보와 원활하게 동기화되어 사용자에게 음표 연주 방법을 정확하게 보여주는 비디오 플레이어로 유명합니다.
이 앱에는 '악보 스캐너' 기능도 포함되어 있습니다. 이 기능은 AI를 사용하여 사용자가 인쇄된 악보의 이미지를 업로드하면 모든 표기법이 포함된 대화형 악보로 자동 변환해 줍니다.
홀로바티는 이 기능의 오류 로그를 부지런히 모니터링하여 문제를 파악하고 향후 개선 사항을 안내한다고 설명합니다.
이 로그에서 그는 업로드된 ChatGPT 세션 스크린샷을 처음 발견했습니다.
테크크런치 이벤트 테크크런치 올스테이지 패스를 최대 $475 할인된 가격에 구매하세요.
더 스마트하게 구축하세요. 더 빠르게 확장하세요. 더 깊이 연결하세요. Precursor Ventures, NEA, Index Ventures, Underscore VC 및 기타 선도 기업의 선구자들과 함께 전략적 인사이트, 실습 워크숍, 귀중한 네트워킹을 하루 동안 경험하세요.
테크크런치 올 스테이지 패스를 $450 할인된 가격에 만나보세요.
더 스마트하게 구축하세요. 더 빠르게 확장하세요. 더 깊이 연결하세요. Precursor Ventures, NEA, Index Ventures, Underscore VC 및 기타 선도 기업의 선구자들과 함께 전략적 인사이트, 실습 워크숍, 귀중한 네트워킹을 하루 동안 경험해 보세요.
매사추세츠주 보스턴 | 7월 15일 지금 등록하기 이러한 업로드는 수많은 오류 로그를 생성했습니다. 이미지에는 악보가 아닌 텍스트 대화와 ASCII 표식으로 알려진 기호 상자가 표시되어 있었습니다. 이것은 표준 키보드 문자를 사용하는 간단한 텍스트 기반 기타 기보법 시스템입니다. (결국, 일반적인 쿼티 키보드에는 고음 음자리표가 없습니다.).

이미지 크레딧: Adrian Holovaty 홀로바티는 이러한 ChatGPT 이미지의 용량이 스토리지 비용이나 앱의 대역폭에 부담을 줄 만큼 크지 않다는 점에 주목했습니다. 그는 이 사건에 대한 블로그 게시물에서 당황스러움을 감추지 못했습니다.
"우리 스캔 시스템은 이러한 유형의 표기법을 처리하도록 설계된 적이 없습니다. 그렇다면 왜 갑자기 ChatGPT에서 ASCII 탭의 스크린샷이 넘쳐났을까요? 몇 주 동안 당황스러웠습니다. 결국 직접 ChatGPT를 실험해 보기로 결심했습니다."
그 때 그는 그것을 발견했습니다: ChatGPT는 사람들에게 사운드슬라이스 계정을 만들고 채팅 세션의 스크린샷을 업로드하면 음악을 들을 수 있다고 안내하고 있었습니다. 문제는 그렇게 할 수 없다는 것이었습니다. 이러한 이미지를 업로드한다고 해서 ASCII 표기가 재생 가능한 오디오로 마술처럼 변환되지는 않았습니다.
이로 인해 새로운 평판 문제가 발생했습니다. "가장 큰 비용은 평판에 대한 것이었습니다: 신규 사용자들이 완전히 잘못된 기대를 가지고 들어오고 있었죠. 그들은 우리 앱이 할 수 없는 일을 우리 앱이 할 수 있다고 확신하고 있었습니다."라고 그는 TechCrunch에 말했습니다.
그와 그의 팀은 선택지를 고민했습니다. ChatGPT 세션을 가청 음악으로 변환할 수 없다는 고지 사항을 사이트에 명시하거나, 아니면 이 특이한 표기법을 실제로 지원하는 기능을 구축하는 것이었습니다.
그는 기능을 구축하기로 결정했습니다.
"이에 대한 제 감정은 엇갈립니다. 사람들에게 도움이 되는 도구를 제공하게 되어 기쁩니다. 하지만 매우 이상한 방식으로 압박을 받은 것 같기도 합니다. 회사가 정말 AI가 생성한 잘못된 정보에 직접 대응하는 기능을 개발해야 할까요?"라고 그는 썼습니다.
그는 또한 ChatGPT가 반복적으로 많은 청중에게 그 존재를 환각시켜 회사가 새로운 기능을 구현해야 하는 첫 번째 사례인지에 대해서도 의문을 제기했습니다.
해커 뉴스의 동료 프로그래머들은 흥미로운 관점을 제시했습니다. 몇몇은 이 시나리오가 잠재 고객에게 지나치게 열성적인 영업사원이 거창한 약속을 하고 개발팀이 이를 이행하도록 강요하는 것과 다르지 않다는 의견을 제시했습니다.
"매우 적절하고 재미있는 비교라고 생각합니다!" 홀로바티도 동의했습니다.
관련 기사
Stability AI, 6분 길이의 노래를 생성할 수 있는 오디오 모델 공개
Stable Diffusion을 개발한 Stability AI가 ‘Stability Audio 3.0’이라는 새로운 오디오 모델 시리즈를 공개했다. 회사에 따르면, 이 플래그십 모델은 6분을 넘는 길이의 전문가급 음악 트랙을 생성할 수 있다.스태빌리티 오디오 3.0 라인업에는 소형 SFX(4억 5,900만 파라미터), 소형(4억 5,900만 파라미터), 중
오픈AI, 유비코와 제휴를 통해 계정 보호 기능을 강화하며 ChatGPT 보안 강화
OpenAI는 계정 보안을 강화하기 위해 적극적인 조치를 취하고 있습니다.지난 목요일, 이 회사는 ChatGPT 사용자를 위한 선택적 보안 기능 모음인 '고급 계정 보안(Advanced Account Security)'을 도입했습니다. 이 기능들은 유명 인사들을 위해 설계되었지만, 더 강력한 보안 조치를 원하는 누구나 이용할 수 있습니다.이번 조치의 일환으
오픈AI, 은행 계좌 연동 기능이 탑재된 개인 재무 관리용 ChatGPT 출시
지난 금요일, OpenAI는 미국 내 ChatGPT Pro 구독자를 대상으로 새로운 개인 재무 관리 도구 모음을 미리 공개했습니다. 이 기능을 통해 사용자는 자신의 금융 계좌를 연동하고, 지출 분석부터 장기 재무 계획에 이르기까지 다양한 주제에 대해 질문할 수 있습니다.이러한 연동을 관리하기 위해 OpenAI는 금융 데이터 네트워크 기업인 Plaid와 협력
관련 특별 주제 추천
의견 (1)
0/500
Ich hab mal Soundslice ausprobiert, echt coole Idee 🎸 Aber dass AI jetzt sogar so was zusammenfantasiert? Das ist schon ein bisschen beängstigend. Was, wenn Musiker ihre Ideen aus KI-Halluzinationen kriegen...? Auf jeden Fall ein krasses Beispiel für unerwartete Nebenwirkungen der Technologie. Ich frag mich, ob Google schon eine Lösung hat 🤔
이달 초, 음악 교육 플랫폼 Soundslice의 창립자인 Adrian Holovaty는 몇 주 동안 자신을 당황하게 만들었던 사건을 해결했습니다. ChatGPT 세션의 스크린샷으로 보이는 이상한 이미지가 사이트에 계속 나타난 것입니다.
수수께끼를 풀고 나서야 그는 ChatGPT가 회사의 가장 큰 홍보 수단 중 하나가 되었음을 알게 되었지만, 안타깝게도 앱의 실제 기능에 대한 잘못된 정보를 퍼뜨리고 있다는 사실도 알게 되었습니다.
홀로바티는 인기 있는 오픈소스 Python 웹 프레임워크인 장고 프로젝트의 공동 창시자로 널리 알려져 있습니다(2014년에 프로젝트 관리에서 물러났지만). 그는 2012년에 사운드슬라이스를 설립했으며, 테크크런치와의 인터뷰에서 이 회사가 "자랑스럽게 부트스트랩을 적용했다"고 밝혔습니다. 요즘은 음악 활동과 창업에 집중하고 있습니다.
사운드슬라이즈는 학생과 교사 모두가 사용하는 음악 교육 앱입니다. 특히 악보와 원활하게 동기화되어 사용자에게 음표 연주 방법을 정확하게 보여주는 비디오 플레이어로 유명합니다.
이 앱에는 '악보 스캐너' 기능도 포함되어 있습니다. 이 기능은 AI를 사용하여 사용자가 인쇄된 악보의 이미지를 업로드하면 모든 표기법이 포함된 대화형 악보로 자동 변환해 줍니다.
홀로바티는 이 기능의 오류 로그를 부지런히 모니터링하여 문제를 파악하고 향후 개선 사항을 안내한다고 설명합니다.
이 로그에서 그는 업로드된 ChatGPT 세션 스크린샷을 처음 발견했습니다.
테크크런치 이벤트테크크런치 올스테이지 패스를 최대 $475 할인된 가격에 구매하세요.
더 스마트하게 구축하세요. 더 빠르게 확장하세요. 더 깊이 연결하세요. Precursor Ventures, NEA, Index Ventures, Underscore VC 및 기타 선도 기업의 선구자들과 함께 전략적 인사이트, 실습 워크숍, 귀중한 네트워킹을 하루 동안 경험하세요.
테크크런치 올 스테이지 패스를 $450 할인된 가격에 만나보세요.
더 스마트하게 구축하세요. 더 빠르게 확장하세요. 더 깊이 연결하세요. Precursor Ventures, NEA, Index Ventures, Underscore VC 및 기타 선도 기업의 선구자들과 함께 전략적 인사이트, 실습 워크숍, 귀중한 네트워킹을 하루 동안 경험해 보세요.
매사추세츠주 보스턴 | 7월 15일 지금 등록하기이러한 업로드는 수많은 오류 로그를 생성했습니다. 이미지에는 악보가 아닌 텍스트 대화와 ASCII 표식으로 알려진 기호 상자가 표시되어 있었습니다. 이것은 표준 키보드 문자를 사용하는 간단한 텍스트 기반 기타 기보법 시스템입니다. (결국, 일반적인 쿼티 키보드에는 고음 음자리표가 없습니다.).

홀로바티는 이러한 ChatGPT 이미지의 용량이 스토리지 비용이나 앱의 대역폭에 부담을 줄 만큼 크지 않다는 점에 주목했습니다. 그는 이 사건에 대한 블로그 게시물에서 당황스러움을 감추지 못했습니다.
"우리 스캔 시스템은 이러한 유형의 표기법을 처리하도록 설계된 적이 없습니다. 그렇다면 왜 갑자기 ChatGPT에서 ASCII 탭의 스크린샷이 넘쳐났을까요? 몇 주 동안 당황스러웠습니다. 결국 직접 ChatGPT를 실험해 보기로 결심했습니다."
그 때 그는 그것을 발견했습니다: ChatGPT는 사람들에게 사운드슬라이스 계정을 만들고 채팅 세션의 스크린샷을 업로드하면 음악을 들을 수 있다고 안내하고 있었습니다. 문제는 그렇게 할 수 없다는 것이었습니다. 이러한 이미지를 업로드한다고 해서 ASCII 표기가 재생 가능한 오디오로 마술처럼 변환되지는 않았습니다.
이로 인해 새로운 평판 문제가 발생했습니다. "가장 큰 비용은 평판에 대한 것이었습니다: 신규 사용자들이 완전히 잘못된 기대를 가지고 들어오고 있었죠. 그들은 우리 앱이 할 수 없는 일을 우리 앱이 할 수 있다고 확신하고 있었습니다."라고 그는 TechCrunch에 말했습니다.
그와 그의 팀은 선택지를 고민했습니다. ChatGPT 세션을 가청 음악으로 변환할 수 없다는 고지 사항을 사이트에 명시하거나, 아니면 이 특이한 표기법을 실제로 지원하는 기능을 구축하는 것이었습니다.
그는 기능을 구축하기로 결정했습니다.
"이에 대한 제 감정은 엇갈립니다. 사람들에게 도움이 되는 도구를 제공하게 되어 기쁩니다. 하지만 매우 이상한 방식으로 압박을 받은 것 같기도 합니다. 회사가 정말 AI가 생성한 잘못된 정보에 직접 대응하는 기능을 개발해야 할까요?"라고 그는 썼습니다.
그는 또한 ChatGPT가 반복적으로 많은 청중에게 그 존재를 환각시켜 회사가 새로운 기능을 구현해야 하는 첫 번째 사례인지에 대해서도 의문을 제기했습니다.
해커 뉴스의 동료 프로그래머들은 흥미로운 관점을 제시했습니다. 몇몇은 이 시나리오가 잠재 고객에게 지나치게 열성적인 영업사원이 거창한 약속을 하고 개발팀이 이를 이행하도록 강요하는 것과 다르지 않다는 의견을 제시했습니다.
"매우 적절하고 재미있는 비교라고 생각합니다!" 홀로바티도 동의했습니다.
Stability AI, 6분 길이의 노래를 생성할 수 있는 오디오 모델 공개
Stable Diffusion을 개발한 Stability AI가 ‘Stability Audio 3.0’이라는 새로운 오디오 모델 시리즈를 공개했다. 회사에 따르면, 이 플래그십 모델은 6분을 넘는 길이의 전문가급 음악 트랙을 생성할 수 있다.스태빌리티 오디오 3.0 라인업에는 소형 SFX(4억 5,900만 파라미터), 소형(4억 5,900만 파라미터), 중
오픈AI, 유비코와 제휴를 통해 계정 보호 기능을 강화하며 ChatGPT 보안 강화
OpenAI는 계정 보안을 강화하기 위해 적극적인 조치를 취하고 있습니다.지난 목요일, 이 회사는 ChatGPT 사용자를 위한 선택적 보안 기능 모음인 '고급 계정 보안(Advanced Account Security)'을 도입했습니다. 이 기능들은 유명 인사들을 위해 설계되었지만, 더 강력한 보안 조치를 원하는 누구나 이용할 수 있습니다.이번 조치의 일환으
오픈AI, 은행 계좌 연동 기능이 탑재된 개인 재무 관리용 ChatGPT 출시
지난 금요일, OpenAI는 미국 내 ChatGPT Pro 구독자를 대상으로 새로운 개인 재무 관리 도구 모음을 미리 공개했습니다. 이 기능을 통해 사용자는 자신의 금융 계좌를 연동하고, 지출 분석부터 장기 재무 계획에 이르기까지 다양한 주제에 대해 질문할 수 있습니다.이러한 연동을 관리하기 위해 OpenAI는 금융 데이터 네트워크 기업인 Plaid와 협력
Ich hab mal Soundslice ausprobiert, echt coole Idee 🎸 Aber dass AI jetzt sogar so was zusammenfantasiert? Das ist schon ein bisschen beängstigend. Was, wenn Musiker ihre Ideen aus KI-Halluzinationen kriegen...? Auf jeden Fall ein krasses Beispiel für unerwartete Nebenwirkungen der Technologie. Ich frag mich, ob Google schon eine Lösung hat 🤔





집






