Google 音樂應用程式的幻覺促使創辦人實現虛構的 Soundslice
本月初,音樂教育平台 Soundslice 的創辦人 Adrian Holovaty 偵破了一件困擾他好幾個星期的案子。奇怪的圖片不斷出現在網站上,這些圖片明顯是 ChatGPT 片段的截圖。
揭開謎團之後,他發現 ChatGPT 已成為他公司最大的宣傳者之一 - 不幸的是,它也在散播關於他應用程式實際功能的錯誤資訊。
眾所周知,Holovaty 是 Django 計畫的共同創造者,這是一個廣受歡迎的開放源碼 Python 網路框架(雖然他在 2014 年退出管理)。他在 2012 年創立了 Soundslice,他向 TechCrunch 確認這家公司是「引以為傲的自負盈虧」。如今,他的重心分佈在音樂事業與創業事業之間。
Soundslice 是一款音樂教育應用程式,學生和老師都在使用。它尤其以視訊播放器聞名,可與音樂記號無縫同步,準確地向使用者展示如何彈奏音符。
該應用程式還包含「樂譜掃描器」功能。使用 AI,它可以讓使用者上傳印刷樂譜的影像,並自動將其轉換成包含所有記號的互動樂譜。
Holovaty 解釋說,他勤勉地監控此功能的錯誤記錄,以找出問題並指導未來的改進。
正是在這些記錄中,他第一次注意到上傳的 ChatGPT 會話截圖。
Techcrunch 活動 TechCrunch All Stage 通票最高可省 475 美元
更聰明地建立。擴充更快。更深入地聯繫。與來自 Precursor Ventures、NEA、Index Ventures、Underscore VC 及其他領導公司的有遠見的人士一起,享受一天的策略性見解、實務研討會以及寶貴的人際網路。
TechCrunch All Stage 入場證可節省 450 美元
更聰明地建立。更快擴張。更深入地聯繫。與來自 Precursor Ventures、NEA、Index Ventures、Underscore VC 及其他領導公司的有遠見的人士一起,享受一天的策略性見解、實務研討會以及寶貴的人際網路。
馬薩諸塞州波士頓 | 7 月 15 日 立即報名 這些上傳產生許多錯誤記錄。這些影像並未包含樂譜;相反地,它們顯示的是文字對話和被稱為 ASCII tablature 的符號方塊。這是一種簡單、以文字為基礎的吉他記號系統,使用標準的鍵盤字符。(畢竟,您不會在典型的 QWERTY 鍵盤上找到高音五線谱)。

圖片來源:Adrian Holovaty Holovaty 指出,這些 ChatGPT 圖片的數量並不多,不足以造成顯著的儲存成本,也不會對他的應用程式頻寬造成壓力。正如他在一篇關於該事件的博文中所寫,他只是感到困惑。
"我們的掃描系統從來沒有被設計來處理這種類型的記事。那麼,為什麼我們會突然被 ChatGPT 的 ASCII 標籤截圖淹沒呢?我困惑了好幾個星期,直到我決定親自試用 ChatGPT。
這時他發現了問題所在:ChatGPT 指示人們只要建立一個 Soundslice 帳戶,並上傳聊天會話的截圖,就可以聆聽音樂。問題是,他們做不到。上傳這些影像並不能神奇地將 ASCII tablature 轉換成可播放的音訊。
這造成了新的聲譽問題。"主要的代價是我們的聲譽:新使用者帶著完全錯誤的期望來使用我們的產品。他告訴 TechCrunch:「他們很有信心地保證我們可以做到一些我們的應用程式根本做不到的事情。
他和他的團隊考慮了他們的選擇:在網站上貼滿免責聲明,說明他們無法將 ChatGPT 會話轉換成可聽的音樂,或者,建立實際支援這種不尋常記號系統的功能。
他決定建立這個功能。
"我對這件事的感覺很複雜。我很高興能提供一個工具來幫助人們。但我覺得我們是在一種非常奇怪的方式下受到壓力。他寫道:「公司真的應該直接針對 AI 產生的錯誤資訊來開發功能嗎?
他也質疑這是否是第一個公司因為 ChatGPT 屢次向大眾傳達其存在的幻覺,而不得不實作新功能的例子。
Hacker News 上的其他程式設計師提供了一個有趣的觀點:幾位程式設計師評論說,這情況與過度熱心的人肉推銷員對潛在客戶做出偉大承諾無異,然後就迫使開發團隊慌忙交付。
「我覺得這個比較非常貼切,也相當有趣!」Holovaty 表示同意。
相關文章
Stability AI 推出一款能生成六分鐘歌曲的音訊模型
Stable Diffusion 的開發商 Stability AI 近日推出了一系列名為 Stability Audio 3.0 的新音訊模型。據該公司表示,其旗艦模型能夠生成長度超過六分鐘的專業級音樂曲目。在 Stability Audio 3.0 系列下,該公司推出了四款模型:小型 SFX(4.59 億參數)、小型(4.59 億參數)、中型(14 億參數)以及大型(27 億參數)。其中兩款小
OpenAI 與 Yubico 合作強化 ChatGPT 安全性,以提升帳戶保護
OpenAI 正採取重大措施來強化帳戶安全性。週四,該公司推出了「進階帳戶安全」功能,這是一套針對 ChatGPT 用戶的可選防護措施。雖然這些功能是為高知名度人士設計的,但任何尋求更強大安全保障的人士皆可使用。作為此項計畫的一環,數位安全公司 Yubico 宣布與 OpenAI 合作,將兩款新型安全金鑰產品整合至 ChatGPT 帳戶中。此項合作旨在保護使用者免受針對聊天機器人平台日益加劇的網路
OpenAI 推出整合銀行帳戶功能的 ChatGPT 個人理財版
上週五,OpenAI 為美國境內的 ChatGPT Pro 訂閱用戶推出了全新個人理財工具套件的預覽版。此功能讓使用者能連結自己的金融帳戶,並提出從消費分析到長期財務規劃等各類問題。為管理這些連結,OpenAI 與金融數據網路 Plaid 合作。用戶可連結來自超過 12,000 家金融機構的帳戶,包括查爾斯·施瓦布(Charles Schwab)、富達(Fidelity)、大通銀行(Chase)、
相關專題推薦
評論 (1)
0/500
Ich hab mal Soundslice ausprobiert, echt coole Idee 🎸 Aber dass AI jetzt sogar so was zusammenfantasiert? Das ist schon ein bisschen beängstigend. Was, wenn Musiker ihre Ideen aus KI-Halluzinationen kriegen...? Auf jeden Fall ein krasses Beispiel für unerwartete Nebenwirkungen der Technologie. Ich frag mich, ob Google schon eine Lösung hat 🤔
本月初,音樂教育平台 Soundslice 的創辦人 Adrian Holovaty 偵破了一件困擾他好幾個星期的案子。奇怪的圖片不斷出現在網站上,這些圖片明顯是 ChatGPT 片段的截圖。
揭開謎團之後,他發現 ChatGPT 已成為他公司最大的宣傳者之一 - 不幸的是,它也在散播關於他應用程式實際功能的錯誤資訊。
眾所周知,Holovaty 是 Django 計畫的共同創造者,這是一個廣受歡迎的開放源碼 Python 網路框架(雖然他在 2014 年退出管理)。他在 2012 年創立了 Soundslice,他向 TechCrunch 確認這家公司是「引以為傲的自負盈虧」。如今,他的重心分佈在音樂事業與創業事業之間。
Soundslice 是一款音樂教育應用程式,學生和老師都在使用。它尤其以視訊播放器聞名,可與音樂記號無縫同步,準確地向使用者展示如何彈奏音符。
該應用程式還包含「樂譜掃描器」功能。使用 AI,它可以讓使用者上傳印刷樂譜的影像,並自動將其轉換成包含所有記號的互動樂譜。
Holovaty 解釋說,他勤勉地監控此功能的錯誤記錄,以找出問題並指導未來的改進。
正是在這些記錄中,他第一次注意到上傳的 ChatGPT 會話截圖。
Techcrunch 活動TechCrunch All Stage 通票最高可省 475 美元
更聰明地建立。擴充更快。更深入地聯繫。與來自 Precursor Ventures、NEA、Index Ventures、Underscore VC 及其他領導公司的有遠見的人士一起,享受一天的策略性見解、實務研討會以及寶貴的人際網路。
TechCrunch All Stage 入場證可節省 450 美元
更聰明地建立。更快擴張。更深入地聯繫。與來自 Precursor Ventures、NEA、Index Ventures、Underscore VC 及其他領導公司的有遠見的人士一起,享受一天的策略性見解、實務研討會以及寶貴的人際網路。
馬薩諸塞州波士頓 | 7 月 15 日 立即報名這些上傳產生許多錯誤記錄。這些影像並未包含樂譜;相反地,它們顯示的是文字對話和被稱為 ASCII tablature 的符號方塊。這是一種簡單、以文字為基礎的吉他記號系統,使用標準的鍵盤字符。(畢竟,您不會在典型的 QWERTY 鍵盤上找到高音五線谱)。

Holovaty 指出,這些 ChatGPT 圖片的數量並不多,不足以造成顯著的儲存成本,也不會對他的應用程式頻寬造成壓力。正如他在一篇關於該事件的博文中所寫,他只是感到困惑。
"我們的掃描系統從來沒有被設計來處理這種類型的記事。那麼,為什麼我們會突然被 ChatGPT 的 ASCII 標籤截圖淹沒呢?我困惑了好幾個星期,直到我決定親自試用 ChatGPT。
這時他發現了問題所在:ChatGPT 指示人們只要建立一個 Soundslice 帳戶,並上傳聊天會話的截圖,就可以聆聽音樂。問題是,他們做不到。上傳這些影像並不能神奇地將 ASCII tablature 轉換成可播放的音訊。
這造成了新的聲譽問題。"主要的代價是我們的聲譽:新使用者帶著完全錯誤的期望來使用我們的產品。他告訴 TechCrunch:「他們很有信心地保證我們可以做到一些我們的應用程式根本做不到的事情。
他和他的團隊考慮了他們的選擇:在網站上貼滿免責聲明,說明他們無法將 ChatGPT 會話轉換成可聽的音樂,或者,建立實際支援這種不尋常記號系統的功能。
他決定建立這個功能。
"我對這件事的感覺很複雜。我很高興能提供一個工具來幫助人們。但我覺得我們是在一種非常奇怪的方式下受到壓力。他寫道:「公司真的應該直接針對 AI 產生的錯誤資訊來開發功能嗎?
他也質疑這是否是第一個公司因為 ChatGPT 屢次向大眾傳達其存在的幻覺,而不得不實作新功能的例子。
Hacker News 上的其他程式設計師提供了一個有趣的觀點:幾位程式設計師評論說,這情況與過度熱心的人肉推銷員對潛在客戶做出偉大承諾無異,然後就迫使開發團隊慌忙交付。
「我覺得這個比較非常貼切,也相當有趣!」Holovaty 表示同意。
Stability AI 推出一款能生成六分鐘歌曲的音訊模型
Stable Diffusion 的開發商 Stability AI 近日推出了一系列名為 Stability Audio 3.0 的新音訊模型。據該公司表示,其旗艦模型能夠生成長度超過六分鐘的專業級音樂曲目。在 Stability Audio 3.0 系列下,該公司推出了四款模型:小型 SFX(4.59 億參數)、小型(4.59 億參數)、中型(14 億參數)以及大型(27 億參數)。其中兩款小
OpenAI 與 Yubico 合作強化 ChatGPT 安全性,以提升帳戶保護
OpenAI 正採取重大措施來強化帳戶安全性。週四,該公司推出了「進階帳戶安全」功能,這是一套針對 ChatGPT 用戶的可選防護措施。雖然這些功能是為高知名度人士設計的,但任何尋求更強大安全保障的人士皆可使用。作為此項計畫的一環,數位安全公司 Yubico 宣布與 OpenAI 合作,將兩款新型安全金鑰產品整合至 ChatGPT 帳戶中。此項合作旨在保護使用者免受針對聊天機器人平台日益加劇的網路
OpenAI 推出整合銀行帳戶功能的 ChatGPT 個人理財版
上週五,OpenAI 為美國境內的 ChatGPT Pro 訂閱用戶推出了全新個人理財工具套件的預覽版。此功能讓使用者能連結自己的金融帳戶,並提出從消費分析到長期財務規劃等各類問題。為管理這些連結,OpenAI 與金融數據網路 Plaid 合作。用戶可連結來自超過 12,000 家金融機構的帳戶,包括查爾斯·施瓦布(Charles Schwab)、富達(Fidelity)、大通銀行(Chase)、
Ich hab mal Soundslice ausprobiert, echt coole Idee 🎸 Aber dass AI jetzt sogar so was zusammenfantasiert? Das ist schon ein bisschen beängstigend. Was, wenn Musiker ihre Ideen aus KI-Halluzinationen kriegen...? Auf jeden Fall ein krasses Beispiel für unerwartete Nebenwirkungen der Technologie. Ich frag mich, ob Google schon eine Lösung hat 🤔





首頁






