Blog

ElevenLabs的AI人工智慧語音生成工具正式推出測試版

Blog Image
ElevenLabs的AI人工智慧語音生成工具正式推出測試版

August 23, 2023

ElevenLabs,一個以AI為基礎的合成語音平台,今天正式推出其測試版,支援30多種語言。


 
使用公司內部開發的新AI模型,ElevenLabs表示,其工具現在能夠自動辨識多種語言,包括韓語、荷蘭語和越南語,並在這些語言中生成"情感豐富"的語音。
 
結合這款新模型,ElevenLabs的客戶可以利用該平台的語音模仿工具,在幾乎30種語言之間進行語音表達,而不必先輸入文字。
 
ElevenLabs的CEO兼聯合創辦人Mati Staniszewski在一份聲明中表示:「ElevenLabs的創立初衷是使所有內容在任何語言和任何語音下都能夠普遍使用。通過此次發佈,我們更接近實現這一項夢想,使和人類同等級的AI語音在每種方言中都可使用。我們的文本到語音生成工具有助於公平競爭,並將高品質的口語語音能力帶給所有的創作者。」
 
ElevenLabs由Staniszewski和他的童年朋友Piotr Dabkowski創立,Staniszewski之前曾在Palantir工作,而Dabkowski則是前Google員工。在過去幾個月中,ElevenLabs因多種原因而成為新聞焦點,有好的,也有令人厭惡的新聞。
 
受到在波蘭長大時觀看美國電影的平庸配音啟發,Staniszewski和Dabkowski設計了一個可以更容易完成這項工作的平台,當然,這也利用了AI技術。
 
ElevenLabs於一月底推出了測試版,由於其生成的語音品質高且是免費版本,迅速受到了關注。但正如前面所提到的,宣傳並不積極——特別是當有心人士可能將該平台使用在不良目的時。
 
留言板4chan,以其陰謀論內容而聞名,使用ElevenLabs的工具分享了模仿著名人物(如演員艾瑪·華森)的令人厭惡的訊息。此外,《The Verge》的James Vincent能夠使用ElevenLabs在幾秒鐘內模仿目標人物的聲音,生成內容包含威脅暴力、種族歧視和跨性別歧視的語音樣本。
 
ElevenLabs在回應中表示,他們將引入一套新的保護措施,例如將語音模仿限制為付費帳戶,並提供新的AI檢測工具。
 
然而,ElevenLabs尚未解決其平台和其他類似平台正在醞釀的另一個爭議:對配音行業的威脅。
 
Motherboard寫道,越來越多的配音演員被要求放棄對他們的聲音的權利,以便客戶可以使用AI生成合成版本,最終可能取代他們。與此同時,紐約時報看到的內部電子郵件顯示,全球最大的遊戲發行商之一Activision Blizzard正在研究用於AI輔助的"聲音模仿"工具。
 
ElevenLabs似乎認為這是事物自然的發展,並自豪其與出版商的合作,例如Storytel;媒體平台,如TheSoul Publishing和MNTN,用於有聲書和廣播內容;以及出版商,如Embark Studios和Paradox Interactive,用於動畫遊戲(Storytel和TheSoul Publishing是戰略投資者)。該公司聲稱,已經在創意、娛樂和出版領域有超過一百萬註冊用戶,他們創造了相當於十年的語音內容。
 
ElevenLabs最近從投資者那裡籌資了1900萬美元,包括Andreessen Horowitz和DeepMind的聯合創辦人Mustafa Suleyman,估計價值9900萬美元,計劃最終將其AI模型擴展到配音領域——跟隨像Papercup和Deepdub等新創公司的腳步,並建立所謂的"基礎",以能夠將情感和語調從一種語言轉移到另一種語言中。
 
此外,ElevenLabs表示,他們計劃引入一個機制,讓用戶可以在平台上共享語音,不過詳細細節尚不清楚。



新聞原址: https://techcrunch.com/2023/08/22/elevenlabs-voice-generating-tools-launch-out-of-beta/