Blog

ElevenLabs成功完成8000萬美元融資,領先合成語音領域,引發安全和道德疑慮

Blog Image
ElevenLabs成功完成8000萬美元融資,領先合成語音領域,引發安全和道德疑慮

January 23, 2024

重點摘要:

  1. ElevenLabs,一家專注於合成語音的AI工具開發新創公司,成功完成8000萬美元的B輪融資,總融資額超過1.01億美元,估值超過10億美元,由知名投資者領投,資金將用於產品開發、基礎設施擴展和AI研究。
  2. ElevenLabs最著名的產品是基於瀏覽器的語音生成應用程式,可以創作逼真的聲音,應用範圍包括有聲書、配音、遊戲和市場活動。
  3. 其中一個爭議是ElevenLabs被用於生成具有惡意內容的語音,導致一些使用者擔憂安全性和道德性問題,但公司表示將改進檢測工具來解決這個問題,並建立聲音市場以賠償原始創作者。



新聞內文:

有相當多的錢投進了語音複製領域。

以「ElevenLabs」為例,這家開發AI工具以創作和編輯合成語音的新創公司今天宣布,已成功完成一輪8000萬美元的B輪融資,由包括Andreessen Horowitz、前GitHub CEO Nat Friedman和企業家Daniel Gross在內的知名投資者共同領投。

此輪融資還有Sequoia Capital、Smash Capital、SV Angel、BroadLight Capital和 Credo Ventures參與,將ElevenLabs的總融資額提高到1.01億美元,公司估值超過10億美元(較去年6月的約1億美元增長)。CEO Mati Staniszewski表示,新的資金將用於產品開發、擴展ElevenLabs的基礎設施和團隊、AI研究及「提高安全措施,確保負責任和道德的AI技術發展」。

Staniszewski在郵件訪談中告訴TechCrunch:「我們籌集了新資金,以鞏固 ElevenLabs 在全球語音 AI 研究和產品部署方面的領先地位」。

ElevenLabs成立於2022年,由前Google機器學習工程師Piotr Dabkowski和前 Palantir部署策略師Staniszewski 共同創辦,大約一年前推出了beta版本。

Staniszewski表示,他和在波蘭長大的Dabkowski受到了糟糕的美國電影配音啟發,認為「AI可以做得更好」。

如今,ElevenLabs最著名的產品可能是其基於瀏覽器的語音生成應用程式,該應用程式可以使用可調整方塊創作具有語調、情感、韻律和其他關鍵語音特徵的逼真聲音。免費使用者可以輸入文本,然後獲得由數個默認聲音之一朗讀的錄音。付費使用者可以上傳語音樣本,使用ElevenLabs的語音複製工具製作新風格。

ElevenLabs投資越來越多在其針對創作有聲書和配音電影和電視節目的語音生成技術版本,以及為遊戲和市場活動生成角色聲音。

去年,該公司推出了一個「語音對語音」的工具,該工具試圖保留說話者的聲音、語調和韻律,同時自動消除背景噪音,並在電影和電視節目的情況下將語音翻譯並與源材料同步。未來幾週內,ElevenLabs路線圖上將推出一個新的配音工作流程,提供生成和編輯逐字稿和翻譯的工具,以及一個基於訂閱的移動應用程式,該應用程式使用ElevenLabs聲音朗讀網頁和文本。

ElevenLabs的創新贏得了這家新創公司的客戶,包括遊戲開發商Paradox Interactive(最近的項目包括Cities: Skylines II和Stellaris)及The Washington Post,還有其他出版、媒體和娛樂公司。Staniszewski聲稱,ElevenLab使用者已經生成了相當於100多年的語音內容,並且該平台被41%的前500大公司的員工使用。

但他的宣傳並不完全正面。

臭名昭著的「4chan訊息板」,以其陰謀性內容而聞名,使用了ElevenLabs的工具來分享模仿像女演員Emma Watson之類的名人來表達令人討厭的訊息。「The Verge」的James Vincent能夠迅速使用ElevenLabs來惡意複製聲音,生成包含暴力威脅、種族主義和跨性別不當言論等內容的示例。此外,Vice的記者Joseph Cox還記錄了生成一個「逼真的複製以欺騙銀行身份驗證系統的案例」。

作為回應,ElevenLabs 試圖根除多次違反其服務條款的使用者,該條款禁止濫用,並推出了一個工具,可以檢測其平台生成的語音。Staniszewski表示,今年,ElevenLabs計劃改進檢測工具,以檢測其他語音生成AI模型生成的語音,並與未具名的「分發方」合作,使該工具可以在第三方平台上使用。

ElevenLabs offers an array of different voices, some synthetic, some cloned from voice actors. Image Credits: ElevenLabs

ElevenLabs也面臨著聲優的批評,他們聲稱該公司未經他們的同意使用了他們的聲音樣本,這些樣本可以用來推廣他們不贊同的內容或傳播錯誤和偽造訊息。在一篇最近的Vice文章中,受害者回憶了ElevenLabs如何在針對他們的騷擾活動中被使用,例如使用複製語音分享演員的私人訊息,包括家庭地址。

然後,還有一個不容忽視的問題:像ElevenLabs這樣的平台對聲優行業將構成的威脅。

Motherboard寫到,越來越多地聲優被要求放棄他們的聲音權利,以便使用者可以使用AI生成合成版本,最終可能取而代之,有時甚至沒有相應的補償。人們擔心,聲音工作(特別是便宜的初階工作)最終將被AI生成的聲音取代,而聲優將無法追索權益。

一些平台正試圖取得平衡。本月初,ElevenLabs的競爭對手「Replica Studios」簽署了與SAG-AFTRA的協議,以創造和許可媒體藝術家工會成員的數位副本聲音。在一份新聞稿中,這些組織表示,該安排建立了「公平」和「道德」的條款和條件,以確保表演者同意,並協商新作品中使用數位聲音替身的條款。

然而,這也不能滿足一些聲優的要求,包括SAG-AFTRA的會員。

Staniszewski 表示,ElevenLabs的解決方案是聲音市場。目前處於測試階段,將在未來幾週內更廣泛地提供給使用者,市場允許使用者創作、驗證和共享聲音。當其他人使用一個聲音時,原始創作者會收到補償。

他補充說:「使用者始終掌握對其聲音的可用性和補償條款的控制權。市場被設計為將AI的進步與既定的行業慣例相協調,同時也將多樣化的聲音帶到ElevenLabs的平台」。

然而,聲優可能對目前的設置有意見,因為ElevenLabs目前並不支援現金支付,至少目前不是。目前的設置使創作者獲得ElevenLabs高階服務的積分(有些人可能覺得有點諷刺)。

也許在將來ElevenLabs(現在是資金最充足的合成語音新創公司之一)嘗試擊敗像Papercup、Deepdub、Acapela、Respeecher和Voice.ai以及大型科技龍頭Amazon、Microsoft和Google等新興競爭對手時,情況會發生變化。無論如何,ElevenLabs打算繼續存在,並在快速增長的合成語音市場上掀起波瀾。

新聞原址: https://techcrunch.com/2024/01/22/voice-cloning-startup-elevenlabs-lands-80m-achieves-unicorn-status/