Blog

Stability AI推出創新影片生成AI模型,面臨財務與道德挑戰

Blog Image
Stability AI推出創新影片生成AI模型,面臨財務與道德挑戰

November 22, 2023

重點摘要:
  1. Stability AI」宣布推出「Stable Video Diffusion」,一款能將現有圖像動畫化以生成影片的AI模型,目前處於「研究預覽」階段,使用者需同意特定使用條款。
  2. 「Stable Video Diffusion」面臨潛在的濫用風險,尤其是在沒有內建內容過濾器的情況下,可能被用於創造不當內容。
  3. Stability AI面臨財務壓力,正在尋求新的融資途徑,同時也面臨版權和數據使用的道德爭議,導致關鍵人物離職。



新聞內文:
AI新創公司似乎本週一直在繼續推動他們的產品路線,即使OpenAI的混亂在媒體上佔據掉主要版面。

例如「Stability AI」,他們今天宣布了「Stable Video Diffusion」,這是一個透過將現有圖像進行動畫處理來生成影片的AI模型。基於Stability現有的Stable Diffusion文本到圖像模型,Stable Video Diffusion是少數幾個在開源或商業上可用的影片生成模型之一。

但它並非所有人都可以使用。

Stable Video Diffusion目前處於Stability所描述的「研究預覽」階段。希望運行該模型的人必須同意某些使用條款,其中概述了Stable Video Diffusion的預期應用(如「教育或創意工具」、「設計和其他藝術過程」等)和非預期應用(「人或事件的事實或真實表示」)。



鑒於其他類似的AI研究預覽(包括Stability自己的預覽)在歷史上的表現,作者將不會對模型很快開始在暗網上流傳感到驚訝。如果發生這種情況,我會擔心Stable Video可能被濫用的方式,因為它似乎沒有內建的內容過濾器。當Stable Diffusion發布時不久後,就有一些擁有可疑意圖的人使用它來創造非自願的深度偽造色情內容,甚至比這個更糟。

但我偏離了主題。

實際上,Stable Video Diffusion以兩個模型的形式存在,「SVD」和「SVD-XT」。第一個「SVD」將靜止圖像轉換為14幀的576x1024影片。「SVD-XT」使用相同的架構,但增加了到24幀。兩者都可以以每秒3到30幀生成影片。

根據Stable Video Diffusion發布的一份白皮書,SVD和SVD-XT最初是在數百萬個影片的數據庫上進行培訓,然後在數十萬到一百萬個剪輯的較小集上進行了「精煉」。這些影片來源並不清楚,因此無法確定其中是否有版權。如果有,它可能會使Stability和Stable Video Diffusion的使用者面臨有關使用權利的法律和道德挑戰。而這些只有時間能夠證明。

「SVD」和「SVD-XT」都能生成相當高品質的四秒片段

無論培訓數據的來源是什麼,「SVD」和「SVD-XT」都能生成相當高品質的四秒片段。根據作者的估算,Stability部落格上挑選出的樣本,可以與Meta最近的影片生成模型及我們從Google以及AI新創公司「Runway」和「Pika Labs」看到的AI生成的範例一較高下。

但Stable Video Diffusion也有一些限制。Stability對此非常清楚,並在模型的Hugging Face頁面上寫道:「研究人員可以申請使用Stable Video Diffusion的頁面」。這些模型無法生成無運動或緩慢鏡頭移動的影片,也無法受到文本的控制,不能呈現文本(至少不能清晰呈現),也無法一致地生成面孔和人物。

儘管還處於早期階段,但Stability指出這些模型相當具有擴展性,可以適應生成物體的360度視圖等用例。

那麼Stable Video Diffusion可能會發展成什麼呢?Stability表示,他們計劃「各種」模型,這些模型「建立並擴展了」SVD和SVD-XT,還有一個「文本到影片」工具,將文本提示引入網路模型。最終目標似乎是商業化。Stability正確指出,Stable Video Diffusion在「廣告、教育、娛樂等領域」具有潛在應用。

當新創公司的投資者加大了壓力,Stability顯然在追求一個成功。

今年4月,Semafor報導稱,Stability AI正在燃燒資金,促使公司加快銷售。據福布斯報導,該公司多次延遲或根本未支付工資和工資稅,導致AWS (Stability用於訓練其模型的計算的計算資源供應商)威脅撤銷Stability對其GPU實例的使用權限。

「SVD」和「SVD-XT」都能生成相當高品質的四秒片段

Stability AI最近透過可轉換票據(即轉換為股權的債務)籌集了2500萬美元,使其總籌集金額超過1.25億美元。但它沒有以更高的估值完成新的融資;該新創公司最後一次估值為10億美元。儘管收入持續偏低且燒錢速度高,但Stability被認為正在尋求在未來幾個月內將其估值增加四倍。

Stability最近受到另一打擊,副總裁Ed Newton-Rex離職,他在該新創公司工作了一年多,對Stability音樂生成工具「Stable Audio」的推出起到了關鍵作用。在一封公開信中,Newton-Rex表示,他離開Stability是因為對版權以及如何使用版權數據來訓練AI模型的爭議。

新聞原址: https://techcrunch.com/2023/11/21/stability-ai-gets-into-the-video-generating-game/