Blog

AWS推出Custom Model Import:專業生成式AI客製化解決方案

Blog Image
AWS推出Custom Model Import:專業生成式AI客製化解決方案

April 24, 2024

重點摘要:

  1. AWS宣布推出Custom Model Import功能,讓企業能夠將內部生成式AI模型導入到Bedrock平台中,擁有更廣泛的模型定制選項。
  2. Custom Model Import功能使企業可以在Bedrock平台上受益於相同的基礎設施,擴展知識、微調模型並實施保護措施,以適應他們的需求。
  3. 此舉目的在填補企業需求,並與競爭對手保持步伐,AWS強調其提供更廣泛、更深入的模型定制選項,並承諾繼續提供透明度和保護措施。



新聞內文:

AWS,Amazon的雲端計算業務,希望成為企業主持和調整其自定義生成式AI模型的首選地點。

今天,AWS宣布推出Custom Model Import(預覽版),這是AWS企業專注的生成式AI服務套組「Bedrock」中的一個新功能。這一功能允許組織將其內部的生成式AI模型導入並使用為完全受管的API。

一旦導入公司的專有模型,這些模型將受益於與Bedrock圖書館中的其他生成式AI模型相同的基礎設施(例如Meta的Llama 3或Anthropic的Claude 3)。他們還將獲得擴展知識、微調它們並實施保護措施以減輕它們的偏見的工具。

AWS生成式AI副總裁Vasi Philomin在接受TechCrunch採訪時表示:「有一些AWS客戶一直在使用其他工具在Bedrock之外微調或構建自己的模型」。「這種自定義模型導入功能使他們能夠將自己的專有模型帶到Bedrock上,並將它們與Bedrock上已經存在的所有其他模型放在一起,並使用它們與Bedrock上已經存在的所有其他工作流程」。

根據Intel旗下的AI專業子公司「Cnvrg」最近的一項民意調查,大多數企業正在透過架構自己的模型並對其進行細化以應用於他們的應用程式來處理生成式AI。根據該民意調查,企業表示,他們認為基礎設施,包括雲端計算基礎設施,是部署的最大障礙。

透過Custom Model Import,AWS目的在填補這一需求,同時與競爭對手保持步伐。(AmazonCEO安迪·賈西在最近的年度股東信中預示了這一點)

有段時間以來,Google的「Vertex AI」相當於Bedrock,允許客戶上傳生成式AI模型,定制它們並透過API提供服務。Databricks也一直提供工具集來託管
和調整自定義模型,包括最近發布的自己的DBRX。

當被問及Custom Model Import有何不同之處時,Philomin斷言,它以及Bedrock提供了比競爭對手更廣泛和更深入的模型定制選項,並補充說:「今天已有數萬客戶正在使用Bedrock」。

Philomin表示:「首先,Bedrock為客戶處理模型提供了幾種方法」。「其次,我們有許多關於這些模型的工作流程,現在客戶可以直接站在我們已經提供的所有其他模型旁邊。大多數人喜歡的一個關鍵點是,他們可以使用相同的工作流程在多個不同的模型之間進行實驗,然後從同一個地方將它們帶到生產中」。

那麼提到所暗示的模型定制選項是什麼?

Philomin指出了Guardrails,它允許Bedrock使用者配置閾值,以過濾模型的輸出、過濾出仇恨言論、暴力和私人個人或企業資訊。(生成式AI模型以問題方式進行著名的下軌道,包括泄露敏感訊息;AWS的模型也不例外)。他還強調了模型評估,這是Bedrock工具,客戶可以使用該工具來測試模型(或多個模型)在給定標準集合上的表現。

在經過幾個月的預覽之後,Guardrails和Model Evaluation現在都是通用的。

我不得不指出的是,Custom Model Import目前僅支持三種模型架構:Hugging Face的Flan-T5,Meta的Llama和Mistral的模型。此外,Vertex AI和其他競爭對手服務(包括Microsoft Azure上的AI開發工具)提供更多或更少可比的安全性和評估功能(請參見Azure AI內容安全性、Vertex中的模型評估等)。

然而,Bedrock獨有的是AWS的Titan生成式AI模型系列。並且,隨著Custom Model Import的推出,這方面有幾個值得注意的發展。

升級的Titan模型

Titan Image Generator,AWS的文本到圖像模型,現在在去年11月推出預覽版後已經普遍可用。與預覽版相比,Titan Image Generator在GA中可以生成更具「創造力」的圖像,Philomin沒有進一步詳細說明。

我問Philomin是否有更多關於Titan Image Generator是如何訓練的細節要分享。

在去年11月該模型首次亮相時,AWS對於它在訓練Titan Image Generator時使用了哪些確切數據的說法模糊。很少有供應商願意透露這樣的資訊;他們將訓練數據視為競爭優勢,因此將其與相關信息保持緊密。培訓數據的細節也是知識產權相關訴訟的潛在來源,這是不透露太多訊息的另一個不利因素。透過法院審理的幾個案例拒絕了供應商的合理使用辯護,主張文本到圖像工具在沒有藝術家的明確許可下複製藝術家的風格,並允許使用者生成與藝術家原始作品相似的新作品,而藝術家則沒有獲得任何付款。

Philomin只告訴我,AWS使用了第一方和授權的數據的組合。

他說:「我們有一些專有數據來源,但我們還許可了大量數據」。「我們實際上支付版權所有者的授權費,以便能夠使用他們的數據,我們與其中幾個人簽訂了合約」。

這比我們去年11月得到的更多細節。但我有種感覺,Philomin的答案不會滿足每個人,特別是那些主張在生成式AI模型訓練方面提供更大透明度的內容創作者和AI倫理學家。

在缺乏透明度的情況下,AWS表示,它將繼續提供一項豁免政策,該政策將在Titan模型(例如Titan Image Generator)生成可能侵犯版權的培訓示例時保護客戶。(包括Microsoft和Google在內的幾家競爭對手提供了類似的政策,涵蓋了他們的圖像生成模型)。

為了應對另一個迫切的倫理威脅(Deepfake),AWS表示,使用Titan Image Generator創作的圖像將像在預覽期間一樣附有「防篡改」的隱形浮水印。Philomin表示,隨著GA版本的發布,該浮水印在壓縮和其他圖像編輯和操作方面變得更加耐用。

進入不太具有爭議性的領域,我問Philomin是否像Google、OpenAI和其他公司一樣,正在探索影片生成技術,考慮到該技術的激動人心(和投資)。 Philomin沒有說AWS不會,但他也不願再透露更多訊息。

Philomin說:「顯然地,我們一直在努力看看客戶想要什麼新功能,影片生成在與客戶的對話中肯定會提到」。「我要求您繼續關注」。

在關於Titan的最後一則消息中,AWS推出了其Titan嵌入模型的第二代,Titan文本嵌入V2。該模型將文本轉換為數字表示,稱為「嵌入」,以支持搜索和個性化應用程式。第一代嵌入模型也是這樣做的,但AWS聲稱Titan文本嵌入V2在整體上更有效率、更具成本效益且更準確。

Philomin聲稱:「Embeddings V2模型的作用是將使用模型的整體儲存量減少多達四倍,同時保留了97%的準確性,這超過了其他相當的模型」。

我們將看看實際測試是否能夠證明這一點。

新聞原址: https://techcrunch.com/2024/04/23/amazon-wants-to-host-companies-custom-generative-ai-models/