Blog

AI技術的雙軌發展:通用語言模型與任務特定模型並行前進

Blog Image
AI技術的雙軌發展:通用語言模型與任務特定模型並行前進

December 2, 2023

重點摘要:
  1. 雖然通用語言模型(LLM)的崛起改變了人們對機器學習的看法,但針對特定任務的模型在企業中仍然發揮著重要作用。
  2. Amazon技術長Werner Vogels和AmazonBedrock總經理Atul Deo認為,任務特定模型仍是重要的AI工具,並不會因為通用模型的出現而消失。
  3. 儘管全用途模型具有吸引力,但任務特定模型因其專注性、效率和成本效益而仍有其獨特的地位和作用。



新聞內文:
記得一年前,回到去年11月之前,當機器學習主要是關於建立模型來解決單一任務,比如貸款批准或防止詐騙嗎?隨著通用語言模型(LLM)的崛起,這種方法似乎被拋在腦後,但事實是通用模型並不適用於每個問題,而基於任務的模型在企業中仍然活躍。

在通用模型崛起之前,這些基於任務的模型一直是企業中大多數AI的基礎,並且它們不會消失。Amazon技術長Werner Vogels在本週的主題演講中稱之為「傳統的AI」,在他看來,這種類型的AI仍然在解決許多現實世界的問題。

AmazonBedrock的總經理Atul Deo,該產品是今年早些時候通過API與各種大型語言模型連接的一種方式,也認為任務模型不會簡單地消失。相反,它們已經成為工具箱中的另一個AI工具。

Deo告訴TechCrunch:「在大型語言模型出現之前,我們大多處於一個特定任務的世界中。那裡的想法是為特定任務從頭開始訓練一個模型。」他說,任務模型和LLM之間的主要區別在於前者是為特定任務訓練的,而後者可以處理模型範圍之外的事物。

投資公司Madrona的合夥人Jon Turow,在AWS工作了將近十年之後,說該行業一直在討論大型語言模型的新能力,如推理和跨領域的韌性。他表示:「這些能力使您能夠擴展模型最初預期執行的狹義定義」。但他補充說,目前這些能力可以發展到多大程度仍然存在爭議。

像Deo一樣,Turow表示,任務模型不會突然消失。他說:「任務特定模型顯然仍然有一個角色,因為它們可以更小、更快、更便宜,有時甚至更高效,因為它們是為特定任務而設計的」。

但全用途模型的吸引力難以忽視。Deo說:「當您在公司的整體水平上看時,當有數百個機器學習模型分別訓練時,這是毫無道理的」。他說:「而如果您選擇了更具備能力的大型語言模型,您可以立即獲得可重用性的好處,同時可以使用單一模型應對各種不同的用例」。

對於Amazon來說,機器學習營運平台「SageMaker」仍然是一個關鍵產品,它針對的是數據科學家,而不是開發人員,就像Bedrock一樣。據報導,成千上萬的客戶正在建立數百萬個模型。放棄這一點是愚蠢的,而且坦率地說,即使LLM是當前大型語言模型的風格,以前的技術仍然在相當長的時間內保持相關性。

特別是企業軟體並不運作。沒有人會因為出現了新的事物,即使是像當前這一系列大型語言模型這樣強大的新事物,而放棄他們的重大投資。值得注意的是,Amazon本週宣布升級了SageMaker,旨在管理大型語言模型。在這些更有能力的大型語言模型出現之前,任務模型實際上是唯一的選擇,公司就是這樣來解決這個問題的,通過建立一支數據科學家團隊。在開發人員受眾化的時代,數據科學家的角色是什麼?Turow認為,即使在專注於LLM的公司中,他們仍然有重要的工作要做。

他說:「他們將對數據進行批判性思考,這實際上是一個正在增長而不是在縮小的角色」。無論是哪種模型,Turow都認為數據科學家將幫助人們理解大型企業內部AI和數據之間的關係。

他說:「我認為我們每個人都需要對AI的能力和無能力以及數據的含義和無義進行批判性思考」。而不管你是在構建更通用的大型語言模型還是任務模型,這都是真實的。這就是為什麼這兩種方法將繼續並行工作一段時間,因為有時候更大意味著更好,而有時候不是。

新聞原址: https://techcrunch.com/2023/12/01/good-old-fashioned-ai-remains-viable-in-spite-of-the-rise-of-llms/