Blog

Liquid AI:MIT分支公司引領液態神經網路技術,開創AI未來新紀元

Blog Image
Liquid AI:MIT分支公司引領液態神經網路技術,開創AI未來新紀元

December 7, 2023

重點摘要:
  1. MIT分支公司「Liquid AI」宣布籌集3750萬美元資金,由機器人專家Daniela Rus共同創立,專注於開發基於液態神經網路的通用AI系統。
  2. 液態神經網路特點包括小尺寸、低計算需求和高可解釋性,能夠處理隨時間變化的數據,適用於多種應用,如自動駕駛和數據分析。
  3. Liquid AI的目標是商業化液態神經網路技術,提供本地和私有AI基礎架構以及平台,使客戶能夠根據需求構建自己的模型。



新聞內文:
MIT的一家分支公司,由機器人專家Daniela Rus共同創立,旨在構建由一種相對新型的AI模型稱為液態神經網路驅動的通用AI系統。

這家名為「Liquid AI」的分支公司今天早上從隱身模式中浮出水面,宣布已籌集了3750萬美元的資金,這對於一個兩階段的種子輪來說相當可觀,投資者包括OSS Capital、PagsGroup、WordPress的母公司Automattic、三星Next、Bold Capital Partners、ISAI Cap Venture以及像GitHub的共同創辦人Tom Preston Werner、Shopify的共同創辦人Tobias Lütke和Red Hat的共同創辦人Bob Young等天使投資者。

這筆資金使Liquid AI的後估值達到3.03億美元。

加入Liquid AI創始團隊的還有Ramin Hasani(執行長)、Mathias Lechner(技術主官)和Alexander Amini(科學主官)。Hasani曾是Vanguard的首席AI科學家,後來加入MIT擔任博士後研究員和研究助理,而Lechner和Amini則是長期在MIT進行研究的人,他們與Hasani和Rus一起為液態神經網路的發明做出了貢獻。

液態神經網路由受到方程式控制的「神經元」組成,這些方程式預測每個單獨神經元的隨時間變化的行為,就像大多數現代模型架構一樣。在術語「液態神經網路」中,「液態」指的是該架構的靈活性;受到線蟲的「大腦」啟發,不僅液態神經網路要比傳統的AI模型小得多,而且運行所需的計算能力要少得多。

將液態神經網路與典型的生成式AI模型進行比較可能有幫助。

將液態神經網路與典型的生成式AI模型進行比較可能有幫助。

GPT-3是OpenAI的文本生成、圖像分析模型GPT-4的前身,它包含約1750億個參數和約5萬個神經元。「參數」是模型從訓練數據中學到的部分,基本上定義了模型在解決問題(在GPT-3的情況下是生成文本)方面的技能。相比之下,用於像導航無人機穿越戶外環境等任務的液態神經網路可以只包含20000個參數甚至不到20個神經元。

一般來說,較少的參數和神經元意味著需要更少的計算資源來訓練和運行模型,這在當今AI計算資源有限的情況下是一個有吸引力的選擇。理論上,用於自動駕駛汽車的液態神經網路可以在樹莓派上運行,這是一個具體的例子。

液態神經網路的小尺寸和簡單的架構還具有可解釋性的額外優勢。這是合理的,因為理解液態神經網路內每個神經元的功能比理解GPT-3中的約5萬個神經元的功能更容易(儘管已經有相當成功的努力在這方面)。

現在,已經存在能夠自主駕駛、生成文本等的低參數模型。但液態神經網路所具有的不僅僅是低開銷。

液態神經網路的另一個吸引人且可以說是更獨特的特徵是它們具有隨時間自適應其「成功」的能力。這些網路考慮數據序列,而不是大多數模型處理的孤立片段或快照,並動態調整它們的神經元之間的訊號交換。這些特性使得液態神經網路能夠處理其周圍環境和情況的變化,即使它們沒有被訓練來預測這些變化,比如在自動駕駛的情境下,天氣條件的變化。

在測試中,液態神經網路在預測涵蓋了大氣化學到車輛交通的各種數據集中的未來數值方面超越了其他最先進的算法。但更令人印象深刻的是,在自主導航方面所取得的成就。

今年初,Rus和Liquid AI的團隊使用由專業人類無人機飛行員收集的數據來訓練液態神經網路。然後,他們在一系列戶外環境中對一組四旋翼機進行了長距離、目標跟蹤和其他測試,包括森林和擁擠的城市社區。

團隊表示,液態神經網路在導航方面超越了其他模型,成功做出了導致無人機在以前未曾探索過的空間中找到目標的決策,即使在噪音和其他挑戰存在的情況下。此外,液態神經網路是唯一能夠在未經任何微調的情況下可靠地推廣到未見過情景的模型。

無人機搜救、野生動物監測和交付是液態神經網路的更明顯的應用之一。但Rus和Liquid AI的團隊表示,這種架構適用於分析任何隨時間波動的現象,包括電力網格、醫學數據、金融交易和極端天氣模式。只要有包含序列數據的數據集,比如影片,液態神經網路都可以對其進行訓練。



那麼,創造這種功能強大的新(相對新的)架構的Liquid AI新創公司究竟希望實現什麼?簡單來說就是商業化。

Hasani表示:「(我們的競爭對手是)正在構建GPT的基金會模型公司」,雖然他沒有提及具體的名稱,但不那麼含蓄地指向了OpenAI及其眾多競爭對手(例如Anthropic、Stability AI、Cohere、AI21 Labs等)在生成式AI領域。種子輪的資金將使我們能夠建立優於GPT的新型液態基礎模型。

可以預想,液態神經網路的架構工作將繼續進行。就在2022年,Rus的實驗室找到了一種方法,可以將液態神經網路的規模大大擴展到以前計算上實際的範圍之外;其他突破可能仍然潛伏在地平線上。

除了設計和訓練新模型外,Liquid AI計劃為客戶提供本地和私有AI基礎架構以及一個平台,該平台將使這些客戶能夠根據他們所想像的任何用例來構建自己的模型,當然要受Liquid AI的條款約束。

Hasani補充說:「大型AI模型的責任和安全性至關重要」。「Liquid AI提供了更具資本效益、可靠、可解釋且功能強大的機器學習模型,適用於特定領域和生成式AI應用」。

Liquid AI在波士頓和Palo Alto都有團隊,目前有12名成員。Hasani預計到明年初這個數字將增加到20人。

新聞原址: https://techcrunch.com/2023/12/06/liquid-ai-a-new-mit-spinoff-wants-to-build-an-entirely-new-type-of-ai/