Blog

Google推出Gemma:全新輕量級開放式模型,為AI應用程式開發帶來革命性可能性

Blog Image
Google推出Gemma:全新輕量級開放式模型,為AI應用程式開發帶來革命性可能性

February 23, 2024

重點摘要:

  1. Google推出了全新的輕量級開放式模型系列Gemini,並且在一週後推出了Gemma系列,其中包括Gemma 2B和Gemma 7B,這些模型可供商業和研究使用。
  2. Gemma模型雖然被稱為開放模型,但並不是開源的,開發人員可以使用這些模型進行推理和微調,但模型的使用條款因模型自身而異。
  3. Google強調,隨著生成模型品質的提高,現在可以使用小型模型實現以前只有大型模型才能做到的事情,這將為開發AI應用程式帶來新的可能性。

新聞內文:

Google今天宣布推出全新的輕量級開放式模型系列Gemini後,僅僅一週之後,就宣布推出了Gemma,這是一個全新的輕量級開放式模型系列。從Gemma 2B和Gemma 7B開始,這些新模型「靈感來自於Gemini」,並可供商業和研究使用。

Google並沒有向我們提供有關這些模型如何與Meta和Mistral等類似模型相比的詳細報告,只是指出它們是「最先進的」。公司確實指出,這些是密集的解碼器模型,這與它用於其Gemini模型(以及其早期的PaLM模型)的架構相同,我們將在今天稍後在Hugging Face的排行榜上看到基準測試結果。

要開始使用Gemma,開發人員可以獲得準備好的Colab和Kaggle筆記本,以及與Hugging Face、MaxText和Nvidia的NeMo集成。一旦預訓練和調整完畢,這些模型就可以在各處運行。

雖然Google強調這些是開放模型,但值得注意的是,它們並不是開源的。事實上,在今天宣布之前的新聞簡報中,Google的Jeanine Banks強調了公司對開源的承諾,但也指出Google在如何稱呼Gemma模型方面非常有意。

Banks表示:「開放模型現在在行業中已經相當普遍」。「這通常指的是開放權重模型,開發人員和研究人員可以根據模型自身的特定使用條款自定義和微調模型,但同時,再分配和開發的這些變體的所有權等使用條款因模型自身的特定使用條款而異。因此,我們看到了傳統上我們會稱之為開源的一些差異,我們決定將我們的Gemma模型稱為開放模型是最合適的」。

這意味著開發人員可以隨意使用該模型進行推理和微調,Google的團隊認為這些模型大小非常適合許多用例。

GoogleDeepMind產品管理總監Tris Warkentin表示:「過去一年,生成品質明顯的提高」。「以前只有非常大型模型才能做到的事情,現在可以使用最先進的小型模型實現。這解鎖了全新的開發AI應用程式的方式,我們對此非常興奮,包括能夠在當地開發者桌面或筆記本電腦上使用您的RTX GPU進行推理和調整,以及在GCP的單個主機上使用Cloud TPU」。

這對於這個領域中Google競爭對手的開放模型也是如此,因此我們將看到Gemma模型在實際情況中的表現如何。

除了新模型外,Google還發布了一個新的負責任的生成式AI工具包,以提供「指導和必要的工具,用於使用Gemma建立更安全的AI應用程式」,以及一個調試工具。

新聞原址: https://techcrunch.com/2024/02/21/google-launches-two-new-open-llms/