Blog

OpenAI為GPT-3.5 Turbo引入了微調功能

Blog Image
OpenAI為GPT-3.5 Turbo引入了微調功能

August 23, 2023

OpenAI客戶現在可以將自定義數據引入輕量級版本的GPT-3.5 Turbo,從而更容易提高這款文字生成AI模型的可靠性,同時建立特定的行為。



OpenAI聲稱,經過微調的GPT-3.5版本在「某些局部性的任務」上可以甚至超越GPT-4,與公司的旗艦模型的基本能力相匹配。

公司在今天下午發表的一篇部落格文章中寫道:「自從推出GPT-3.5 Turbo以來,開發人員和企業一直在要求能夠自定義模型,為用戶創造獨特和差異化的體驗」。「此更新使開發人員能夠自定義模型,以更容易適應其利用,並在規模上運行這些自定義模型」。

通過微調,通過OpenAI的API使用GPT-3.5 Turbo的公司可以使模型更遵循指令,例如始終以特定語言回應。或者他們可以提高模型的一致性格式化回應的能力(例如完成代碼片段),以及提煉模型的輸出「感覺」,比如其語氣,使其更符合品牌或聲音。

此外,微調使OpenAI的客戶可以縮短文本提示以加快API調用速度並降低成本。在部落格文章中,OpenAI稱:「早期測試人員通過將指令微調到模型本身中,將提示大小減少了多達90%」。

該公司表示,目前微調需要準備數據及上傳必要的文件,並通過OpenAI的API創建微調作業。所有微調數據都必須通過「審查」API和由GPT-4提供支援的審查系統,以查看是否與OpenAI的安全標準相衝突。但是OpenAI計劃在未來推出微調UI,提供一個儀表板,用於檢查進行中的微調工作負載狀態。

微調的成本如下:

  • 訓練:每1K Token 0.008美元
  • 輸入使用:每1K Token0.012美元
  • 輸出使用:每1K Token0.016美元

“Token”表示原始文本,例如單字“fantastic”的“fan”,“tas”和“tic”。根據OpenAI的說法,具有10萬Token的GPT-3.5Turbo微調作業,或約7.5萬字,將花費約2.40美元。

另外,OpenAI今天還提供了兩個更新的GPT-3基本模型(babbage-002和davinci-002),這些模型也可以進行微調,並且支援分頁和「更多可擴展性」。如先前宣布的,OpenAI計劃於2024年1月4日退役原始的GPT-3基本模型。

OpenAI表示,對於GPT-4的微調支持將在今年秋季的某個時候到來,但沒有提供更具體的細節。

新聞原址: https://techcrunch.com/2023/08/22/openai-brings-fine-tuning-to-gpt-3-5-turbo/