OpenAI為GPT-3.5 Turbo引入了微調功能

Blog

August 23, 2023

OpenAI客戶現在可以將自定義數據引入輕量級版本的GPT-3.5 Turbo，從而更容易提高這款文字生成AI模型的可靠性，同時建立特定的行為。

OpenAI聲稱，經過微調的GPT-3.5版本在「某些局部性的任務」上可以甚至超越GPT-4，與公司的旗艦模型的基本能力相匹配。

公司在今天下午發表的一篇部落格文章中寫道：「自從推出GPT-3.5 Turbo以來，開發人員和企業一直在要求能夠自定義模型，為用戶創造獨特和差異化的體驗」。「此更新使開發人員能夠自定義模型，以更容易適應其利用，並在規模上運行這些自定義模型」。

通過微調，通過OpenAI的API使用GPT-3.5 Turbo的公司可以使模型更遵循指令，例如始終以特定語言回應。或者他們可以提高模型的一致性格式化回應的能力（例如完成代碼片段），以及提煉模型的輸出「感覺」，比如其語氣，使其更符合品牌或聲音。

此外，微調使OpenAI的客戶可以縮短文本提示以加快API調用速度並降低成本。在部落格文章中，OpenAI稱：「早期測試人員通過將指令微調到模型本身中，將提示大小減少了多達90％」。

該公司表示，目前微調需要準備數據及上傳必要的文件，並通過OpenAI的API創建微調作業。所有微調數據都必須通過「審查」API和由GPT-4提供支援的審查系統，以查看是否與OpenAI的安全標準相衝突。但是OpenAI計劃在未來推出微調UI，提供一個儀表板，用於檢查進行中的微調工作負載狀態。

微調的成本如下：

訓練：每1K Token 0.008美元
輸入使用：每1K Token0.012美元
輸出使用：每1K Token0.016美元

“Token”表示原始文本，例如單字“fantastic”的“fan”，“tas”和“tic”。根據OpenAI的說法，具有10萬Token的GPT-3.5Turbo微調作業，或約7.5萬字，將花費約2.40美元。

另外，OpenAI今天還提供了兩個更新的GPT-3基本模型（babbage-002和davinci-002），這些模型也可以進行微調，並且支援分頁和「更多可擴展性」。如先前宣布的，OpenAI計劃於2024年1月4日退役原始的GPT-3基本模型。

OpenAI表示，對於GPT-4的微調支持將在今年秋季的某個時候到來，但沒有提供更具體的細節。

新聞原址： https://techcrunch.com/2023/08/22/openai-brings-fine-tuning-to-gpt-3-5-turbo/

Watch more News：

馬斯克旗下xAI公司在印度推出高端AI服務Grok，但面臨代碼爭議
北京頒布了對AI的治理規則
AI人工智慧將如何重新塑造商業規則
自從推出以來，ChatGPT的爆炸性增長首次顯示出流量的下滑！
HealthifyMe推出AI驅動的「Snap」：讓卡路里追蹤適應印度多元飲食文化