Blog

生成式AI在企業:機會與風險的平衡點

Blog Image
生成式AI在企業:機會與風險的平衡點

August 28, 2023

重點摘要:
這篇文章探討了生成式AI在企業應用中的機會和挑戰,提出了多種策略來平衡創新和風險。


  • 1. 數據安全與隱私問題:
  • 使用公開託管的大型語言模型(LLMs)可能會導致敏感和專有數據的安全、隱私和管理風險。
  • 2. 內部部署與自定義:
  • 企業可選擇在自己的安全邊界內部署和自定義LLMs,以保護數據並提供更精確的業務相關回應。
  • 3. 多模態AI與資源效率:
  • 企業應考慮使用多模態AI模型來處理非結構化數據,並優化模型以減少資源需求。



新聞內文:
各企業迅速意識到生成式AI揭露的新想法和開發人員和非開發人員的提高生產力的力量。但是,將敏感和專有數據輸入到公開託管的大型語言模型(LLMs)中會在安全、隱私和管理方面帶來重大風險。在這些強大的新技術能帶來任何效益之前,企業需要解決的是這些風險。

正如IDC所指出的,企業合法地關心LLMs可能會從其提示詞中「學習」,並將專有訊息洩露給輸入類似提示詞的其他企業中。企業還擔心他們分享的任何敏感數據可能會在線上儲存,並面臨被駭客攻擊或意外公開的風險。

這使得將數據和提示詞提供給公開託管的LLMs,對大多數企業來說是不可行的,尤其是受到監控的領域運營的企業。那麼,公司如何在充分減輕風險的同時從LLMs中提取價值?

在現有的安全和管控範圍內工作
與其將數據發送到LLM,不如將LLM引入到數據中。這是大多數企業將使用的模型,以在創新需求與保持客戶個人身份訊息和其他敏感數據安全性之間取得平衡。大多數大企業已經在其數據周圍建立了強大的安全和管制邊界,他們應該在受保護的環境中託管和部施LLM。這使得數據團隊能夠進一步開發和自定義LLM,員工可以在組織現有的安全邊界內與其互動。

強大的AI戰略需要從強大的數據戰略開始。這意味著消除訊息孤立,建立簡單一致的政策,並允許團隊在強大的安全和管制環境中訪問所需的數據。而最終目的是擁有可以在安全和有管制的環境中輕鬆訪問的可操作和可信賴的數據,以在LLM內使用。

架建特定領域的LLM
在整個網路上訓練的LLM不僅僅只帶來隱私挑戰而已。它們容易產生「虛擬」和其他不準確性,可能產生偏見和生成冒犯性的回應,這進一步為企業帶來風險。此外,基礎LLM還沒有接觸到您組織的內部系統和數據,這意味著它們無法回答與您的業務、客戶甚至可能是您行業相關的問題。

而擴展和自定義模型,使其對您自己的業務更加了解。雖然像ChatGPT等托管模型引起了大部分關注,但企業可以下載、自定義並在防火牆後使用一長串LLM,其中包括Hugging Face的StarCoder和Stability AI的StableLM等開源模型。在整個網路上調整基礎模型需要大量的數據和計算能力,但正如IDC所指出的那樣,「一旦生成模型訓練完成,它就可以在特定內容和領域中進行『微調』,而所需數據要少很多。」

LLM並不需要很大才能有用。「垃圾進,垃圾出」對任何AI模型都是成立的,企業應該使用內部數據來自定義模型,他們知道他們可以信任該數據並提供所需的見解。您的員工可能不需要問您的LLM如何「製作法式點心」或「父親節禮物」的想法,但是他們可能會想問一下西北地區的銷售情況,或特定客戶的合約所包括的好處。這些答案將來自在安全和有管控環境中調整您自己的數據的LLM。

除了高品質的結果,更能針對您的組織客製化
優化LLM還可以幫助減少資源需求。在企業中針對特定使用範例定位較小的模型,通常需要通用範例或大量不同行業企業的使用範例建立的模型更少的計算能力和較小的內存大小。使LLM更針對於您組織中的使用範例,將有助於以更具成本效益和高效能的方式運行LLM。

為多模態AI提供結構化數據
將模型調整為內部系統和數據需要參考可能對此目的有用的所有訊息,其中許多訊息將以文本以外的格式儲存。世界上約80%的數據是非結構化的,包括公司數據,如電子郵件、圖像、合約和培訓影片。

這需要使用自然語言處理等技術從非結構化來源中提取訊息,並將其提供給您的數據科學家,以便他們可以建立和訓練多模態AI模型,以發現不同類型數據之間的關係,並將這些見解呈現給您的業務。

謹慎行事
這是一個快速發展的領域,企業在采取生成式AI的任何方法時都必須謹慎行事。這意味著仔細閱讀有關使用的模型和服務的細節,並提供有關模型的明確保證和信譽良好的供應商合作。但這是一個公司不能停滯不前的工作,每家企業都應該探索AI如何顛覆其行業。必須在風險和回報之間取得平衡,通過將生成式AI模型置於數據附近並在現有的安全範圍內工作,您更有可能收獲這種新技術帶來的機會。

Torsten Grabs 是Snowflake的高級產品管理總監。

新聞原址: https://venturebeat.com/ai/how-to-minimize-data-risk-for-generative-ai-and-llms-in-the-enterprise/