Blog

Elicit AI助手:顛覆科學文獻審查,提供更高效與可靠的研究流程

Blog Image
Elicit AI助手:顛覆科學文獻審查,提供更高效與可靠的研究流程

September 26, 2023

重點摘要:
  1. AI新創公司「Elicit」正在開發一個基於AI的研究助手,旨在簡化科學文獻審查的繁瑣工作。
  2. Elicit的工具能夠自動化文獻審查,包括查找相關論文、提取關鍵信息,並將這些信息組織成概念。
  3. Elicit已採取多種措施以確保其AI模型的可靠性,包括將模型的答案連結回科學文獻,以及試圖計算科學論文的總體「可信度」。

新聞內文:
對於研究人員來說,閱讀科學論文可能非常耗時。根據一項調查,科學家每周花費七個小時搜尋訊息。另一項調查表明,文獻的系統性審查(關於特定主題證據的學術綜合研究)對於一個五人研究團隊平均需要41周的時間。

但事實並非如此。

至少,這是來自AI新創公司「Elicit」的聲明,該公司的聯合創辦人安德烈亞斯·斯圖爾穆勒(Andreas Stuhlmüller)為科學家和研發實驗室設計了一個「研究助手」。 Elicit的支持者包括Fifty Years、Basis Set、Illusion以及天使投資者Jeff Dean(Google科學家)和Thomas Ebeling(前諾華蒂斯公司CEO),Elicit正在開發一個基於AI的工具,用於簡化文獻審查中的繁瑣工作。

斯圖爾穆勒在電子郵件訪談中告訴TechCrunch「Elicit是一個使用語言模型自動化科學研究的研究助手」。「具體來說,它通過查找相關論文、提取有關研究的關鍵訊息,並將資訊組織成概念來自動化文獻審查」。

Elicit是從Ought分拆出來的營利性企業,「Ought」是一個於2017年由斯圖爾穆勒創立的非營利性研究基金會,他曾是斯坦福計算和認知實驗室的研究員。Elicit的另一位聯合創辦人Jungwon Byun於2019年加入了這家新創公司,他曾在線上貸款公司「Upstart」擔任增長管理職位。

Elicit使用多種第一方和第三方模型,搜尋並發現論文中的概念,允許使用者提出問題,例如「肌酸的所有效應是什麼?」或「用於研究邏輯推理的數據集有哪些?」,並從學術文獻中獲得答案。

斯圖爾穆勒說「透過自動化系統性審查流程,我們可以立即製作為這些審查學術和行業研究機構提供節省成本和時間的功效」。「通過降低成本,我們打開了以前成本禁止的新用例,例如當領域中的知識狀態發生變化時即時更新」。


但是,您可能會問:「語言模型不是有捏造事實的傾向嗎?」確實如此。Meta旨在簡化科學研究的語言模型「Galactica」在推出僅三天後就被下架,因為發現該模型經常引用「看似正確但實際上並不屬實」的虛假研究論文。

然而,斯圖爾穆勒聲稱,Elicit已採取措施,以確保其AI比許多專門建立的平台更可靠。

首先,Elicit將其模型執行的複雜任務拆分為「人類可理解的」部分。這使Elicit能夠知道,不同模型生成摘要時多久會編造事實,並隨後幫助使用者「確定要檢查的答案」以及「何時檢查」。

此外,Elicit還試圖計算科學論文的總體「可信度」,考慮因素包括研究中進行的試驗體是否受控或隨機、資金來源和潛在的利益衝突,以及試驗的規模。

Elicit’s search tool for AI literature. Image Credits: Elicit

斯圖爾穆勒說「我們不提供聊天界面」。「Elicit使用者將語言模型應用為批處理工作...我們從不僅僅使用模型生成答案,我們總是將答案連結回科學文獻,以減少『幻覺』並便於檢查模型的工作」。

我並不一定認為Elicit已經解決了當今困擾語言模型的一些主要問題,因為它們很難掌握。但它的努力顯然引起了研究界的興趣,甚至可能是信任。

斯圖爾穆勒聲稱,每個月有超過200,000人在使用Elicit,年增長率為3倍(從2023年1月開始),來自世界銀行、Genentech和斯坦福等組織。他補充說道「我們的使用者要求支付更強大的功能,以及以更大的規模運行Elicit」。

顯然,正是這種動力促使Elicit進行首輪融資。由Fifty Years領投的900萬美元。此計劃將大部分新資金投入到「進一步開發Elicit的產品」以及「擴展Elicit的產品經理和軟體工程師團隊」。

那麼,Elicit的賺錢計劃是什麼?這是一個好問題。也是我直接的問斯圖爾穆勒的問題。他指出,Elicit的付費版本於本週推出,允許使用者以比免費版本所支援的更大規模搜索論文、提取數據並總結概念。長期計劃是將Elicit打造成一個研究和推理的通用工具,「一個整個企業都會為之付費的工具」。

Elicit的商業成功可能的一個障礙是像艾倫人工智慧研究所的「Open Language Model」等開源努力,旨在針對科學優化的大型語言模型做免費開發使用。但斯圖爾穆勒表示,他認為開源更多是「補充」而不是「威脅」。

斯圖爾穆勒表示「目前的主要競爭對手是人工勞動。被聘用來從論文中費力提取數據的研究助手」。「科學研究是一個巨大的市場,現階段研究工作流工具沒有主要的主流。這是我們將看到全新的以AI為先的工作流程出現的地方」。

新聞原址: https://techcrunch.com/2023/09/25/elicit-is-building-a-tool-to-automate-scientific-literature-review/