AI聊天機器人在創意思維上挑戰人類：誰才是真正的創意之王？

Blog

September 25, 2023

重點摘要：

最近的研究發現，大型語言模型（LLM）人工智慧聊天機器人在創意思維任務上可能優於普通人。
儘管如此，得分最高的人類參與者在這方面仍然優於最佳的AI聊天機器人。
研究僅考慮了與創意評估相關的單一任務表現，未來研究可能會探討如何將AI融入創意過程以提高人類表現。

新聞內文：
最近的一項研究將人工智慧聊天機器人與人類在創意思維任務中進行了比較，該任務要求參與者為日常物品設計替代用途（這是發散思維的一個示例），研究發現，大型語言模型（LLM）人工智慧聊天機器人可能會在這一任務上超越普通人。

然而，得分最高的人類參與者仍然優於最佳聊天機器人的回應。

「發散思維」是一種通常與創造力相關的思維過程，它涉及為特定任務生成許多不同的想法或解決方案。它通常通過「替代用途任務」（AUT）來評估，其中參與者被要求在短時間內為日常物品提出儘可能多的替代用途。

回應根據四個不同的類別進行評分：「流暢度、靈活性、獨創性和闡述性」。

米卡·科伊維斯托（Mika Koivisto）和西蒙內·格拉西尼（Simone Grassini）將256名人類參與者對四個物體（繩子、盒子、鉛筆和蠟燭）的AUT回應與三個人工智慧聊天機器人（ChatGPT3、ChatGPT4和Copy.Ai）的回應進行了比較。

作者通過對回應的獨創性進行評分，使用了語義距離（回應與物體原始用途的相關性有多高）和創意性。他們使用了一種計算方法來量化語義距離，刻度從0到2。同時，對回應的創意性進行了主觀評分，評分人員對回應的來源一無所知。

平均而言，聊天機器人生成的回應在語義距離（0.95 vs 0.91）和創意性（2.91 vs 2.47）兩方面都顯著高於人類回應。人類回應在這兩個方面具有更大的範圍，最低分比AI回應低得多，但最高分通常更高。

這些發現表明，人工智慧聊天機器人現在至少可以像普通人一樣產生創意思維。然而，作者指出，他們僅考慮了與創意評估相關的單一任務表現。未來的研究可以探討如何將人工智慧融入創意過程以提高人類的表現。

新聞原址： https://neurosciencenews.com/ai-chatbot-creative-thinking-23920/

Watch more News：

白宮表示：OpenAI、Google 等承諾為 AI 內容加上浮水印以保障安全
Instagram創新突破：推出可自訂「AI朋友」，但專家提醒需謹慎對待潛在風險
Google研究揭示AI技術局限，AGI夢想或需重新評估
Synthesia推出更新版本，創造更真實的人工智慧影片頭像
Google的全新AI筆記應用程式已經來臨，以下將說明為何「NotebookLM」如此重要，以及你為何應該使用它。