OpenAI發布GPT-4：多方面升級，但還會做錯算術題

CADE METZ

2023年3月15日

舊金山——四個月前，舊金山的一家小公司推出了一款新型在線聊天機器人，成為科技行業的熱門話題。這款聊天機器人可以回答覆雜的問題、寫詩甚至模仿人類情感。

現在，該公司又推出了驅動其聊天機器人的技術的新版本。該系統將促使矽谷愈發增加在人工智慧上的押注，並決定誰將成為技術行業的下一代領導者。

OpenAI週二表示，它已經發布了一項名為GPT-4的技術。該公司擁有約375名員工，但得到了微軟和行業知名人士數十億美元的投資支持。GPT-4旨在成為驅動聊天機器人和從搜索引擎到網路私人輔導等各種其他系統的底層引擎。

大多數人將通過該公司的新版ChatGPT聊天機器人用到這項技術，而企業會將其整合到各種系統中，包括商業軟體和電子商務網站。微軟必應搜索引擎的部分用戶可以使用的聊天機器人已經由該技術驅動。

在短短几個月內，OpenAI的進步就讓科技行業身陷幾十年來最不可預測的時刻之一。許多行業領導者認為，人工智慧的發展代表了一種根本性的技術轉變，其重要性可媲美20世紀90年代初期網路瀏覽器的發明。這種快速進步讓計算機科學家感到驚訝。

GPT-4通過分析從互聯網上收集的大量數據來學習技能，在多個方面改進了驅動最初的ChatGPT功能的引擎。它更精確。例如，它可以在美國律師協會考試中取得高分，立即計算出某人的應納稅額，還能對圖像進行詳細的描述。

但OpenAI的新技術仍然存在一些奇怪的類似人類的缺點，這些缺點讓業內人士和使用過最新聊天機器人的人感到不安。它是某些學科的專家，而對另一些學科則是外行。它可以在標準化測試中比大多數人做得更好，並為醫生提供精確的醫療建議，但同時它連基礎的算術題都會做錯。

至少在目前看來，將自己的未來押在這項技術上的公司可能不得不忍受這種不精確，這在這個行業中一直是一種禁忌，該行業從一開始就建立在計算機比它的人類創造者更嚴謹的概念之上。

「我不想聽起來像是我們已經解決了推理或智能問題，我們當然還沒有解決這些問題，」OpenAI的CEO山姆·奧特曼在接受採訪時說。「但與現有的相比，這是向前邁出的一大步。」

其他科技公司可能會在一系列產品和服務中加入GPT-4的功能，包括微軟用於執行業務任務的軟體，以及希望為客戶提供虛擬試用產品新方式的電子商務網站。許多行業巨頭，如谷歌和Facebook的母公司Meta，也在開發自己的聊天機器人和人工智慧技術。

ChatGPT和類似技術已經在改變學生和教育工作者的行為，他們嘗試了解這些工具應該被接受還是禁止。由於該系統可以編程並執行其他業務任務，它們正處於令工作的本質發生轉變的臨界點。

即使是最出色的系統也傾向於輔助而不是取代熟練工人。這些系統不能取代醫生、律師或會計師。仍然需要專家來糾錯。但它們很快就會取代一些律師助理（這類工作由訓練有素的律師審查和修訂），許多人工智慧專家認為它們將取代在互聯網上的內容管理者。

「肯定會出現混亂，這意味著一些工作崗位會消失，一些新的工作崗位會出現，」OpenAI總裁格雷格·布羅克曼說。「但我認為，最終的結果是，進入門檻下降，專家的生產率提高。」

週二，OpenAI開始銷售GPT-4的訪問權限，以便企業和其他軟體開發人員可以在其基礎上構建自己的應用程序。該公司還利用這項技術構建了其受歡迎的聊天機器人的新版本，任何人只要購買ChatGPT Plus的訪問權就可以使用，這是一項每月收費20美元的訂閱服務。

和類似技術一樣，新系統有時也會「產生幻覺」。它會毫無徵兆地產生完全錯誤的信息。當被問及發布最新癌症研究成果的網站時，它可能會給出幾個不存在的網址。

GPT-4是一種神經網路，一種通過分析數據來學習技能的數學系統，這也是Siri等數字助理用來識別語音命令的技術，以及自動駕駛汽車用來識別行人的技術。

2018年左右，谷歌和OpenAI等公司開始構建神經網路，從大量數字文本中學習，包括書籍、維基百科文章、聊天記錄和其他發布到互聯網上的信息。它們被稱為大型語言模型(LLM)。

通過精確定位所有文本中的數十億種模式，大型語言模型學會了自己生成文本，包括推文、詩歌和計算機程序。OpenAI向大型語言模型注入了越來越多的數據，希望更多的數據意味著更好的答案。

最初的ChatGPT基於一個稱為GPT-3.5的大型語言模型。OpenAI的GPT-4學習的數據規模還要大得多。

OpenAI高管拒絕透露這款新型聊天機器人從多少數據中學習，但布羅克曼表示，數據集是「互聯網規模」的，這意味著它涵蓋了足夠多的網站，它們可以為互聯網所有英語使用者提供一個具有代表性的樣本。

GPT-4的新功能對於初次使用這項技術的普通人來說可能並不明顯。但隨著普通人和專家繼續使用這項服務，它們可能很快就會成為人們關注的焦點。

給它一篇來自《紐約時報》的長篇文章並要求它進行摘要，機器人幾乎每次都會給出精確的結果。如果在這份摘要中添加一些隨機的句子，並詢問聊天機器人修改後的摘要是否準確，它會指出，添加的句子是唯一不準確的地方。

GPT-4還可以對圖像做出響應。給出一張照片、圖表或示意圖，該技術可以提供詳細的、長達數段的圖像描述，並回答有關其內容的問題。這可能是一項對視力障礙者有用的技術。

OpenAI高管表示暫時不會發布該技術的圖像描述部分，因為他們不確定會被如何濫用。

構建和提供聊天機器人是非常昂貴的。由於OpenAI的新聊天機器人接受了更多的數據訓練，會增加公司的成本。OpenAI首席技術官米拉·穆拉蒂表示，如果該服務產生過多流量，公司可能會限制用戶使用該服務。

但從長遠來看，OpenAI計劃構建和部署能夠處理多種媒體類型的系統，包括聲音和影片，以及文本和圖像。

「我們可以把所有這些通用知識技能推廣到各種不同的領域，」布羅克曼說。「這會把技術帶入一個全新的領域。」