快訊

川普國會演說提對等關稅如期上路 點名歐盟、印度、南韓

曹啟泰大年夜驚傳中風 「還能留著這條命…不容易」

成本低廉 中國AI初創DeepSeek震撼矽谷

中國AI新創公司DeepSeek先後發布兩款大模型,由於成本低廉,性能與OpenAI相當,中媒指此舉引發矽谷震驚,甚至引發Meta內部焦慮。(DeepSeek官網)
中國AI新創公司DeepSeek先後發布兩款大模型,由於成本低廉,性能與OpenAI相當,中媒指此舉引發矽谷震驚,甚至引發Meta內部焦慮。(DeepSeek官網)

中國AI新創公司「深度求索」(DeepSeek)近期先後發布「DeepSeek-V3」和「DeepSeek-R1」兩款大模型,由於成本低廉,性能與OpenAI相當,讓矽谷震驚,甚至引發Meta內部的恐慌。分析認為,總部位於杭州的DeepSeek可能將改寫AI大模型領域的遊戲規則。

財聯社報導,甚至有投資者將輝達上周五重挫3.12%的原因指向DeepSeek的一夜爆火。德國「世界報」知名市場評論員Holger Zschaepitz表示:「中國的DeepSeek可能代表對美國股市的最大威脅,因為該公司似乎以極低的成本構建了一個突破性的人工智慧模型,並且無需使用尖端晶片。這讓人質疑投入該行業的數千億美元資本支出的實際效用。」

據報導,DeepSeek僅用2048片H800顯示卡 (GPU)、耗時兩個月,就訓練出了一個6710億參數的DeepSeek-V3。相較於Meta訓練參數量4050億的Llama 3,用了1萬6384片更強的H100顯示卡,花了54天。DeepSeek的訓練效率提升了11倍。

中媒「每日經濟新聞」26日報導稱,在川普總統宣布5000億美元的「星際之門」(Stargate)發展人工智慧基礎建設計畫之際,DeepSeek以極低的價格建立了突破性的AI模型,且未使用尖端晶片,讓人們質疑,AI行業數千億美元資本的巨額投入,是否真為最有效的方法?

報導回顧,去年12月27日,DeepSeek推出開源模型「DeepSeek-V3」。AI系統排名網站「聊天機器人競技場」(Chatbot Arena)顯示,「DeepSeek-V3」在所有模型中排名第七,在開源模型排第一。且「DeepSeek-V3」是全球前十中,性價比最高的模型。

不到一個月,今年1月20日,DeepSeek再推出「DeepSeek-R1」,24日「DeepSeek-R1」在聊天機器人競技場綜合榜單上排名第三,與頂尖推理模型、OpenAI推出的o1並列。同時,測評機構「Artificial-Analysis」對「DeepSeek-R1」的初始基準測試結果也顯示,「DeepSeek-R1」在AI分析質量指數中取得第二高分,價格則是o1的約30分之1。

「每日經濟新聞」稱,24日一篇發布在匿名平台teamblind上的文章瘋傳,一位自稱是Meta員工稱,Meta內部因為DeepSeek模型進入恐慌模式,該文員工寫道,「DeepSeek-V3」在基準測試中,已經讓(Meta推出的)Llama 4相形見絀,而更讓人難堪的是,一家「僅用550萬美元訓練預算的中國公司」就做到了這一點。

該匿名文指,工程師正爭分奪秒分析DeepSeek,試圖複製其中的一切可能技術。另外,「DeepSeek-R1」的出現,也讓情況更加嚴峻。

然而,美國人工智慧數據基礎設施新創公司Scale AI執行長Alexandr Wang最近接受CNBC採訪時爆料,DeepSeek擁有大約五萬個輝達最先進的H100 GPU,並指「但是很明顯他們不能說出來,因為這違反了美國所實施的出口管制,我相信他們擁有比外界想像的更多,他們未來會被晶片管制,和出口管制所限制」。

AI 晶片 人工智慧

上一則

香港維園年宵市場人氣旺 花檔慨嘆買食物居多

下一則

與基層吃團年飯 李家超:今年再增3社區客廳 年中運作

世界新聞網為提供更佳的網站體驗,採cookies分析。如繼續瀏覽本網站即表示您同意我們使用cookies。
更多cookies、隱私權聲明可參考我們的「 隱私權與條款more > Worldjournal.com use cookies to improve your experience on our site. By using this site, you agree to our use of cookies.To find out more, read our update privacy policy.

我知道了
Close Ad
Ads
google' + 'tag.cmd.' + 'push(func' + 'tion() { google' + 'tag.displ' + 'ay('intercode'); });