| SwiftKV | Snowflake | LLM | 知識蒸餾

Snowflake開源可縮減LLM推論時間50%的SwiftKV模型

Snowflake在Hugging Face開源SwiftKV模型,透過模型重組與知識蒸餾,將輸入提示處理計算減半,提升大型語言模型推論效率至2倍,適用於高負載企業應用

2025-01-17

| MiniMax | 基準測試 | LLM

中國AI公司MiniMax推出新LLM,支援400萬Token與多模態應用

中國MiniMax推出MiniMax-01系列,語言模型支援400萬Token上下文處理,性能與頂尖模型相當,多模態模型專注文本與影像結合,適用智慧助理與多媒體生成,定價具競爭力但存政策風險

2025-01-17

| 數據集 | 迭代 | 模型 | 效能 | 數據 | LLM | AI開發 | LLM評估指標

以數據為中心的AI

與傳統的建模範式相比,什麼是以數據為中心的AI?我們該如何決定它是否適合某項專案?

2025-01-03

| LG | Exaone | LLM | 混合式AI | Copilot+ PC | AI PC

LG Gram筆電導入混合式AI,本地端執行自家Exaone開源模型

LG新Gram筆電支援Copilot+,採混合式人工智慧架構,在本地端執行自家Exaone開源模型,可進行離線人工智慧運算,也能連接雲端支援更高階的需求

2025-01-03

| 7-Zip | ACE | LLM

7-Zip傳存在零時差漏洞,7-Zip開發者駁斥此為假消息

7-Zip遭爆存在零時差漏洞,攻擊者可透過壓縮檔執行惡意程式碼,不過7-Zip開發者否認,指漏洞資訊有誤,並質疑是以大型語言模型生成

2025-01-02

| 酷澎 | 生成式AI | LLM | 軟體開發生命週期 | GPU

酷澎如何擁抱生成式AI,開發到應用技術細節一次看

在韓國電商市場具有領導地位的科技電商酷澎,如何以既有600多個ML專案為基礎,用生成式AI進一步強化零售大數據應用

2024-12-30

| IT周報 | Hugging Face | BERT | 序列 | LLM | google | 分詞 | Meta | 超高速顯微鏡

AI趨勢周報第265期:BERT的接班模型來了

Hugging Face聯手其他團隊開發ModernBERT模型;Google推出LLM事實基準測試和排行榜;Hugging Face:小模型可用更長的運算時間,得到更好的準確率;OpenAI公布最新旗艦模型o3;Meta BLT語言模型架構突破分詞技術極限;DeepSeek V3模型釋出

2024-12-29

| LLM | DeepSeek | LLaMA

DeepSeek V3多項測試指標領先Llama,中國語言模型引發言論自由與話語權討論

中國人工智慧公司DeepSeek推出具6,710億參數的語言模型DeepSeek V3,技術與效能暫時超越Llama等開放模型。不過,來自中國的語言模型因其審查機制,對全球華語世界的言論多樣性與話語權帶來潛在影響引發關注

2024-12-27

| IT周報 | Meta | AI代理 | LLM | 影像生成 | Anthropic | 小模型 | 生成式AI | 超級電腦 | Nvidia

AI趨勢周報第264期:從虛擬人到LLM社交智力測試,Meta開源9大研究成果

Meta一口氣開源9大研究成果;ChatGPT整合30多種第三方桌面應用程式;Nvidia推出輕巧實惠的生成式AI超級電腦;微軟發布140億參數小語言模型Phi-4;Google DeepMind推Veo 2影像生成模型;Anthropic推出Claude使用分析系統Clio

2024-12-20

| MLCommons | LLM | 安全風險 | 基準測試

MLCommons推出第一個LLM安全基準,促進AI風險評估標準化

MLCommons針對大型語言模型的安全性推出AILuminate基準測試,涵蓋12類潛在危險並進行獨立科學評估,Claude 3.5 Haiku、Claude 3.5 Sonnet、Gemma2 9B、Phi 3.5 MoE Instruct皆達非常好(Very Good)的等級

2024-12-08

| 竊資軟體 | PyPI | JarkaStealer | LLM | ChatGPT | Claude

出現命名意圖與兩大AI平臺混淆的可疑開發套件,目的是散播竊資軟體JarkaStealer

卡巴斯基的研究人員發現,有人假借提供能連接大型語言模型(LLM)的API工具為由,鎖定PyPI開發人員散布惡意套件,目的是散布名為JarkaStealer的竊資軟體

2024-11-25

| GAI | ERP | 鼎新 | LLM | LoRa | LLaMA

老牌本土ERP業者鼎新轉型GAI平臺商,揭露最新AI產品戰略

鼎新以開源商用模型LLaMA作為基礎模型,用自行搜集的產業領域知識、專業術語的素材,微調出一個鼎新大模型,再用LoRA架構的作法,以不同領域知識,訓練出不同領域、功能的小模型

2024-11-19