AI推論 | iThome

WebAssembly封裝的AI代理程式檔案超小，更容易落地部署、快速啟動。這項雲原生新技術，在2025年將成為企業IT開發GAI應用的新主流

2024-12-27

AI推論程式碼、CUDA runtime、PyTorch框架和10GB的LLM基礎模型，用Wasm編譯後的Bytecod檔，可以大幅縮小到數MB，比同樣功能的容器或VM映像檔，足足少了1千倍，這正是Wasm冷啟動速度可以超級快的原因。

2024-11-29

Ampere將透過整合其Altra CPU及高通的Cloud AI 100 Ultra AI加速器，開發專為處理大型語言模型推論作業設計的資料中心伺服器晶片，以創造無GPU的AI推論

2024-05-20

數位經濟平臺Digiconomist、比特幣耗電量指數的創辦人Alex De Vries預估到了2027年，AI的用電量可能等同於荷蘭一年的電力使用

2023-10-12

今年9月，Nvidia推出新一代AI推論加速卡Tesla T4，導入最新發表的GPU架構Turing，強化多精度的運算效能

2018-11-29

iThome 研討會

iThome 鐵人講堂特別邀請歷屆得獎者分享技術內涵，讓我們用不同的方式繼續一同學習與成長！

日期: 每週三 13:00 開始直播

善用 GenAI 技術和工具，快速打造出更多高性價比的應用，不只是考驗企業的 AI 技術能力，更是基礎架構管理、雲原生開發能力、全方位資安與 IT 永續發展的挑戰。

日期: 即日起~01/22

在數位轉型浪潮中，AI 技術驅動企業創新，成為提升效能與競爭力的關鍵。從日常營運到供應鏈協作，溫室氣體排放的累積正成為企業面臨的重大挑戰，深刻影響其競爭力與永續發展。

日期: 3/7 (五) 09:00 ~ 16:30

我們誠摯邀請具有豐富實戰經驗的 DevOps 實踐者和技術專家，分享您的洞見與經驗。

日期: 即日起至 2 月 27 日