開源模型 | iThome

阿里巴巴的Qwen Team釋出QwQ-32B-Preview，這個強調推論能力的實驗性研究模型，在AIME及MATH-500基準測試上的表現，勝過了OpenAI的o1-preview

2024-11-29

6月發布開源版圖像生成模型Stable Diffusion 3 Medium慘收負評後，Stability AI企圖以重新打造的Stable Diffusion 3.5模型挽回聲譽

2024-10-23

NVLM 1.0在光學字元辨識以及自然圖像理解的基準測試上，表現優於Llama 3-V、GPT-4o、Claude 3.5 Sonnet及Gemini 1.5 Pro

2024-10-02

Meta強調相較於GPT-4o與Claude Sonnet等封閉性模型，規模涵括80億到4千億個參數的Llama 3.1家族除了具備更好的成本與性能，模型的開放性也成為外界微調出小模型的最好選擇

2024-07-24

Nemotron-4 340B家族包含了基礎模型、指令模型及獎勵模型，其中指令模型可用來生成大型語言模型的訓練資料

2024-06-17

Mistral AI以Apache 2.0授權釋出Mixtral 8x22B模型，Mixtral 8x22B支援1,760億個參數，以及6.5萬個Token的脈絡長度，成為目前最大的開源模型之一

2024-04-11

根據Google公布的測試數據，Gemma 7B在推論、數學、撰寫程式上，超越Llama 2 7B以及Mistral 7B

2024-02-22

iThome 研討會

iThome 鐵人講堂特別邀請歷屆得獎者分享技術內涵，讓我們用不同的方式繼續一同學習與成長！

日期: 每週三 13:00 開始直播

善用 GenAI 技術和工具，快速打造出更多高性價比的應用，不只是考驗企業的 AI 技術能力，更是基礎架構管理、雲原生開發能力、全方位資安與 IT 永續發展的挑戰。

日期: 即日起~01/22

在數位轉型浪潮中，AI 技術驅動企業創新，成為提升效能與競爭力的關鍵。從日常營運到供應鏈協作，溫室氣體排放的累積正成為企業面臨的重大挑戰，深刻影響其競爭力與永續發展。

日期: 3/7 (五) 09:00 ~ 16:30

我們誠摯邀請具有豐富實戰經驗的 DevOps 實踐者和技術專家，分享您的洞見與經驗。

日期: 即日起至 2 月 27 日