多模態模型

AWS發表該公司首款多模態模型Amazon Nova系列，於Amazon Bedrock平臺上提供給企業用戶

2024-12-04

蘋果揭露多模態模型MM1.5系列成果，還能處理行動裝置螢幕理解任務；兩位機器學習先鋒獲得諾貝爾物理獎；Meta預告影片生成AI模型Movie Gen；蘋果新模型1秒內將2D圖片轉為3D；可大幅改進AI模型運算效能！PyTorch釋出torchao函式庫

2024-10-11

微軟釋出小語言模型Phi-3家族第一個多模態模型Phi-3-vision，同時具備文字以及圖片識別能力，能根據用戶要求產出洞見與回答問題

2024-05-22

OpenAI宣布新一代多模態AI模型GPT-4o，將逐步提供給所有ChatGPT服務用戶，強調GPT-4o對聲音輸入產生回應的速度與人類對話反應時間一樣快

2024-05-14

Google ScreenAI模型結合視覺和語言處理能力，採用彈性區塊處理策略（Flexible Patching Strategy）強化，並且經特製資料集訓練，成為目前圖表理解能力最佳的模型

2024-03-22

最先採用Gemini 1.5模型的產品為Gemini 1.5 Pro，其標準脈絡長度為12.8萬個Token，Google計畫隨著模型的改善擴大到100萬個Token，將可一次處理1小時的影片、11小時的音訊或超過3萬行的程式碼

2024-02-16

Meta強調只用30億Token文字資料訓練的CM3Leon，在生成圖像說明、回答圖像問題任務表現上，與具備400億Token的OpenFlamingo相當

2023-07-17

iThome 研討會

iThome 鐵人講堂特別邀請歷屆得獎者分享技術內涵，讓我們用不同的方式繼續一同學習與成長！

日期: 每週三 13:00 開始直播

善用 GenAI 技術和工具，快速打造出更多高性價比的應用，不只是考驗企業的 AI 技術能力，更是基礎架構管理、雲原生開發能力、全方位資安與 IT 永續發展的挑戰。

日期: 即日起~01/08

邀您一同探討物聯網、數位孿生、生成式 AI 等新興技術如何推動製造業智能化升級！

日期: 12/10 (二) 14:00-16:30