多模態 | iThome

史丹佛大學整合卷積網路和邏輯閘網路，打造比電腦視覺SOTA模型快上1,900倍的LogicTreeNet；DeepMind開源學術版AlphaFold 3模型；工研院建AI測試實驗室；微軟開源多代理AI系統；GitHub發布Java專用助理；Hugging Face發表輕量級小型語言模型

2024-11-14

| 蘋果 | 多模態 | Massively Multimodal Masked Modeling | 4M | 4M-21

蘋果展示多模態AI訓練框架4M、支援21種模態的AI模型

蘋果發表專門訓練多模態模型的AI框架4M，以及運用4M訓練而成的any to any視覺模型4M-21，可支援21種模態資料

2024-07-03

【西雅圖現場直擊】微軟揭露新一代AI筆電Copilot+ PC，不只更快更有效率還內建40多個AI模型和3大AI App

微軟在年度大會Build 2024前一天揭露新一代NPU加速的AI筆電，稱之為Copilot+ PC，主打內建40多個地端AI模型和原生AI App，包括能快速找出所需資訊的回顧（Recall）、圖像創作Cocreator以及能將40多種語言即時翻譯為英文的即時字幕（Live Caption），此外還有不少AI加持的新功能。這系列筆電預計6月18日開始上市。

2024-05-21

| IT周報 | AI | 基因編輯 | 小型語言模型 | LLM | 多模態 | AI安全性

AI趨勢周報第251期：美國新創用LLM設計出人類基因編輯器

生醫新創Profluence用LLM生成一套基因編輯器並開源；以假亂真！微軟VASA-1 AI框架可即時生成超逼真對嘴人像；微軟發表小語言模型Phi-3系列模型；英特爾揭露全球最大神經型態系統Hala Point；Meta開源最新大型語言模型Llama 3

2024-04-25

| AI | MedLM | 中醫大附醫 | 護理 | 傷口 | LLM | 多模態

中醫大附醫揭露MedLM應用新進展，瞄準AI護理輔助3場景

繼去年12月揭露AI輔助醫師應用後，中醫大附醫今日再發表Google MedLM另一應用方向，鎖定護理領域打造AI輔助護理師應用，初期嘗試3情境，包括分析傷口照片和疼痛患者表情照片，來給出文字描述、照護建議和衛教建議，以及針對食物照片進行營養分析。

2024-02-21

| IT周報 | LLM | 擴展法則 | MosaicML | 摩根大通 | 多模態 | 金管會 | TinyGPT-V | 蘋果

AI趨勢周報第238期：突破LLM擴展法則？MosaicML揭新研究成果

MosaicML研究發現，用更長的時間和更多資料訓練小參數模型，可突破LLM擴展法則；摩根大通發表懂圖文的輕量級多模態模型DocLLM；研究員開源28億參數多模態小模型TinyGPT-V；金管會發布金融業運用AI指引草案；蘋果公布多模態AI模型Ferret

2024-01-07

| IT周報 | 微軟 | 多模態 | google | Youtube | GAN | 輕量化

AI趨勢周報第229期：生成排版文件也可以！微軟發表多模態模型Kosmos-2.5

微軟發表多模態模型Kosmos-2.5，可生成排版文字區塊和Markdown格式的文字內容；Google開發逐步蒸餾技術，小資料小模型也能打敗LLM；可設計自然界所有蛋白質！微軟開源AI新框架EvoDiff；Google輕量化臉部編輯GAN模型，低階手機也能即時生成

2023-09-25

MedTech醫療科技雙周報第20期：什麼是通用醫療AI？史丹佛大學聯手北美頂大給定義

史丹佛大學認為，通用醫療AI應具備動態任務學習能力和多模態資料的輸入和輸出；國產醫療AI導入Azure，還結合ChatGPT快速產出報告；美國大學聯手打造CancerGPT，可良好預測癌症藥物協同作用；醫事人員行動憑證也有新應用情境了

2023-05-03

Google發表具5,620億參數的多模態語言模型PaLM-E，實體機器人更能解決複雜長任務

Google透過將影像和感測器訊號，編碼成語言模型能夠執行的向量序列，持續輸入至PaLM-E，交由強大的Transformer網路進行處理，以解決實體機器人任務以及視覺語言問題

2023-03-09

微軟展示不只看懂文字，還能理解圖像的AI模型

微軟認為若能增加多模輸入能力，將能大幅拓展語言模型用於高價值任務的可能性，因此發展出多模大型語言模型KOSMOS-1，除了能理解文字，也能看懂圖片及影像，可用於更多任務，像是為影片加字幕說明、看圖片回答文字問題、正確蒐集網頁資訊等

2023-03-07

| Meta | AI | 語言審查 | 多模態

Meta整合平臺言論審查模型，以降低運算資源消耗和維護複雜度

Meta藉由整合多個語言審查模型，共享跨系統的訊號，使得人工智慧能夠更好地辨識有害內容，同時還能降低維護模型的複雜度

2021-11-16

iThome 研討會

iT+ 鐵人直播講堂

iThome 鐵人講堂特別邀請歷屆得獎者分享技術內涵，讓我們用不同的方式繼續一同學習與成長！

日期: 每週三 13:00 開始直播

數位轉型攻略 VII : GenAI 加速企業創新落地，更需要全新 IT 戰略

善用 GenAI 技術和工具，快速打造出更多高性價比的應用，不只是考驗企業的 AI 技術能力，更是基礎架構管理、雲原生開發能力、全方位資安與 IT 永續發展的挑戰。

日期: 即日起~01/08

物聯網、AI 雙劍合璧,智造新勢力來襲！

邀您一同探討物聯網、數位孿生、生成式 AI 等新興技術如何推動製造業智能化升級！

日期: 12/10 (二) 14:00-16:30