| IT周報 | AI | 電腦視覺 | 微軟 | 多模態 | GUI | Copilot | GitHub | Deepmind | AlphaFold 3

AI趨勢周報第263期:又快又小又準確,史丹佛大學提出另類電腦視覺模型

史丹佛大學整合卷積網路和邏輯閘網路,打造比電腦視覺SOTA模型快上1,900倍的LogicTreeNet;DeepMind開源學術版AlphaFold 3模型;工研院建AI測試實驗室;微軟開源多代理AI系統;GitHub發布Java專用助理;Hugging Face發表輕量級小型語言模型

2024-11-14

| 蘋果 | 多模態 | Massively Multimodal Masked Modeling | 4M | 4M-21

蘋果展示多模態AI訓練框架4M、支援21種模態的AI模型

蘋果發表專門訓練多模態模型的AI框架4M,以及運用4M訓練而成的any to any視覺模型4M-21,可支援21種模態資料

2024-07-03

| 微軟 | AIPC | Copilot | 多模態 | 智慧助理 | Recall | Cocreator | 即時翻譯

【西雅圖現場直擊】微軟揭露新一代AI筆電Copilot+ PC,不只更快更有效率還內建40多個AI模型和3大AI App

微軟在年度大會Build 2024前一天揭露新一代NPU加速的AI筆電,稱之為Copilot+ PC,主打內建40多個地端AI模型和原生AI App,包括能快速找出所需資訊的回顧(Recall)、圖像創作Cocreator以及能將40多種語言即時翻譯為英文的即時字幕(Live Caption),此外還有不少AI加持的新功能。這系列筆電預計6月18日開始上市。

2024-05-21

| IT周報 | AI | 基因編輯 | 小型語言模型 | LLM | 多模態 | AI安全性

AI趨勢周報第251期:美國新創用LLM設計出人類基因編輯器

生醫新創Profluence用LLM生成一套基因編輯器並開源;以假亂真!微軟VASA-1 AI框架可即時生成超逼真對嘴人像;微軟發表小語言模型Phi-3系列模型;英特爾揭露全球最大神經型態系統Hala Point;Meta開源最新大型語言模型Llama 3

2024-04-25

| AI | MedLM | 中醫大附醫 | 護理 | 傷口 | LLM | 多模態

中醫大附醫揭露MedLM應用新進展,瞄準AI護理輔助3場景

繼去年12月揭露AI輔助醫師應用後,中醫大附醫今日再發表Google MedLM另一應用方向,鎖定護理領域打造AI輔助護理師應用,初期嘗試3情境,包括分析傷口照片和疼痛患者表情照片,來給出文字描述、照護建議和衛教建議,以及針對食物照片進行營養分析。

2024-02-21

| IT周報 | LLM | 擴展法則 | MosaicML | 摩根大通 | 多模態 | 金管會 | TinyGPT-V | 蘋果

AI趨勢周報第238期: 突破LLM擴展法則?MosaicML揭新研究成果

MosaicML研究發現,用更長的時間和更多資料訓練小參數模型,可突破LLM擴展法則;摩根大通發表懂圖文的輕量級多模態模型DocLLM;研究員開源28億參數多模態小模型TinyGPT-V;金管會發布金融業運用AI指引草案;蘋果公布多模態AI模型Ferret

2024-01-07

| IT周報 | 微軟 | 多模態 | google | Youtube | GAN | 輕量化

AI趨勢周報第229期:生成排版文件也可以!微軟發表多模態模型Kosmos-2.5

微軟發表多模態模型Kosmos-2.5,可生成排版文字區塊和Markdown格式的文字內容;Google開發逐步蒸餾技術,小資料小模型也能打敗LLM;可設計自然界所有蛋白質!微軟開源AI新框架EvoDiff;Google輕量化臉部編輯GAN模型,低階手機也能即時生成

2023-09-25

| IT周報 | 通用AI | 史丹佛大學 | 多模態 | 行動憑證 | 光田醫院 | CancerGPT | 藥物 | 協同作用

MedTech醫療科技雙周報第20期:什麼是通用醫療AI?史丹佛大學聯手北美頂大給定義

史丹佛大學認為,通用醫療AI應具備動態任務學習能力和多模態資料的輸入和輸出;國產醫療AI導入Azure,還結合ChatGPT快速產出報告;美國大學聯手打造CancerGPT,可良好預測癌症藥物協同作用;醫事人員行動憑證也有新應用情境了

2023-05-03

| google | 視覺語言 | PaLM-E | 多模態 | 機器人

Google發表具5,620億參數的多模態語言模型PaLM-E,實體機器人更能解決複雜長任務

Google透過將影像和感測器訊號,編碼成語言模型能夠執行的向量序列,持續輸入至PaLM-E,交由強大的Transformer網路進行處理,以解決實體機器人任務以及視覺語言問題

2023-03-09

| KOSMOS-1 | 微軟 | Multimodal Large Language Model | 多模態 | 大型語言模型

微軟展示不只看懂文字,還能理解圖像的AI模型

微軟認為若能增加多模輸入能力,將能大幅拓展語言模型用於高價值任務的可能性,因此發展出多模大型語言模型KOSMOS-1,除了能理解文字,也能看懂圖片及影像,可用於更多任務,像是為影片加字幕說明、看圖片回答文字問題、正確蒐集網頁資訊等

2023-03-07

| Meta | AI | 語言審查 | 多模態

Meta整合平臺言論審查模型,以降低運算資源消耗和維護複雜度

Meta藉由整合多個語言審查模型,共享跨系統的訊號,使得人工智慧能夠更好地辨識有害內容,同時還能降低維護模型的複雜度

2021-11-16