當前標簽：

AI模型

聯(lián)發(fā)科推出兩款多模態(tài)輕量級 AI 模型：主打繁體中文處理能力、基于 Meta Llama 3.2 打造而成

聯(lián)發(fā)科創(chuàng)新基地（MediaTek Research）現(xiàn)已發(fā)布兩款支持繁體中文的輕量級多模態(tài)模型，分別是號稱可在手機上運行的 Llama-Breeze2-3B 模型和適用于輕薄筆記本電腦的 Llama-Breeze2-8B 模型。

Tags：聯(lián)發(fā)科，AI模型

02月19日
英偉達發(fā)布 6.3 萬億 Token 大型 AI 訓練數(shù)據(jù)庫 Nemotron-CC

據(jù)英偉達官方博客，英偉達宣布推出一款名為 Nemotron-CC 的大型英文 AI 訓練數(shù)據(jù)庫，總計包含 6.3 萬億個 Token，其中 1.9 萬億為合成數(shù)據(jù)。英偉達聲稱該訓練數(shù)據(jù)庫可以幫助為學術界和企業(yè)界進一步推動大語言模型的訓練過程。

Tags：AI模型，Nemotron

01月13日
Niantic 宣布將根據(jù)《寶可夢 Go》玩家數(shù)據(jù)構建“大型地理空間模型”

該公司表示，空間智能是人工智能模型的下一個前沿領域。這種 AI 模型可以使計算機和機器人以新的方式理解和與世界互動。

Tags：AI模型

2024年11月20日
消息稱國內(nèi) AI 大模型初創(chuàng)公司 MiniMax 產(chǎn)品負責人張前川離職

中國 AI 大模型初創(chuàng)公司 MiniMax 產(chǎn)品負責人、前今日頭條用戶產(chǎn)品負責人張前川，因個人原因目前已淡出公司事務，改任產(chǎn)品顧問一職。（智能涌現(xiàn)）

Tags：MiniMax，AI模型，AI公司

2024年09月14日
參數(shù)量 42 億，微軟公布 SLM 小語言 AI 模型最新成員 Phi-3-vision

微軟近日公布了旗下小語言 AI 模型家族（SLM）最新成員“Phi-3-vision”，這款模型主打“視覺能力”，能夠理解圖文內(nèi)容，同時據(jù)稱可以在移動平臺上流暢高效運行。這是微軟 Phi-3 家族首款多模態(tài)模型，該模型的文字理解能力基于 Phi-3-mini，同時也具備 Phi-3-mini 的輕量特點，能夠在移動平臺 / 嵌入終端中運行。

Tags：微軟，AI模型

2024年05月26日
美國教授用 2 歲女兒訓 AI 模型登 Science，人類幼崽頭戴相機訓練全新 AI

為了訓練 AI 模型，一位紐約州立大學的教授，竟然把類似 GoPro 的相機綁在了自己女兒頭上！

Tags：人工智能，AI模型

2024年05月13日
消息稱蘋果將用自研 AI 模型 Ajax 優(yōu)化 iOS 18，不會推出“ChatGPT 類聊天機器人”

據(jù)臺灣地區(qū)媒體 Digitimes 報道，蘋果公司計劃通過自研大語言模型 Ajax 來優(yōu)化 iOS 18，Siri 有望獲得大改造，但該公司不會推出 ChatGPT 等類型的 AI 聊天機器人。蘋果公司的 Ajax 模型最初曝光于 2023 年 7 月，當時消息稱這款模型基于 Google 的 Jax 機器學習框架構建，運行在 Google Cloud 上，整體和 OpenAI 的 ChatGPT、微軟的 Bing、谷歌的 Bard 等大語言競品類似，部分工程師稱呼該模型為“Apple GPT”。

Tags：蘋果，ajax，AI模型

2024年05月06日
可從單張圖像創(chuàng)建多視圖 3D 視頻，Stability AI 發(fā)布 Stable Video 3D 模型

相較于之前的其他模型，其具有更好的多視圖和泛化能力，能更忠實展現(xiàn)輸入圖像的三維全貌。

Tags：人工智能，AI模型，Stability AI

2024年03月21日
蘋果推出 300 億參數(shù) MM1 多模態(tài) AI 大模型，可識別圖像推理自然語言

蘋果公司旗下研究團隊近日在 ArXiv 中公布了一篇名為《MM1：Methods， Analysis & Insights from Multimodal LLM Pre-training》的論文，其中介紹了一款 “MM1”多模態(tài)大模型，該模型提供 30 億、70 億、300 億三種參數(shù)規(guī)模，擁有圖像識別和自然語言推理能力。

Tags：AI模型，蘋果，MM1

2024年03月16日
谷歌介紹“交通疏導”AI 模型研究成果：平均縮短 7 分鐘擁堵時間、提升 30% 交通效率

谷歌研究院今日發(fā)文，介紹了一項利用開源模擬軟件 SUMO（Simulation of Urban Mobility）打造的“交通疏導”AI 模型應用成果。

Tags：谷歌，AI模型，交通

2023年12月25日
中科院物理所聯(lián)合院網(wǎng)絡中心發(fā)布 AI 模型 MatChat，預測無機材料合成路徑

中科院物理所官網(wǎng)發(fā)文，近期，中國科學院物理研究所/北京凝聚態(tài)物理國家研究中心SF10組和中國科學院計算機網(wǎng)絡信息中心共同合作，將AI大模型應用于材料科學領域，將數(shù)萬個化學合成路徑數(shù)據(jù)投喂給大語言模型LLAMA2-7b，從而獲得了MatChat模型，可用來預測無機材料的合成路徑。該模型可根據(jù)所詢問的結構進行邏輯推理，并輸出相應的制備工藝和配方。目前已部署上線，并向所有材料科研人員開放使用，為材料研究和創(chuàng)新帶來了新啟發(fā)和新思路。

Tags：中科院，AI模型，MatChat

2023年11月03日
阿里達摩院發(fā)布業(yè)內(nèi)首個遙感 AI 大模型，號稱可識別近百種地物分類

據(jù)達摩院 DAMO 官方公眾號發(fā)文顯示，阿里達摩院今天發(fā)布業(yè)內(nèi)首個遙感 AI 大模型（AIE-SEG），號稱“率先在遙感領域實現(xiàn)了圖像分割的任務統(tǒng)一”、“一個模型實現(xiàn)‘萬物零樣本’的快速提取”，并可識別農(nóng)田、水域、建筑物等近百種遙感地物分類，還能根據(jù)用戶的交互式反饋自動調(diào)優(yōu)識別結果。

Tags：遙感，AI模型

2023年10月20日
谷歌發(fā)布視覺語言動作模型 RT-2，可以讓機器人學會扔垃圾

谷歌今日推出了一種新的人工智能（AI）模型 Robotics Transformer2（RT-2），可以幫助訓練機器人理解扔垃圾等任務。谷歌表示，RT-2 是一種視覺語言動作模型，可將互聯(lián)網(wǎng)上采集的信息和圖像轉化為機器人可理解的動作，從而幫助提升機器人的學習能力。

Tags：RT2，谷歌，AI模型，視覺語言動作模型

2023年07月28日
AI 公司 MosaicML 推出 70 億參數(shù)模型 MPT-7B-8，號稱“一次處理 8000 字長文本、可商用”

AI 創(chuàng)業(yè)公司 MosaicML 近日發(fā)布了其 70 億參數(shù)模型 MPT-7B-8K，據(jù)悉，該模型一次可以處理 8000 字文本，相當擅長處理長文重點摘要和問答，還能在 MosaicML 平臺上根據(jù)特定任務，進一步微調(diào)相關配置。據(jù)悉，系列模型采用了 150 萬個 Token，并以 256 塊 H100 GPU 花 3 天完成模型訓練而成。MosaicML 本次發(fā)布了 3 個版本模型，包括 MPT-7B-8k、MPT-7B-8k-Instruct 和 MPT-7B-8k-Chat。

Tags：AI模型，MosaicML

2023年07月25日
Databricks 發(fā)布大數(shù)據(jù)分析平臺 Spark 用 AI 模型 SDK：一鍵生成 SQL 及 FySpark 語言圖表代碼

Databricks 日前發(fā)布大數(shù)據(jù)分析平臺 Spark 所用的 AI 模型 SDK，開發(fā)者寫代碼時，可用英文下指令，編譯器就會將英文指令轉換為 PySpark 或 SQL 語言代碼，以提升開發(fā)者效率。Databricks 團隊也正是憑借 Spark 社區(qū)提供的一系列學習數(shù)據(jù)進行訓練，用 LLM 開發(fā)一套英文版 SDK。開發(fā)者利用這套 SDK，即可直接用英文下指令，并得到相對應結果，提升開發(fā)效率。

Tags：Spark，AI模型，Databricks

2023年07月10日
京東將推出言犀 AI 大模型：參數(shù)達到千億級，支持各類芯片架構

在京東云城市大會上海站上，京東集團技術委員會主席、京東云事業(yè)部總裁曹鵬介紹，即將推出的言犀大規(guī)模預訓練語言模型，是參數(shù)達到千億級的新一代模型。

Tags：京東，AI模型

2023年06月27日
AI 公司 MosaicML 推出 300 億參數(shù)模型 MPT-30B，號稱訓練成本僅為競品零頭

AI 創(chuàng)業(yè)公司 MosaicML 近日發(fā)布了其語言模型 MPT-30B，該模型具有 300 億參數(shù)，訓練成本為 70 萬美元，遠低于 GPT-3 等同類產(chǎn)品所需的數(shù)千萬美元訓練成本，“僅有其他同類競品模型的零頭”，有望促進行業(yè)逐步降低此類模型訓練成本，擴大 AI 模型在更廣泛領域的運用。

Tags：AI模型，MosaicML

2023年06月25日
微軟推出 LLaVA-Med AI 模型，可對醫(yī)學病理案例進行分析

日前微軟研究人員展示了 LLaVA-Med 模型，該模型主要用于生物醫(yī)學方面的研究，可根據(jù)CT、X 光圖片等推測出患者的病理狀況。微軟使用GPT-4，基于Vision Transformer和Vicuna語言模型，在八個英偉達 A100 GPU 上對LLaVA-Med進行訓練，其中包含“每個圖像的所有預分析信息”，用于生成有關圖像的問答，以滿足“可自然語言回答有關生物醫(yī)學圖像問題”的助手愿景。據(jù)微軟稱，該模型最終具有“出色的多模式對話能力”、“在用于回答視覺問題的三個標準生物醫(yī)學數(shù)據(jù)集上，LLaVA-Med 在部分指標上領先于業(yè)界其他先進模型”。

Tags：微軟，AI模型，GPT4，LLaVAMed

2023年06月14日
一句話拍大片，導演末日來了，Gen-2 震撼發(fā)布，科幻日系二次元統(tǒng)統(tǒng)拿捏

Runway 的 Gen-1 還沒內(nèi)測完，Gen-2 就以迅雷不及掩耳之勢發(fā)布了。這次的效果更加炸裂，AI 大到離淘汰人類，又近了一步。昨天，Midjourney 生成的完美情侶刷爆網(wǎng)絡，大家紛紛在留言區(qū)里暢想，下一步，就是演員被淘汰，人人都能升級大導，一鍵生成大電影了。

Tags：AI模型，Gen2

2023年03月21日

軟媒產(chǎn)品
常用資源