IT之家 8 月 8 日消息,統(tǒng)信軟件今日宣布,中國首款操作系統(tǒng)級端側模型 UOS LM 正式發(fā)布。目前,UOS LM 端側模型面向所有統(tǒng)信 UOS 社區(qū)版(deepin V23)用戶發(fā)起定向邀約內測,添加 deepin 小助手申請內測資格。
為保證流暢體驗,統(tǒng)信推薦以下硬件性能:
1.5B 模型:內存 2G,GPU 顯存 4G,10TOPS
7B 模型:內存 8G,GPU 顯存 10G,20TOPS
對于個人用戶,UOS LM V1.0 版本實現本地文檔構建知識庫,并通過向量數據庫支持基于語義的相似性搜索和向量分析操作,幫助用戶通過 UOS AI 桌面智能助手實現問答、翻譯、創(chuàng)作等功能。
對于組織用戶,UOS LM V1.0 版本針對組織用戶的原始文檔,知識庫系統(tǒng)的處理總共分為五個部分,分別是文檔預處理、文本智能分塊、向量化計算、向量索引構建、元數據索引文件的保存和調用。
IT之家匯總如下:
文檔預處理階段,知識庫系統(tǒng)可提取各類格式文檔的文本內容,如 txt、docx、xlsx、ppt、pdf 等文本格式,并對文本進行清洗、過濾,準備進行文本分塊;
文本智能分塊階段,對文本四種切分方式,如固定長度切分、段切分、句切分、語義切分,盡量平衡分塊個數和語義信息的完整性;
向量化計算階段,顧名思義,就是將文本轉化為向量的過程。主要作用是進行語義表征,向量檢索就是使用查詢文本的向量和向量數據庫中的向量進相似性計算;
向量索引構建階段,分為全量索引、倒排索引、乘積量化索引、乘積量化加倒排索引四種方式,主要目的是將文本向量化計算出來的結果通過不同的索引方式組合,得到一個最優(yōu)的檢索性能和存儲空間兼顧的向量索引庫;
元數據索引文件的保存和調用階段,將向量化索引數據作為結構體數據來存儲到電腦中,并通過向量化檢索和大模型處理檢索結果后,輸出用戶檢索的內容。
對于開發(fā)者,UOS LM 提供了豐富的功能和靈活的擴展性,并提供了強大的文檔支持,助力開發(fā)者簡化 AI 應用開發(fā)流程,加速行業(yè)應用、業(yè)務系統(tǒng)的開發(fā),拓展 AI 應用場景。
AI SDK 提供三個層面的接口能力:
AI 業(yè)務插件(AI-Plugin):靈活的 AI 業(yè)務插件能力,具備系統(tǒng)級和應用級調用配置,三方應用可注冊自己功能接口進入 AI 推理邏輯。
AI 接口能力(DTK AI):面向編程的 DTK AI 接口能力,提供文件搜索、問答、總結、潤色、語音等業(yè)務能力,減少應用開發(fā)工作。
AI 模型管理(Modelhub):原生模型接口能力,融合模型原生輸入輸出接口能力,方便用戶調試自定義提示詞或內容解析。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。