IT之家 12 月 14 日消息,阿里巴巴開源了自研搜索引擎 Havenask,目前項(xiàng)目文件已在 GitHub 推出。
倉(cāng)庫(kù)介紹稱,Havenask 是阿里巴巴集團(tuán)自研的搜索引擎,也是阿里巴巴內(nèi)部廣泛使用的大規(guī)模分布式檢索系統(tǒng),支持了包括淘寶、天貓、菜鳥、高德、餓了么、全球化在內(nèi)整個(gè)阿里巴巴集團(tuán)的搜索業(yè)務(wù),為用戶提供高性能、低成本、易用的搜索服務(wù)。
同時(shí),Havenask 具有靈活的定制和開發(fā)能力,支持算法快速迭代,幫助客戶和開發(fā)者量身定做適合自身業(yè)務(wù)的智能搜索服務(wù),助力業(yè)務(wù)增長(zhǎng)。
據(jù)介紹,Havenask 的核心能力與優(yōu)勢(shì),有以下幾點(diǎn):
極致的工程性能:支持千億級(jí)數(shù)據(jù)實(shí)時(shí)檢索,百萬(wàn) QPS 查詢,百萬(wàn) TPS 寫入,毫秒級(jí)查詢延遲與秒級(jí)數(shù)據(jù)更新。
C++ 的底層構(gòu)建:對(duì)性能、內(nèi)存、穩(wěn)定性有更高保障。
SQL 查詢支持:支持 SQL 語(yǔ)法便捷查詢,查詢體驗(yàn)更友好。
豐富的插件機(jī)制:支持各類業(yè)務(wù)插件,拓展性強(qiáng)。
支持圖化開發(fā):實(shí)現(xiàn)算法分鐘級(jí)快速迭代,定制能力豐富,在新一代智能檢索場(chǎng)景下的支持效果優(yōu)秀。
支持向量檢索:可通過(guò)與插件配合實(shí)現(xiàn)多模態(tài)搜索,滿足更多場(chǎng)景的搜索服務(wù)搭建需求(待發(fā)布)。
IT之家了解到,該引擎底層主要使用 C++ 編寫,并采用了少量的 Python 語(yǔ)言,需要使用 Docker 容器運(yùn)行,機(jī)器內(nèi)存需大于 10GB,CPU 大于 2 核,磁盤大小大于 50GB。
GitHub 頁(yè)面:點(diǎn)此查看
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。