最近,科大訊飛舉辦了 2023 年全球 1024 開發(fā)者節(jié),全新訊飛輸入法 13.0 版本亮相,這也正臨近訊飛輸入法誕生 13 周年,本次大版本升級最大的看點就是推出了行業(yè)首款生成式 AI 輸入法。
如今生成式 AI 的發(fā)展方興未艾,而它與萬物智聯(lián)時代基礎(chǔ)入口的輸入法結(jié)合,也是必然的一步。今年 8 月,訊飛輸入法率先發(fā)布了基于大模型的 AI 創(chuàng)作助手,覆蓋 6 大場景,適配 60 多款應(yīng)用,按下了大模型應(yīng)用的“啟動鍵”。而這次訊飛輸入法 13.0,則是基于全新的輸入法認(rèn)知大模型,將生成式 AI 能力矩陣融入輸入法的主場景,再次按下大模型應(yīng)用的“快進(jìn)鍵”。
它的愿景,是構(gòu)建人機(jī)交互新模式,實現(xiàn)秒懂用戶需求,生成精彩表達(dá),連接多元服務(wù)。
這樣的愿景背后意味著什么?訊飛輸入法又是如何去實現(xiàn)的?一切還得從“輸入法”本身說起。
輸入法的“第三階段”正在到來
輸入法,既是人機(jī)交互的基礎(chǔ)工具,也是互聯(lián)網(wǎng)以及萬物智聯(lián)時代的入口級產(chǎn)品。多年以來,輸入法主要隨著人機(jī)交互技術(shù)的進(jìn)步以及智能終端產(chǎn)品的豐富而不斷發(fā)展,但整體來看,可以將它這些年的發(fā)展分為兩個階段。
以中文輸入為例,第一階段是五筆 / 拼音 / 手寫輸入,也就是我們熟悉的鍵盤打字、手寫識別。第二階段,隨著 AI 語音識別技術(shù)進(jìn)步,語音輸入逐漸成為越發(fā)重要的輸入方式。
根據(jù)易觀分析 2022 年底做的調(diào)查報告,語音輸入在國內(nèi)的滲透率已經(jīng)超過 40%,成為用戶最廣泛使用的輸入方式之一。
值得一提的是,中文語音輸入的開創(chuàng)者正是訊飛輸入法,十三年前他們通過這一源頭創(chuàng)新,為人機(jī)交互方式翻開了新篇章。這十三年里,AI 語音輸入技術(shù)持續(xù)進(jìn)化,在識別準(zhǔn)確率、支持的語言類型方面都有了長足的進(jìn)步。以訊飛輸入法來說,目前語音識別率已超 98%,并已支持 26 種方言、5 種民族語言、30 多種外語的語音輸入,實現(xiàn)了由工具產(chǎn)品向智能交互產(chǎn)品的轉(zhuǎn)換升級。。
同時,訊飛輸入法憑借持續(xù)創(chuàng)新的語音輸入,為用戶提供了獨(dú)特的輸入效率價值。一組最新數(shù)據(jù)顯示,訊飛輸入法日語音滲透率提升 18%,日語音調(diào)用量提升 35%,日活提升 10%,在背后提供強(qiáng)大支持的訊飛 AI 語音技術(shù)功不可沒。
技術(shù)進(jìn)步只是推動輸入方式發(fā)展的因素之一,輸入法在深入我們互聯(lián)生活的同時也在解構(gòu)我們的使用場景,滿足不斷發(fā)展變化的用戶需求。當(dāng)下隨著 5G、AI 等技術(shù)的日益成熟,萬物智慧互聯(lián)的時代正在加速到來,新的用戶需求涌現(xiàn),輸入法所承載的人機(jī)交互的使命也需要隨之變革。
那么,語音輸入之后的下一代輸入法會是什么樣?
Mob 研究院最近在 2023 年中國第三方輸入法行業(yè)洞察報告中指出,“AI + 輸入法 + 場景”正成為行業(yè)標(biāo)配,進(jìn)一步他們認(rèn)為“輸入法 + AI 大模型”將成為未來的重要趨勢。
有一點可以肯定的是:“AI”一定會成為輸入法下一階段發(fā)展的重點。其實,“語音輸入”本身就已經(jīng)是 AI 賦能輸入法發(fā)展的體現(xiàn),因為人工智能本身也就是人機(jī)交互最前沿的形態(tài),而作為人機(jī)交互基礎(chǔ)工具的輸入法,自然也深刻受到 AI 技術(shù)進(jìn)化方向的影響。
從 AI 的角度來看,從 ChatGPT 火熱出圈開始,生成式 AI 認(rèn)知大模型已經(jīng)在全球掀起新一輪技術(shù)浪潮。過去人們總說“AI 改變世界”,但到底如何改變,答案一直是模糊的,生成式 AI 的發(fā)展和應(yīng)用,仿佛讓人們第一次明確感知到“AI 真的可以改變世界”,改變我們生產(chǎn)和生活的方式。
可以預(yù)見,人工智能正迎來“智慧涌現(xiàn)”的大模型時代,在這個時代,AI 大模型將賦能千行百業(yè),從底層重構(gòu)生產(chǎn)力,作為人機(jī)交互入口的輸入法,與 AI 大模型能力深度融合,自然也是必須要邁出的一步。
生成式 AI 輸入法,這是第一份具體而明晰的答案
在確定了方向和趨勢后,接下來的問題就是:生成式 AI 到底應(yīng)該怎樣和輸入法進(jìn)行融合?
這個問題也許不同的產(chǎn)品會給出不同的解法,而訊飛輸入法 13.0 版本給出的答案是:在定制的輸入法認(rèn)知大模型加持下,訊飛輸入法擁有了智慧表達(dá)和智能連接的超能力,并且具有自適應(yīng)和自進(jìn)化的特點。
作為全新一代輸入法,訊飛為了幫助用戶更好的理解數(shù)字世界,首先重構(gòu)了交互界面。
據(jù)了解,在 10 多年前,訊飛輸入法定義了上方工具欄 + 下方鍵盤的現(xiàn)代輸入法基本形態(tài)。
隨著社會數(shù)字化的深入,用戶對輸入法的需求超越了單純的文字輸入。因此,訊飛輸入法思考著在人機(jī)交互方面再向前邁出重要的一步。
“活力視界”的全新設(shè)計,就是訊飛輸入法努力打造的數(shù)字窗口,在屏幕與鍵盤之間留有更大的空間,賦予推薦區(qū)更豐富的屬性。IT之家也對訊飛輸入法 13.0 做了搶先體驗,具體來說,在訊飛輸入法 13.0 種,打開 AI 輸入模式,即可在鍵盤上方開啟“活力視界”。
訊飛看到,在新一代 AI 浪潮下,用戶對輸入法的需求全面升維。從原本單純輸入文字,發(fā)展到主動生成表達(dá),已是不可逆的趨勢。
智慧表達(dá),就是輸入法要能夠理解用戶的意圖,替用戶說話、替用戶更好地完成表達(dá),以及主動幫助用戶創(chuàng)作內(nèi)容。
訊飛輸入法 13.0 內(nèi)置剛發(fā)布的輸入法認(rèn)知大模型,賦以精心調(diào)教的生成式 AI 能力。接下來,就讓我們先看訊飛輸入法 13.0 如何幫助我們更好的完成表達(dá)。
比如在聊天這一場景中,你想在晚上的聚餐群里告訴大家不能喝酒,思來想去不知該如何表達(dá),這時就可以在活力視窗的高情商溝通里輸入“告訴大家我不能喝酒”,訊飛輸入法基于你輸入的內(nèi)容,生成一段高情商的得體表達(dá),再也不用冥思苦想或者去網(wǎng)上苦苦搜索了。
再比如你需要在團(tuán)購網(wǎng)站上給餐廳寫評價參與優(yōu)惠活動,也可以通過訊飛輸入法的購物評價 AI 服務(wù),讓它根據(jù)你的意思創(chuàng)作一段評價文案,避免左思右想寫不出來的尷尬。
你還可以讓訊飛輸入法幫你對文字進(jìn)行潤色,比如你寫了一句“今晚月亮很圓”的句子,覺得不夠優(yōu)美,就可以用“潤色達(dá)人”的 AI 服務(wù)幫你潤色這句話,還能選擇不同的風(fēng)格,再也不用擔(dān)心文采不夠了。
類似的使用場景還有很多,都是在從具象的需求和具體的場景去解決大家在實際溝通表達(dá)中遇到的問題,讓你從未覺得“輸入法還能這么有用”。
不僅如此,作為新一代生成式 AI 輸入法,訊飛輸入法正在跳脫工具屬性,變身為助手服務(wù),在你需要的正確時機(jī)向正確的人提供完整服務(wù)。
比如它可以基于用戶不同場景輸入內(nèi)容智能匹配輸入場景內(nèi)多元服務(wù),也可以根據(jù)用戶輸入意圖,連接輸入場景外的內(nèi)容及服務(wù)。
舉個例子,當(dāng)你準(zhǔn)備發(fā)一條朋友圈時,打開訊飛輸入法 13.0,就會發(fā)現(xiàn)它已經(jīng)智能地將 AI 服務(wù)匹配到“朋友圈”文案了,同樣,當(dāng)你想發(fā)一條小紅書種草帖子時,打開訊飛輸入法也會發(fā)現(xiàn)它已經(jīng)明白了你的意圖,匹配到了“種草文案”,這樣你就可以直接使用,整個過程非常自然。
同時訊飛輸入法 13.0 還能根據(jù)你的輸入意圖,智能連接場景外的內(nèi)容和服務(wù)。比如小編在聊天的場景里和朋友談?wù)撘患也蛷d,打出了“這家店”,輸入法就根據(jù)小編過去的聊天歷史,猜中了我的意圖,先后聯(lián)想到“真心”、“不錯”,當(dāng)打完之句話,輸入法的活動視窗就直接連接到了“幫你擴(kuò)展”這個聊天場景外的服務(wù),小編嘗試使用了一下,它果然幫我寫了一段詳細(xì)介紹這家店哪里不錯的文字。這種輸入服務(wù)跨場景隨想隨到的體驗,讓整個溝通交流的流程都變得省心高效了。
此外,自適應(yīng)以及自進(jìn)化,就是在你長期使用的過程中,訊飛輸入法 13.0 會越來越了解你的輸入場景和表達(dá)習(xí)慣,從而無論是輔助表達(dá)還是內(nèi)容創(chuàng)作,都能更準(zhǔn)確地貼合你的意圖和喜好,也就是越來越懂你,從而讓輸入法也能千人千面,更好的滿足每一位用戶的個性化需求。
這就是訊飛對于生成式 AI 輸入法如何落地到具體產(chǎn)品中所給出的解答,從IT之家的體驗來看,它確實做到了“AI”+“場景”+“輸入法”的美妙融合,能夠?qū)τ脩粼诟鞣N場景下的交流、表達(dá)效率和效果有非常明顯的提升,假以時日,隨著生成式 AI 技術(shù)以及產(chǎn)品本身的不斷完善,相信它真的能夠?qū)崿F(xiàn)“構(gòu)建人機(jī)交互新模式”的革命性愿景。
星火大模型,訊飛輸入法愿景背后的技術(shù)底座
從 13.0 版本回過頭去看訊飛輸入法這十三年的發(fā)展,AI 是他們深耕 13 年的殺手锏,同時,跟著用戶的需求“與時俱進(jìn)”不斷革新,則是他們能夠越來越出色的根本原因。
科大訊飛輸入法業(yè)務(wù)部總經(jīng)理程坤曾在接受媒體采訪時表示,他們做第一版訊飛輸入法時,初衷就是提升輸入效率,提供極致服務(wù)。提高效率的武器是“AI”,無論是獨(dú)樹一幟的中文語音輸入還是基本輸入體驗,都有 AI 作為基礎(chǔ)支撐。
而當(dāng)能解決大眾普適化服務(wù)的需求被滿足后,新的需求又會衍生出來,比如在萬物智能時代面對設(shè)備多樣性會有新的需求,面對輸入場景的復(fù)雜多樣會有新的需求,面對更多元的用戶群體,也會有新的需求。而訊飛輸入法一直沒有停步,在不斷地發(fā)現(xiàn)新需求、解決新問題,例如在上一個大版本中,訊飛輸入法還針對這些新需求實現(xiàn)了噪聲、遠(yuǎn)場復(fù)雜環(huán)境的語音識別、20 多種方言免切換、AI 智能化表達(dá)助手的多場景覆蓋等能力。
正因如此,訊飛輸入法才能持續(xù)受到大眾的認(rèn)可。根據(jù)最新的數(shù)據(jù),2023 年 10 月,在輸入法行業(yè)已經(jīng)成熟的背景下,他們產(chǎn)品 DAU、日語音滲透率、日語音調(diào)用量、00 后用戶占仍然能獲得突破,用戶規(guī)模增速蟬聯(lián)行業(yè)第一。
這讓我們相信,在下一個生成式 AI 輸入法引領(lǐng)的時代,訊飛輸入法會帶來更大的想象空間和更強(qiáng)的競爭力,讓“輸入”這件再基礎(chǔ)不過的事兒在萬物智聯(lián)的世界里迸發(fā)出新的生命力。
而我們能夠如此相信的原動力,還是在于訊飛輸入法背后堅實的技術(shù)底座 —— 這里指的,自然就是訊飛星火 AI 認(rèn)知大模型。
就在 9 月初,訊飛星火認(rèn)知大模型正式面向全民開放。要知道訊飛星火在今年 5 月才正式發(fā)布,到正式全民開放不過四多月的時間,其技術(shù)迭代速度已然令人咋舌。
同時,在新華社研究院中國企業(yè)發(fā)展研究中心、《麻省理工科技評論》中國等權(quán)威平臺發(fā)布的大模型評測報告中,訊飛星火 V2.0 均取得了總分第一的成績,并被 MIT 科技評論認(rèn)為是“最聰明”的國產(chǎn)大模型。
在本次科大訊飛全球 1024 開發(fā)者節(jié)上,訊飛星火也如期迎來了 V3.0 的升級,在通用人工智能的七大維度能力得到進(jìn)一步升級進(jìn)階,作為鏈接“數(shù)字世界”有效手段的大模型代碼能力更是重磅升級,整體超越 ChatGPT,夯實大模型國內(nèi)應(yīng)用第一方陣的實力。
而在技術(shù)的創(chuàng)新性上,我們就說支撐這一次應(yīng)用在訊飛輸入法上的突破,就是在多模態(tài)能力上,訊飛星火實現(xiàn)了將語音、圖像、視頻等模態(tài)對齊到統(tǒng)一語義空間中,實現(xiàn)語義的貫穿、銜接以及多模態(tài)協(xié)同涌現(xiàn)。因此我們才能在訊飛輸入法 13.0 上用上例如“AI 皮膚”、“AI 頭像”、“AI 造字”等一系列生成式 AI 底層技術(shù)之上的獨(dú)特創(chuàng)新功能。。
類似的領(lǐng)先性技術(shù)還有很多,如前所提到的輸入法認(rèn)知大模型實現(xiàn)了將識別、翻譯、語種分類等多任務(wù)聚合,讓信息互享互通。因而能夠在輸入法上做到多種方言多種語種免切換自動識別、翻譯,這些也都是領(lǐng)先于行業(yè)的體驗。
最后,星火認(rèn)知大模型正在構(gòu)建“1+N(重大行業(yè))+X(細(xì)分行業(yè)及產(chǎn)品)”產(chǎn)業(yè)發(fā)展生態(tài)體系,訊飛輸入法則是“智慧輸入”的重要行業(yè)應(yīng)用。隨著整個生態(tài)體系的不斷完善,訊飛輸入法與各行各業(yè)應(yīng)用場景的連接緊密度必然也會迎來質(zhì)的發(fā)展,這對于訊飛輸入法向 B 端的發(fā)展也帶來了更廣闊的想象力。
結(jié)語
自從移動智能終端出現(xiàn),在觸控屏幕上行“如何更舒適高效地輸入”是伴隨行業(yè)發(fā)展最基本、但很多產(chǎn)品都沒能解決好的問題。
?但訊飛輸入法沒有因為這件事“難做”而放棄,并且幸運(yùn)的是,這件事恰好天然適合以 AI 技術(shù)見長的訊飛來完成。
因為在人機(jī)交互的過程中,“輸入”這個行為的本質(zhì)還是要讓人的意圖被機(jī)器理解,從這一點出發(fā),曾經(jīng)我們熟悉的鍵盤打字、手寫等,都是機(jī)器智能化程度不夠而妥協(xié)的產(chǎn)物,而 AI,才是輸入這件事的終極答案。
訊飛輸入法從一開始就錨定了 AI 這一點,多年以來堅持從產(chǎn)品定位、功能和設(shè)計等全方面強(qiáng)化 AI 對輸入法的賦能,最新的訊飛輸入法 13.0,就是在生成式 AI 時代來臨時,訊飛對“生成式 AI 輸入法”這一必然趨勢的前瞻布局和占位。
而在萬物智能逐漸成為現(xiàn)實的今天和未來,相信在訊飛輸入法的引領(lǐng)下,“輸入”這件事可以變得前所未有的輕松,人機(jī)交互也真的能迎來一場久違的變革。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。