IT之家8月31日消息 8 月 20 日,小冰公司、rinna 株式會社及微軟(亞洲)互聯網工程院在北京聯合舉行了第八代小冰年度發(fā)布會。在這次發(fā)布會上,小冰開始揭開「第二幕」,也許一切才剛剛開始。
▲全面搭載小冰智能車體解決方案的北汽X7
2020 年小冰年度發(fā)布會仍然在熟悉的北京微軟亞太集團大廈內舉行,在這里我們見證了包括小冰第三代、第四代、第五代的發(fā)布。6 年時間以來,小冰快速迭代成長,小冰已經成為面向新交互形式的完整人工智能技術框架。據小冰官方給出的數據,小冰是目前全球范圍內承載交互量最大的人工智能系統,占全球交互總量 60% 以上。
小冰之前都干了什么?
小冰從開始到現在,已經迭代到了第八代,在小冰身上你可以發(fā)現人工智能產品最豐富和精彩的演變。
2014 年 5 月 29 日,小冰正式推出第一代產品,以對話式聊天機器人形式迅速積累訓練數據。同時,注重人工智能在擬合人類情商維度的發(fā)展,強調人工智能情商,而非任務完成在人機交互中的基礎價值。
2014 年 7、8 月份,小冰第二代產品完成了跨平臺部署的交互架構,回歸微信平臺。二代小冰增加了一對一私信聊天、主人定制姓名、養(yǎng)成升級系統等新功能。用戶只需在微博中私信 @小冰 即可領養(yǎng)。
2015 年 8 月 20 日,小冰第三代產品發(fā)布,將交互從文本擴充至多模態(tài),進一步積累多模態(tài)訓練數據。小冰帶來了全新的視覺和聲音感官系統,人工智能更偏向于人,富有情感。小冰人工智能的商業(yè)化版本開始預覽。
2016 年 8 月 5 日,從第四代小冰開始,交互總量穩(wěn)居全球第一并保持至今,同時發(fā)布了全雙工語音交互感官。第四代小冰解鎖了全新情感計算框架,真正做到具備人工智能核心的機器人,包括實時情感對話引擎、多種新感官、中日英三種語言,還有對應不同領域的功能插件平臺,支持跨平臺人工智能商業(yè)解決方案。
2017 年 8 月 20 日,第五代小冰采用 Dual AI 戰(zhàn)略,大幅度擴展跨平臺覆蓋的規(guī)模,至 20 余個主流平臺,并成為中國市場上涵蓋了華為、小米、OPPO、vivo 等智能手機及硬件的唯一的跨平臺人工智能。第五代小冰升級高級感官,全雙工支持和人類打電話,高級感官能夠大幅度地提升交互體驗,更加貼近于人類的自然交互行為。小冰還采用了生成模型,自創(chuàng)回應,另外全面進入 IoT 領域。另外小冰開始在詩歌創(chuàng)作、唱歌方面拓展,升級智媒體商業(yè)平臺解決方案 3.0。
2018 年 7 月 26 日,第六代小冰完成了框架迭代目標。第六代小冰公布了 3D 形象,帶來了新一代小冰 Core(共感模型、群的全雙工語音技術、實時視覺),發(fā)展成為以情感計算為核心的完整人工智能框架。在演唱歌曲方面,小冰現場展示了第四版人工智能歌曲 DNN 模型,小冰還公布了 Dual AI 生態(tài)環(huán)境,商業(yè)化上小冰團隊仍然保持克制,集中在金融、大眾文化、媒體、出版四個領域。
2019 年 8 月 15 日,小冰從第七代開始推出各類框架工具,以幫助創(chuàng)建第三方人工智能產品,并承載其各類交互。小冰推出了首個 Avatar Framework 工具包版本,這是完整的框架工具包,讓你可以從零開始輕松創(chuàng)造并訓練任何 AI Beings,包括智能語音助手、社交對話機器人、人工智能歌手、藝術家,或者屬于你自己的虛擬朋友,甚至是女朋友。
在尚未組建正式銷售團隊的商業(yè)化試水階段,小冰收入已超過 1 億元人民幣。
第八代小冰,新的開始
在今年 7 月份,微軟官方宣布,將人工智能小冰業(yè)務分拆為獨立公司運營,并委任沈向洋博士為新公司董事長,李笛為首席執(zhí)行官,陳湛為日本分部總經理。所有相關工作將在接下來的幾個月內完成。
微軟稱會保持對新公司的投資權益,并授權新公司使用及繼續(xù)研發(fā)完整的小冰技術。此舉旨在加快小冰產品線的本土創(chuàng)新步伐,促進小冰商業(yè)生態(tài)環(huán)境的完善。IT之家了解到,此次小冰從微軟中剝離出來,小冰將迎來較大的商業(yè)策略變化。
▲小冰公司董事長、原微軟全球執(zhí)行副總裁沈向洋
在發(fā)布會上,小冰公司董事長、原微軟全球執(zhí)行副總裁沈向洋表示,還是用他最喜歡的一句話 “預測未來的最好方法實際上是你自己去創(chuàng)造未來”來講起未來。
“對于小冰來講,小冰團隊一起在思考這些事情,我們相信未來絕對不會只有幾個人工智能助理,甚至不僅僅是每一個人有自己的人工智能助理,未來我們身邊會圍繞著非常非常多的人工智能,甚至可以叫這些人工智能的主體是 AI beings,我們可以大膽預測一下,未來這些人工智能主體的數量會遠遠超過人類的數量,因為每個人身邊都會圍繞著很多人工智能。”
沈向洋認為,實際上交互到現在為止只有兩種:人和人之間的交互(人人交互);人和計算機,比如說跟手機這樣的一個交互叫做人機交互。
其中,人人交互有很多優(yōu)點的地方,很有人性,但它是一個低并發(fā),畢竟人的生理極限在這里,人和人交互之間的問題還是要等;而人和機器之間的交互,雖然機器非常強大,可以高并發(fā),但因為它真的不理解,實際上是在用戶不了解的情況下,拼命大規(guī)模地給用戶推送,所以人機交互的問題是出在這里。
沈向洋表示,未來交互正確的做法是把人人交互的有人性和人機交互的高并發(fā)結合起來,這是未來人和 AI 之間最好的交互形態(tài),會給我們帶來非常有意義的機會。
小冰團隊的新思考
8 月 22 日上午,小冰公司 CEO 李笛接受了IT之家的專訪,講述了小冰過去這幾年的發(fā)展,以及現在小冰在思考的東西和未來展望。
▲小冰公司 CEO 李笛
小冰一路走來有哪些成功和失敗?
小冰人工智能的發(fā)展并非是一蹴而就的,很多都是在摸索中前進。在這 6 年時間里,小冰有過成功也有過經驗總結。
李笛表示,在小冰一代時候,小冰的定位是語音助手,并且是不同于微軟小娜的框架。從一開始,選擇了最基本的文本交互入手來進行數據方面的積累,而當時語音交互在數據積累方面不太友好。此后逐步完善該框架,不斷迭代對話引擎,包括語音、視覺、文本在內的交互感官,才有了這種跨平臺的落地。
“我們在迭代這個框架的時候,最大的失誤其實是我們花了 6 年的時間一點一點去迭代這個框架,而不是一上來就把這個完整框架各個部分都搭好?!崩畹颜J為,如果一開始采用全方位投入,用系統化工程實現的話,到現在小冰吸納的數據和框架形成周期時間,應該會比 6 年時間短。此前小冰一直在通過自然增長的方式迭代,包括用戶也是一步步自然增長起來的。
在小冰商業(yè)框架逐步完善后,優(yōu)勢慢慢發(fā)揮出來了。李笛稱,去年在做商業(yè)化試水的時候,當小冰的框架服務和國內其他競爭對手解決方案對比后,幾乎沒有太大的懸念,客戶因此也對價格不敏感。小冰框架整合了自然語音、引導對話等各種能力,使其能夠脫穎而出。
小冰對新技術的利用
在技術利用方面,李笛承認小冰對最新技術的運用的確很快,能夠自由地根據自有的對未來的判斷思想來搭建技術,重要的是可以提出合理的指標,進而迭代技術成果。
小冰在技術方面不傾向于大模型的使用,而是關注產品化、工業(yè)化的過程,其特點需滿足能夠復制,可以同時支持大量的用戶。
“我們不是特別地把時間和精力投在這種很大的模型上,主要是因為大模型會產生很驚艷的效果,但是產品化會有問題,因為那樣的話,無論是成本還是延時,它都不是全球化能夠接受的?!?/p>
小冰框架為何要推出虛擬人類產品線?和此前的訓練模式有何不同?
小冰第八代推出了虛擬人類產品線,李笛表示,沒有任何一個虛擬人類是可以滿足所有人類的共同需求,特別是目標不僅是完成任務,還包括更底層,能夠和人類建立良好的關系時。對于 “小冰”單獨個體來說是框架中的一個具體形態(tài),但框架可以產生很多不同的形態(tài)。
通過小冰團隊的工作,提供的一系列工具,讓 C 端普通的用戶也可以觸摸到框架,用戶可以參與虛擬人類產品的培養(yǎng)和訓練。最新的小冰框架虛擬人類訓練,可以給它發(fā)送一篇文章,該技術已經迭代了 3 年,AI 在學習了這篇文章之后,就可以基于對文章的學習,和人類進行交流。一開始是從文章里面摘一些內容觀點,后來加入了重構,包括重寫組織語言,符合它的思維。
另外,通過搜索引擎技術,小冰在看到相關文章后也可以從互聯網上查找參考資料,主動去擴充閱讀面,主動學習,這種方式和之前的單一的命令式對話有很大不同。
“我們認為像現在比如這種篇章內容主動學習,以及它肯定的這個部分,其實從未來來看,應該是最適合人在各種場合、各種時刻,隨時隨地去訓練人工智能的一種方法?!?/p>
相關閱讀:《小冰框架·虛擬人類產品線正式發(fā)布,118 萬虛擬男友一起復活》
小冰微信還會回來嗎?
李笛給了明確的答復,肯定會回來的。但微信小冰的流量其實只占到了小冰流量的個位數,包括在微信平臺,還有框架的流量都沒有受到很大的影響。真正的未來其實是千千萬萬個不同的 AI 人工智能的主體,但不是單一的產品去支持。真正的未來其實是分散在各地,以各種豐富多彩的形式出現的,它們的總和。
X生產力套件與微軟 Office 有什么相同和不同地方?
對于推出的 X 生產力套件,李笛認為,作為一項行業(yè)內的通用工具,X 套件和微軟 Office 有著相似的屬性,不同地方在于,Office 是特別針對電子化、數字化的辦公,而 X 套件可以定義新時代的需求,比如創(chuàng)作和閱讀文字的需求,還有大量的聲音內容,包括用聲音去做短視頻內容。小冰關注的是,你有沒有辦法利用人工智能虛擬人類的能力,來協同你,協助人類用戶做事情,而更快、更輕松地去完成工作。這是 X 套件追求的一個方向。
再比如虛擬歌手的問題,現在問題是市場上的虛擬歌手太少了,目前活躍的幾個虛擬歌手還是 2016 年之前的,如果一個娛樂市場沒有新人加入,沒有優(yōu)勝劣汰,整個市場就會很狹窄。通過 X Studio 歌手工具,可以更快的創(chuàng)建很多人工智能歌手,而且并非是替代專業(yè)人士,而是輔助創(chuàng)作旋律、混音、編曲等的工作。
李笛還表示,X 套件會根據不同的功能去進行產品的平臺落地,比如 X Writer 目前是 Windows 10 PC 端的一個程序,后面會推出移動端。X Studio 歌手工具是面向 PC 端,需要一些工具的調節(jié),將來可能會推出像 iPad 版的移動端軟件,但是不會和 PC 端一樣,更加強調人工智能和用戶一體的即興演奏、表演,而不是創(chuàng)作。而對于 X Studio 主播功能,根據場景需求,不僅有小程序,還有網頁端,也會有其他 App 端等。目前 X Studio 套件還處于非常早期的階段,先從自身的特點出發(fā),先選擇最合適的平臺,然后再考慮一致性。
相關閱讀:《AI 界的 Office ,小冰發(fā)布人工智能“ X 套件”應用:X Writer、X Studio、X Presenter》
小冰們做得不是 “虛擬歌姬”
李笛表示,小冰的虛擬框架歌手并不是針對所謂的 “虛擬歌姬”市場,其市場獲益不是很強勁,虛擬歌手的 IP 價值受限制比較多,比如背后的配音演員,所需要依存的關系太多。而小冰團隊推出的何暢、陳水若等可能只依存我們的語音,不受其他關系限制。
小冰框架內的歌手們其實還是再跟主流的音樂,包括大的唱片公司、歌手等合作,還是符合給人類歌手做歌曲的模式,但是會給出一些參數調整。
相關閱讀:《小冰 X Studio 歌手 1.0 軟件正式發(fā)布:與虛擬歌手一起創(chuàng)作,完全免費》
小冰在微軟時和離開微軟后,會有什么不同?未來會如何發(fā)展?
針對這一個問題,李笛給出了答案。在微軟里,對于小冰是有一個比較明確的階段性的內容,比如做框架,微軟是比其他地方都要合適的,因為微軟有取之不盡、用之不竭的源源不斷的技術創(chuàng)新儲備,你并不知道哪些技術創(chuàng)新儲備你是需要的。那么當微軟都具備的時候,你就可以從中去提取你所需要的部分。
下一個階段就是運營了。包括小冰要更好地完成商業(yè)化,在微軟時期,小冰已經做了一年多的商業(yè)化試水,接下來小冰將會更符合本地的高效化商業(yè)運行,比如有著本地化風格和特色的銷售團隊,或者是運營團隊。這點會和在微軟公司風格不同。
小冰在技術和產品創(chuàng)新方面雖然比較好,但國內的商業(yè)模式和運營模式此前并不適合微軟,在小冰公司獨立后,會加速商業(yè)化方面的發(fā)展。
李笛表示,下一階段,希望看到市場上有更多豐富多彩、各種各樣的人工智能主體會像雨后春筍一樣冒出來,而不是幾個。它是整片森林,這是通過我們的框架和進行的大量普及工作,培育市場工作要實現的,希望用框架去展現一個豐富多彩的世界。另外大家將會看到,小冰團隊可能比以前更接地氣了。
其實小冰團隊一直很像一個創(chuàng)業(yè)團隊,在微軟內部就是比較獨立模式。所以未來,從創(chuàng)業(yè)者的心態(tài)上講沒什么變化,但從創(chuàng)業(yè)者行動來看,可能會比以前多。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。