在人工智能領(lǐng)域的一次重要進(jìn)展中,百度旗下的新型搜索智能助手文小言宣布了其最新一輪的重大更新,這一消息在百度AI DAY活動(dòng)中正式揭曉,吸引了行業(yè)內(nèi)外的廣泛關(guān)注。此次更新標(biāo)志著文小言在功能上的全面升級(jí),尤其是在多模型調(diào)度、端到端語(yǔ)音大模型以及圖片問(wèn)答能力方面。
百度官方詳細(xì)介紹了文小言此次升級(jí)的核心亮點(diǎn)——多模型融合調(diào)度技術(shù)。通過(guò)整合百度自研的頂尖模型,如文心X1和文心4.5,并接入諸如DeepSeek-R1和可靈等第三方優(yōu)質(zhì)模型,文小言實(shí)現(xiàn)了模型間的智能協(xié)同。用戶在自動(dòng)模式下,可以一鍵調(diào)用最優(yōu)模型組合,也可以根據(jù)具體需求靈活選擇單一模型,這一功能顯著提升了系統(tǒng)的響應(yīng)速度和任務(wù)處理效率。
在語(yǔ)音交互方面,文小言同樣帶來(lái)了顯著的突破。百度推出了業(yè)界首個(gè)基于全新互相關(guān)注意力機(jī)制的端到端語(yǔ)音語(yǔ)言大模型,該模型不僅降低了訓(xùn)練和使用成本,還大幅提升了推理響應(yīng)速度。在語(yǔ)音交互場(chǎng)景中,用戶的等待時(shí)間從常見(jiàn)的3-5秒縮短至約1秒,極大增強(qiáng)了交互的流暢性。該模型還支持多種特色方言,包括重慶話、廣西話、河南話、廣東話和山東話,進(jìn)一步拓寬了語(yǔ)音交互的應(yīng)用范圍。
圖片問(wèn)答功能也是此次升級(jí)的一大亮點(diǎn)。用戶現(xiàn)在可以通過(guò)拍攝或上傳圖片,并以文字或語(yǔ)音提問(wèn)的方式直接獲取深度解析。例如,拍攝一道數(shù)學(xué)題可以即時(shí)獲得解題思路和視頻解析;上傳多款商品圖片可以對(duì)比參數(shù)和價(jià)格,輔助購(gòu)物決策;拍攝杯子設(shè)計(jì)圖后,AI能夠自動(dòng)解析風(fēng)格并生成同款手機(jī)殼、支架等周邊產(chǎn)品。這一功能不僅為用戶提供了更加便捷的信息獲取途徑,還增強(qiáng)了AI的實(shí)用性和趣味性。
文小言此次升級(jí)還新增了“圖個(gè)冷知識(shí)”功能。用戶可以預(yù)設(shè)不同的角色視角,如“歷史學(xué)者”或“科技達(dá)人”,為同一圖片賦予多維度的解讀。這一功能不僅豐富了圖片問(wèn)答的應(yīng)用場(chǎng)景,還為用戶帶來(lái)了更加多元和有趣的交互體驗(yàn)。通過(guò)這一系列的更新,文小言在人工智能助手領(lǐng)域樹(shù)立了新的標(biāo)桿,展現(xiàn)了百度在AI技術(shù)上的深厚積累和創(chuàng)新能力。