產(chǎn)品概述
智能數(shù)字人融合 NLP 自然語(yǔ)言理解、虛擬人合成與語(yǔ)音交互核心技術(shù),支持文本 、 語(yǔ)音雙驅(qū)動(dòng),具備超擬真交互、智能語(yǔ)音調(diào)度、自動(dòng)化講解匯報(bào)能力,適配政務(wù)接待、企業(yè)宣講、迎檢驗(yàn)收等多場(chǎng)景,支持國(guó)產(chǎn)化部署與個(gè)性化指令定制,搭配精細(xì)化管理配置體系,為各行業(yè)提供高效、專(zhuān)業(yè)的智能虛擬人解決方案。

一、語(yǔ)音智能應(yīng)用
系統(tǒng)具備強(qiáng)大的虛擬人合成能力,支持文本與語(yǔ)音雙模式驅(qū)動(dòng),依托數(shù)字人 NLP 自然語(yǔ)言泛化理解技術(shù),賦能超擬人人機(jī)交互體驗(yàn)。系統(tǒng)可靈活設(shè)定演示流程并進(jìn)行內(nèi)容配置,能夠精準(zhǔn)驅(qū)動(dòng)數(shù)字人按預(yù)設(shè)邏輯有序顯示頁(yè)面、開(kāi)展專(zhuān)業(yè)匯報(bào)講解,同時(shí)適配迎檢導(dǎo)覽等場(chǎng)景需求,實(shí)現(xiàn)從內(nèi)容呈現(xiàn)到交互響應(yīng)的全流程智能化,為政務(wù)接待、企業(yè)宣講、展廳導(dǎo)覽等場(chǎng)景提供高效、自然的虛擬人服務(wù)解決方案。
二、數(shù)字人功能
數(shù)字人具備全方位、高性能的虛擬人合成服務(wù)能力,為多場(chǎng)景應(yīng)用提供堅(jiān)實(shí)技術(shù)支撐。在核心合成能力上:
(一)觸發(fā)方式
支持文本驅(qū)動(dòng)與語(yǔ)音驅(qū)動(dòng)兩種靈活觸發(fā)方式,滿足不同交互場(chǎng)景下的使用需求,同時(shí)虛擬人口唇同步準(zhǔn)確率嚴(yán)格符合行業(yè)通用的 MOS 評(píng)分標(biāo)準(zhǔn),形象動(dòng)作呈現(xiàn)效果也通過(guò) MOS 分專(zhuān)業(yè)評(píng)測(cè),確保虛擬人在語(yǔ)音表達(dá)與肢體語(yǔ)言上均具備高度自然感,帶來(lái)貼近真人的交互體驗(yàn)。
(二)背景適配
在場(chǎng)景適配與輸出功能上,系統(tǒng)具備強(qiáng)大的背景自定義更換與合成能力,兼容圖片類(lèi)(jpg、png 等)及視頻類(lèi)(mp4、avi 等)多種主流背景格式,用戶可根據(jù)政務(wù)接待、企業(yè)宣講、展廳導(dǎo)覽等不同應(yīng)用場(chǎng)景,自由搭配貼合需求的背景元素,提升場(chǎng)景沉浸感。
(三)實(shí)時(shí)圖像輸出
支持輸出帶透明通道的視頻文件及實(shí)時(shí)推流服務(wù),完美適配離線使用與實(shí)時(shí)交互等多樣化場(chǎng)景,其中視頻文件支持 WebM、MOV 等常用格式,方便后續(xù)存儲(chǔ)、編輯與傳播,實(shí)時(shí)推流則基于自研 RTC 協(xié)議實(shí)現(xiàn)透明通道輸出,保障推流過(guò)程的穩(wěn)定性與畫(huà)面?zhèn)鬏斮|(zhì)量。
(四)接口兼容
在技術(shù)兼容性與拓展性上,系統(tǒng)充分考慮多平臺(tái)應(yīng)用需求,支持 Android SDK、iOS SDK、Web API 等當(dāng)前主流調(diào)用接口,能夠無(wú)縫兼容各類(lèi)應(yīng)用程序的調(diào)用需求,同時(shí)為企業(yè)用戶提供充足的二次開(kāi)發(fā)空間,可根據(jù)自身業(yè)務(wù)場(chǎng)景進(jìn)行個(gè)性化功能拓展與定制,大幅降低系統(tǒng)集成與落地成本。
(五)國(guó)產(chǎn)化部署
在國(guó)產(chǎn)化適配層面,系統(tǒng)全面支持國(guó)產(chǎn)信創(chuàng)環(huán)境完成部署調(diào)試,深度契合國(guó)產(chǎn)化替代的政策導(dǎo)向與市場(chǎng)需求,能夠在國(guó)產(chǎn)服務(wù)器、操作系統(tǒng)等信創(chuàng)生態(tài)環(huán)境中穩(wěn)定運(yùn)行,確保系統(tǒng)部署的合規(guī)性與安全性。
三、數(shù)字人語(yǔ)音調(diào)度
數(shù)字人語(yǔ)音調(diào)度功能依托先進(jìn)的數(shù)字 NLP 自然語(yǔ)言泛化理解技術(shù),具備精準(zhǔn)捕捉用戶意圖、靈活適配對(duì)話邏輯的核心能力,徹底打破傳統(tǒng)手動(dòng)操作的局限,賦能超擬人人機(jī)交互場(chǎng)景,為業(yè)務(wù)系統(tǒng)操控提供更智能、更高效的解決方案。該功能以語(yǔ)音交互為核心入口,實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)全流程的語(yǔ)音化操控,讓用戶無(wú)需依賴(lài)手動(dòng)操作即可完成各類(lèi)復(fù)雜業(yè)務(wù)需求。
(一)調(diào)取主頁(yè)
支持通過(guò)與數(shù)字人進(jìn)行自然語(yǔ)音交互,快速調(diào)取相關(guān)業(yè)務(wù)系統(tǒng)主頁(yè)面,省去手動(dòng)查找、點(diǎn)擊的繁瑣步驟,大幅提升操作便捷性。
(二)調(diào)取子頁(yè)
無(wú)需手動(dòng)層級(jí)跳轉(zhuǎn),僅通過(guò)語(yǔ)音指令即可直接調(diào)取業(yè)務(wù)系統(tǒng)各層級(jí)子頁(yè)面,無(wú)論是深層級(jí)的功能模塊還是細(xì)分業(yè)務(wù)界面,都能實(shí)現(xiàn)一步直達(dá),有效減少操作路徑與時(shí)間成本。
(三)平級(jí)切換
針對(duì)系統(tǒng)內(nèi)平級(jí)界面的切換需求,支持無(wú)需手動(dòng)路徑導(dǎo)航的語(yǔ)音交互操作,用戶只需通過(guò)語(yǔ)音下達(dá)切換指令,即可實(shí)現(xiàn)不同平級(jí)界面的直接跳轉(zhuǎn),確保操作流程的連貫性與流暢性。
(四)數(shù)據(jù)查詢反饋
支持通過(guò)語(yǔ)音交互快速發(fā)起數(shù)據(jù)查詢請(qǐng)求,系統(tǒng)接收指令后將精準(zhǔn)執(zhí)行查詢操作,及時(shí)返回查詢結(jié)果并同步通過(guò)數(shù)字人完成語(yǔ)音播報(bào)應(yīng)答,讓用戶實(shí)時(shí)獲取所需數(shù)據(jù)信息,無(wú)需手動(dòng)查看屏幕即可掌握核心內(nèi)容。
(五)調(diào)取監(jiān)控
針對(duì)視頻監(jiān)控調(diào)取場(chǎng)景,支持通過(guò)語(yǔ)音交互進(jìn)行精準(zhǔn)定位,快速調(diào)取指定單點(diǎn)的視頻監(jiān)控畫(huà)面,適用于安防監(jiān)控、場(chǎng)景巡查等需要實(shí)時(shí)可視化管控的場(chǎng)景。
(六)屏組交互
支持與多個(gè)屏組進(jìn)行語(yǔ)音交互,用戶可通過(guò)語(yǔ)音指令控制業(yè)務(wù)界面在不同大屏之間的顯示切換,靈活適配多屏聯(lián)動(dòng)的辦公場(chǎng)景,滿足多人協(xié)作、多場(chǎng)景展示的業(yè)務(wù)需求。
(七)語(yǔ)音調(diào)取
使用拾音設(shè)備,說(shuō)出喚醒詞,喚醒智能語(yǔ)音系統(tǒng),下達(dá)預(yù)設(shè)語(yǔ)音命令,系統(tǒng)對(duì)語(yǔ)音指令進(jìn)行識(shí)別,與相關(guān)設(shè)備做好路徑對(duì)接,作出相應(yīng)反饋,能夠進(jìn)行場(chǎng)景切換、調(diào)取業(yè)務(wù)程序、調(diào)取視頻監(jiān)控、智能搜索、打開(kāi)文件、打開(kāi)視頻等,即可調(diào)取畫(huà)面顯示終端上。
四、數(shù)字人講解匯報(bào)
數(shù)字人系統(tǒng)專(zhuān)為迎檢場(chǎng)景打造專(zhuān)項(xiàng)講解匯報(bào)功能,以高度智能化的內(nèi)容呈現(xiàn)與講解能力,為各類(lèi)迎檢工作提供高效、專(zhuān)業(yè)的服務(wù)支撐。系統(tǒng)支持用戶根據(jù)迎檢主題、流程需求自定義設(shè)定演示流程與內(nèi)容配置,可靈活編排匯報(bào)邏輯、篩選核心展示內(nèi)容、預(yù)設(shè)頁(yè)面切換節(jié)點(diǎn),確保數(shù)字人講解與迎檢流程精準(zhǔn)契合。
數(shù)字人能夠嚴(yán)格按照預(yù)設(shè)流程,有序完成頁(yè)面展示、專(zhuān)業(yè)匯報(bào)講解及迎檢導(dǎo)覽全流程服務(wù),從迎檢接待開(kāi)場(chǎng)問(wèn)候,到核心業(yè)務(wù)板塊逐一匯報(bào),再到場(chǎng)景導(dǎo)覽介紹,全程無(wú)需人工干預(yù)即可實(shí)現(xiàn)自動(dòng)化、標(biāo)準(zhǔn)化呈現(xiàn)。
尤為突出的是,系統(tǒng)具備強(qiáng)大的頁(yè)面聯(lián)動(dòng)介紹能力,當(dāng)數(shù)字人按流程完成頁(yè)面切換后,可自動(dòng)識(shí)別當(dāng)前頁(yè)面的核心內(nèi)容與功能模塊,同步觸發(fā)對(duì)應(yīng)講解腳本,精準(zhǔn)解讀頁(yè)面中的數(shù)據(jù)指標(biāo)、功能亮點(diǎn)、業(yè)務(wù)邏輯等關(guān)鍵信息,實(shí)現(xiàn) “頁(yè)面切換與講解內(nèi)容” 的無(wú)縫銜接,避免講解與展示脫節(jié)的問(wèn)題。
在匯報(bào)講解過(guò)程中,數(shù)字人依托自然流暢的語(yǔ)音合成技術(shù)與貼合場(chǎng)景的肢體動(dòng)作呈現(xiàn),將專(zhuān)業(yè)內(nèi)容以清晰、易懂的方式傳遞給迎檢人員,既保證匯報(bào)的專(zhuān)業(yè)性與嚴(yán)謹(jǐn)性,又通過(guò)擬人化的表達(dá)增強(qiáng)內(nèi)容的感染力與可讀性。
無(wú)論是政務(wù)工作迎檢、企業(yè)項(xiàng)目驗(yàn)收,還是專(zhuān)項(xiàng)工作評(píng)估等場(chǎng)景,數(shù)字人都能憑借標(biāo)準(zhǔn)化的演示流程、精準(zhǔn)的內(nèi)容講解、靈活的頁(yè)面聯(lián)動(dòng)能力,有效減輕迎檢籌備壓力,提升迎檢展示的規(guī)范化與智能化水平。同時(shí),用戶可根據(jù)不同迎檢對(duì)象、場(chǎng)景需求,靈活調(diào)整演示流程與講解重點(diǎn),實(shí)現(xiàn) “一套系統(tǒng)適配多類(lèi)迎檢場(chǎng)景” 的高效應(yīng)用,讓迎檢匯報(bào)既專(zhuān)業(yè)全面,又重點(diǎn)突出,為迎檢工作增添科技感與說(shuō)服力,助力用戶高效完成各類(lèi)迎檢任務(wù)。
五、定制場(chǎng)景指令
數(shù)字人系統(tǒng)深度契合項(xiàng)目建設(shè)個(gè)性化需求,提供全面的語(yǔ)音指令定制開(kāi)發(fā)服務(wù),支持根據(jù)項(xiàng)目實(shí)際業(yè)務(wù)場(chǎng)景、流程規(guī)范及操作習(xí)慣,針對(duì)性設(shè)計(jì)并開(kāi)發(fā)專(zhuān)屬語(yǔ)音指令功能,實(shí)現(xiàn)從通用指令到專(zhuān)項(xiàng)場(chǎng)景指令的精準(zhǔn)適配。
在定制開(kāi)發(fā)過(guò)程中,系統(tǒng)充分考慮原有業(yè)務(wù)系統(tǒng)的架構(gòu)特性,明確需協(xié)調(diào)原有 B/S 架構(gòu)系統(tǒng)廠家提供全方位配合,通過(guò)建立高效的跨廠家協(xié)作機(jī)制,確保定制化語(yǔ)音指令功能與原有系統(tǒng)實(shí)現(xiàn)深度融合、順暢對(duì)接及協(xié)同運(yùn)行。
具體而言,協(xié)作過(guò)程將圍繞接口適配、數(shù)據(jù)互通、流程聯(lián)動(dòng)三大核心維度展開(kāi):一方面,需原有 B/S 架構(gòu)系統(tǒng)廠家開(kāi)放必要的接口權(quán)限,提供詳細(xì)的接口文檔與技術(shù)規(guī)范,確保定制語(yǔ)音指令的觸發(fā)信號(hào)能夠精準(zhǔn)傳遞至原有系統(tǒng),實(shí)現(xiàn)指令的快速響應(yīng)與執(zhí)行;另一方面,通過(guò)雙方技術(shù)團(tuán)隊(duì)的協(xié)同調(diào)試,打通數(shù)據(jù)交互通道,保障定制指令相關(guān)的業(yè)務(wù)數(shù)據(jù)在數(shù)字人系統(tǒng)與原有 B/S 系統(tǒng)之間的實(shí)時(shí)同步、準(zhǔn)確傳輸,避免數(shù)據(jù)偏差導(dǎo)致的操作失誤;同時(shí),針對(duì)業(yè)務(wù)流程的銜接需求,將定制語(yǔ)音指令的執(zhí)行邏輯與原有系統(tǒng)的業(yè)務(wù)流程進(jìn)行深度適配,確保指令觸發(fā)后,原有系統(tǒng)能夠按預(yù)設(shè)流程完成對(duì)應(yīng)操作,實(shí)現(xiàn) “語(yǔ)音指令發(fā)起 - 系統(tǒng)響應(yīng) - 流程執(zhí)行 - 結(jié)果反饋” 的全鏈路順暢銜接。
無(wú)論是項(xiàng)目專(zhuān)屬的業(yè)務(wù)查詢指令、系統(tǒng)操控指令,還是場(chǎng)景化的多步驟聯(lián)動(dòng)指令,都能通過(guò)定制開(kāi)發(fā)實(shí)現(xiàn)精準(zhǔn)落地,且所有定制功能均需經(jīng)過(guò)嚴(yán)格的兼容性測(cè)試、壓力測(cè)試與穩(wěn)定性測(cè)試,確保在復(fù)雜業(yè)務(wù)場(chǎng)景下仍能與原有 B/S 架構(gòu)系統(tǒng)保持高效協(xié)同,不影響原有系統(tǒng)的正常運(yùn)行。
該定制場(chǎng)景指令服務(wù)通過(guò) “個(gè)性化開(kāi)發(fā) + 跨廠家協(xié)同 + 全流程適配” 的模式,徹底打破通用指令的應(yīng)用局限,讓數(shù)字人系統(tǒng)更貼合項(xiàng)目實(shí)際應(yīng)用需求,為用戶打造專(zhuān)屬化、高效化的語(yǔ)音交互體驗(yàn),同時(shí)最大限度降低系統(tǒng)集成風(fēng)險(xiǎn),保障項(xiàng)目整體落地效果與長(zhǎng)期穩(wěn)定運(yùn)行。
六、管理配置
系統(tǒng)具備全面且精細(xì)化的管理配置能力,從安全認(rèn)證、操作便捷性到功能優(yōu)化形成完整管理體系,整套管理配置功能覆蓋安全認(rèn)證、網(wǎng)絡(luò)監(jiān)測(cè)、喚醒控制、緩存管理、指令操作、播報(bào)配置、功能優(yōu)化、技能關(guān)聯(lián)及集中設(shè)置九大核心維度,通過(guò)精細(xì)化、可視化、可定制的管理設(shè)計(jì),既保障系統(tǒng)運(yùn)行的安全性與穩(wěn)定性,又提升用戶操作的便捷性與功能適配性,為各類(lèi)專(zhuān)業(yè)場(chǎng)景的高效應(yīng)用提供堅(jiān)實(shí)支撐。
(一)身份綁定
在安全與基礎(chǔ)保障層面,系統(tǒng)支持用戶首次進(jìn)入客戶端時(shí)完成身份綁定操作,提供安全合規(guī)的身份認(rèn)證入口,從源頭保障賬號(hào)使用安全與操作權(quán)限合規(guī)。
1. 新建用戶步驟
在【用戶管理】主頁(yè)面,點(diǎn)擊【新建用戶】按鈕;
進(jìn)入新建用戶參數(shù)設(shè)置頁(yè),填寫(xiě)用戶基本信息:
參數(shù)說(shuō)明 用戶名(必填):支持中英文填寫(xiě) 姓名(必填):請(qǐng)輸入用戶真實(shí)姓名。性別(必填):請(qǐng)選擇用戶性別 職位(必填):請(qǐng)輸入用戶所屬職位。 電話(必填):請(qǐng)輸入用戶手機(jī)號(hào)。 密碼(非必填):請(qǐng)輸入用戶登陸密碼。 確認(rèn)密碼(非必填):請(qǐng)?jiān)俅屋斎胗脩舻顷懨艽a。當(dāng)不填密碼時(shí),系統(tǒng)將使用初始密碼進(jìn)行登錄,初始密碼為:holardata2025。其他設(shè)置:是否啟用賬戶默認(rèn)為勾選,如果不勾選,則該賬戶不可用,處于禁用狀態(tài)。
配置角色(必選)至少選擇一種角色。
2. 編輯用戶步驟
在【用戶管理】主頁(yè)面,點(diǎn)擊【編輯】按鈕;
進(jìn)入新建用戶參數(shù)設(shè)置頁(yè),修改用戶基本信息:
參數(shù)說(shuō)明 用戶名(必填):支持中英文填寫(xiě) 姓名(必填):請(qǐng)輸入用戶真實(shí)姓名。性別(必填):請(qǐng)選擇用戶性別 職位(必填):請(qǐng)輸入用戶所屬職位。 電話(必填):請(qǐng)輸入用戶手機(jī)號(hào)。 密碼(非必填):請(qǐng)輸入用戶登陸密碼。 確認(rèn)密碼(非必填):請(qǐng)?jiān)俅屋斎胗脩舻顷懨艽a。可在此處給用戶修改密碼。其他設(shè)置:是否啟用賬戶默認(rèn)為勾選,如果不勾選,則該賬戶不可用,處于禁用狀態(tài)。
配置角色(必選)至少選擇一種角色。
3. 刪除用戶步驟
在【用戶管理】主頁(yè)面,點(diǎn)擊【刪除】按鈕;
彈出提示框,是否確認(rèn)刪除此用戶;
注意事項(xiàng):刪除用戶后,該用戶不可恢復(fù)。
(二)網(wǎng)絡(luò)監(jiān)測(cè)
同時(shí)具備網(wǎng)絡(luò)狀態(tài)實(shí)時(shí)監(jiān)測(cè)能力,當(dāng)網(wǎng)絡(luò)突發(fā)斷開(kāi)時(shí),客戶端界面將即時(shí)彈出明確的網(wǎng)絡(luò)中斷信息提示,幫助用戶快速定位問(wèn)題,避免因網(wǎng)絡(luò)異常導(dǎo)致的操作受阻。
(三)緩存清理
系統(tǒng)搭載緩存定時(shí)清理機(jī)制,可按用戶預(yù)設(shè)規(guī)則自動(dòng)執(zhí)行緩存清理操作,有效釋放系統(tǒng)存儲(chǔ)資源,保障客戶端運(yùn)行流暢性,用戶也可通過(guò)設(shè)置界面靈活控制緩存自動(dòng)清理開(kāi)關(guān)。
(四)喚醒詞預(yù)設(shè)
在操作便捷性管理上,系統(tǒng)支持通過(guò)麥克風(fēng)輸入預(yù)設(shè)喚醒詞的觸發(fā)方式,用戶無(wú)需手動(dòng)操作即可快速喚醒系統(tǒng),提升交互效率。
(五)指令可視化
同時(shí)支持已配置指令的可視化展示,讓用戶直觀掌握指令配置情況,且提供指令新增、刪除的操作權(quán)限,方便用戶根據(jù)業(yè)務(wù)需求靈活調(diào)整。
(六)播報(bào)內(nèi)容預(yù)設(shè)
播報(bào)庫(kù)內(nèi)置豐富的語(yǔ)音合成預(yù)置內(nèi)容,滿足日常播報(bào)需求,同時(shí)支持通過(guò)語(yǔ)音合成功能新增自定義播報(bào)內(nèi)容,適配個(gè)性化場(chǎng)景應(yīng)用。
(七)指令優(yōu)化
系統(tǒng)提供指令小包優(yōu)化、強(qiáng)制轉(zhuǎn)換、熱詞管理等專(zhuān)項(xiàng)優(yōu)化功能,通過(guò)多維度技術(shù)手段針對(duì)性提升專(zhuān)業(yè)場(chǎng)景術(shù)語(yǔ)的語(yǔ)音識(shí)別準(zhǔn)確率,確保特殊領(lǐng)域指令交互的精準(zhǔn)性。
(八)技能關(guān)聯(lián)
支持技能關(guān)聯(lián)功能,可針對(duì)每一條指令進(jìn)行不同系統(tǒng)的關(guān)聯(lián)配置與管理,實(shí)現(xiàn)指令與目標(biāo)系統(tǒng)的精準(zhǔn)綁定,保障指令執(zhí)行的準(zhǔn)確性。
(九)系統(tǒng)設(shè)置
設(shè)置界面整合賬號(hào)信息管理、播報(bào)參數(shù)配置、版本信息展示等核心功能入口,用戶可集中完成賬號(hào)維護(hù)、播報(bào)語(yǔ)速、音量等參數(shù)調(diào)整、版本查看等操作,形成一站式管理體驗(yàn)。