本發(fā)明涉及移動互聯(lián)智能硬件領(lǐng)域,具體涉及一種智能機器人與移動應用交互方法。
背景技術(shù):
語音識別的研究工作可以追溯到20世紀50年代at&t貝爾實驗室的audry系統(tǒng),它是第一個可以識別十個英文數(shù)字的語音識別系統(tǒng)。
語音識別技術(shù)被稱為自動語音識別automaticspeechrecognition(asr),其目標是將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計算機可讀的輸入,例如按鍵、二進制編碼或者字符序列。包括語音撥號、語音導航、室內(nèi)設(shè)備控制、語音文檔檢索、簡單的聽寫數(shù)據(jù)錄入等。語音識別技術(shù)與其他自然語言處理技術(shù)如機器翻譯及語音合成技術(shù)相結(jié)合,可以構(gòu)建出更加復雜的應用,例如語音到語音的翻譯。
語音識別技術(shù)所涉及的領(lǐng)域包括:信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等。
語音識別分為語音識別和語義識別:如蘋果的siri、安卓的googlenow大多是語音識別;但是由于中文的特殊性,有很多英文沒有的特性,包含各種奇特含義的詞匯(如成語或特殊語調(diào)等),所以中文的語義識別比英文困難很多。
智能語音識別技術(shù)能夠通過智能語音識別與邏輯判斷完成對用戶語音指令含義的判斷。只有“聽懂”才能“作答”,“聽”只是一個形象的說法,它指的就是人可以通過語音、體感甚至是意念等方式與機器進行“溝通”。而目前在國際上,比較成熟的技術(shù)還僅在基礎(chǔ)語音識別,但是由于應用場景的缺乏,沒有語言模型訓練,尤其大規(guī)模的平衡語音數(shù)據(jù),語音識別實際效果增長緩慢,主要還是用于識別一些命令詞匯和固定的語法格式。其中,國外以nuance(蘋果siri整合了nuance)為代表,國內(nèi)則是以科大訊飛為代表。將“聽”來的語音轉(zhuǎn)化成文本以后,如何識別和理解,以及如何處理,就成了智能機器人要做的事情。而這一部分功能就猶如人的大腦,需在聽到訊息后,經(jīng)過思考,迅速給出精準的答復。涉及到自然語言處理、語義分析和理解、知識構(gòu)建和自學習能力、大數(shù)據(jù)處理和挖掘等前沿技術(shù)領(lǐng)域,并需要整合多種信息承載形式(如文字、語音、體感等)的通信和識別等能力。
技術(shù)實現(xiàn)要素:
本發(fā)明主要解決的技術(shù)問題是提供一種智能機器人與移動應用交互方法,使用云處理方式,能夠及時把移動應用獲取的用戶語音、表情或動作通過智能機器人表現(xiàn),并向移動應用 發(fā)相關(guān)信息,與移動應用交互。
為解決上述技術(shù)問題,本發(fā)明采用如下技術(shù)方案:
一種智能機器人與移動應用交互方法,所述移動應用安裝在移動終端上,所述智能機器人與移動應用交互方法包括如下步驟:
步驟1,所述移動終端接收第三方輸入,通過所述移動應用的識別模塊對所述第三方輸入進行識別,生成特定格式的程序標識;
步驟2,所述移動終端通過所述程序標識獲取程序識別信息;
步驟3,所述移動終端將獲取的程序識別信息發(fā)送至云端進行解析,得到指令;
步驟4,所述云端將所述指令推送給所述智能機器人;
步驟5,所述智能機器人解析所述指令,根據(jù)所述指令完成不同指令要求,并向所述移動終端發(fā)信息。
進一步,所述步驟1中所述第三方輸入為語音輸入、表情輸入或動作輸入。
進一步地,所述第三方輸入同時包含智能機器人發(fā)出的聲音或動作。
進一步,所述步驟1中的所述識別模塊為語音識別塊、攝像頭或紅外線動作識別,所述語音識別塊對語音進行識別,所述攝像頭對人臉進行識別,所述紅外線動作識別對動作進行識別。
進一步,所述步驟1中生成的所述程序標識的特定格式為json(javascriptobjectnotation)格式的鍵值對模型:一個key對應一個value。
進一步,所述步驟2中的程序識別信息獲取具體過程為:獲取程序標識key所對應的value作為關(guān)鍵詞執(zhí)行相關(guān)邏輯。
進一步,所述步驟3中的所述云端包括海量語言知識庫、百科知識庫和行業(yè)知識庫,并具有持續(xù)學習能力。
進一步,所述步驟3中的所述云端為集中處理庫,所述云端的解析具體過程為:
獲取來自移動終端的所述json指令;
遍歷所有key,作為執(zhí)行方向;
獲取key對應的value;
執(zhí)行所述key的功能。
進一步,所述步驟5中的所述信息為進度信息、環(huán)境信息和需求信息,其中,
所述進度信息為所述機器人完成移動終端送出一個指令的進度信息;
所述環(huán)境信息為周圍環(huán)境的改變信息;
所述需求信息為如果當前指令遇到不可完成因素未能完成會發(fā)送需求信息。
本發(fā)明的有益效果是:
使用云處理方式,及時更新信息,能夠及時把用戶的語音、表情或動作通過智能機器人表現(xiàn),實現(xiàn)智能機器人與移動應用的交互。擁有準確的識別率與流暢的操控感,只需開口說話即能對移動應用進行實時控制,操作過程便捷又愉快。將變革傳統(tǒng)的家庭娛樂生活方式,使用戶在視覺與觸覺上感受到家庭人工智能伙伴的存在,給人們生活帶來便捷。
附圖說明
圖1是本發(fā)明一個實施例的智能機器人與移動應用交互方法流程示意圖。
具體實施方式
下面對本發(fā)明的較佳實施例進行詳細闡述,以使本發(fā)明的優(yōu)點和特征能更易于被本領(lǐng)域技術(shù)人員理解,從而對本發(fā)明的保護范圍做出更為清楚明確的界定。
一種智能機器人與移動應用交互方法,所述移動應用安裝在移動終端上,智能機器人能夠通過語音、表情或動作等方式與移動應用進行“溝通”,操控移動應用。所述智能機器人與移動應用交互方法流程如圖1所示,具體步驟如下所述。
步驟s1,移動終端接收第三方輸入,通過所述移動應用的識別模塊對所述第三方輸入進行識別,生成特定格式的程序標識。
所述第三方輸入包括語音輸入、表情輸入或動作輸入,第三方輸入同時包含智能機器人發(fā)出的聲音或動作。
所述識別模塊為語音識別塊、攝像頭或紅外線動作識別,所述語音識別塊對語音進行識別,所述攝像頭對人臉進行識別,所述紅外線動作識別對動作進行識別。
所述程序標識的特定格式為json(javascriptobjectnotation)格式的鍵值對模型:一個key對應一個value。
步驟s2,移動終端通過所述程序標識獲取程序識別信息。
程序識別信息獲取具體過程為:獲取程序標識key所對應的value作為關(guān)鍵詞執(zhí)行相關(guān)邏輯。如:若value為“你好”,則執(zhí)行相關(guān)邏輯解析后會回應一句:你好|你好呀。
步驟s3,移動終端將獲取的程序識別信息發(fā)送至云端進行解析,得到指令。
所述云端包括海量語言知識庫、百科知識庫和行業(yè)知識庫,并具有持續(xù)學習能力。
所述云端為集中處理庫,所述云端的解析具體過程為:
獲取來自移動終端的所述json指令;
遍歷所有key,作為執(zhí)行方向;
獲取key對應的value;
執(zhí)行所述key的功能。
如:“說你好”那么key就是“說”動詞作為key,value就是”你好”,然后數(shù)據(jù)格式:{說=“你好”,
}
云端處理完成后執(zhí)行說的功能,回應一句:你好。
步驟s4,云端將所述指令推送給智能機器人。
步驟s5,智能機器人解析所述指令,根據(jù)指令完成不同指令要求,并在完成不同指令要求過程中向移動終端發(fā)送信息。
所述信息為進度信息、環(huán)境信息和需求信息,其中,進度信息為機器人完成移動終端送出一個指令的進度信息;環(huán)境信息為周圍環(huán)境的改變信息,諸如平地、臺階、墻壁、樓梯、坡道等不同的地理環(huán)境;需求信息為如果當前指令遇到不可完成因素未能完成會發(fā)送需求信息。
所述移動應用安裝于移動終端,具有一定的功能,如:聲紋解鎖:只要設(shè)定自己的聲紋密碼就可以通過識別聲音來解鎖;或體感撥號:把舉到耳邊可以通過呼叫聯(lián)系人名稱來撥打電話;或駕駛模式:可以通過語音指令處理電話、短信等事項;或語音小秘書:可以把語音轉(zhuǎn)成文字,并通過文字翻譯的加入實現(xiàn)語音翻譯;或語音拍照:通過“拍照”、“茄子”等口令讓自動拍照;如果嫌翻找應用麻煩,甚至還可以使用語音搜索,說出應用名稱就打開它。
本實施例使用云處理方式,及時更新信息,能夠及時把用戶的語音、表情或動作通過智能機器人表現(xiàn),實現(xiàn)智能機器人與移動應用的交互。
以上所述僅為本發(fā)明的實施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說明書內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,或直接或間接運用在其他相關(guān)的技術(shù)領(lǐng)域,均同理包括在本發(fā)明的專利保護范圍內(nèi)。