欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

自動(dòng)捕捉目標(biāo)物的系統(tǒng)和方法

文檔序號(hào):9453428閱讀:424來(lái)源:國(guó)知局
自動(dòng)捕捉目標(biāo)物的系統(tǒng)和方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)識(shí)別技術(shù),特別是涉及一種自動(dòng)捕捉目標(biāo)物的系統(tǒng)和方法。
【背景技術(shù)】
[0002]人工智能(Artificial Intelligence)是研究、開(kāi)發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,該領(lǐng)域的研究包括機(jī)器人、語(yǔ)言識(shí)別、圖像識(shí)別、自然語(yǔ)言處理和專家系統(tǒng)等。隨著計(jì)算機(jī)科學(xué)的發(fā)展,越來(lái)越多的智能產(chǎn)品開(kāi)始問(wèn)世。
[0003]然而,現(xiàn)有的智能產(chǎn)品還局限于對(duì)簡(jiǎn)單的圖像、語(yǔ)音進(jìn)行識(shí)別,當(dāng)需要對(duì)多個(gè)目標(biāo)物中的某一個(gè)或?qū)σ粋€(gè)目標(biāo)物中的某一個(gè)部位進(jìn)行識(shí)別時(shí),識(shí)別的準(zhǔn)確率會(huì)大大地降低,也影響了智能產(chǎn)品與用戶的交互性能。比如,在人機(jī)交互時(shí),人問(wèn)智能產(chǎn)品“這是什么? ”、“看這里”,智能產(chǎn)品不理解“這”、“這里”是什么意思,即不能準(zhǔn)備捕捉“這”所指代的目標(biāo)物。

【發(fā)明內(nèi)容】

[0004]基于此,有必要提供一種可以提高識(shí)別準(zhǔn)確度和交互性能的自動(dòng)捕捉目標(biāo)物的系統(tǒng)和方法。
[0005]—種自動(dòng)捕捉目標(biāo)物的系統(tǒng),包括:
[0006]圖像采集模塊,用于采集包含有用戶手勢(shì)和目標(biāo)物的圖像;
[0007]手勢(shì)識(shí)別模塊,用于識(shí)別用戶手勢(shì)并輸出手勢(shì)識(shí)別結(jié)果,所述手勢(shì)識(shí)別結(jié)果為手拿物體的手勢(shì)或手指向物體的手勢(shì);
[0008]圖像識(shí)別模塊,用于根據(jù)所述手勢(shì)識(shí)別結(jié)果確定目標(biāo)物的位置、識(shí)別目標(biāo)物,并輸出圖像識(shí)別結(jié)果;
[0009]交互模塊,用于根據(jù)所述圖像識(shí)別結(jié)果與用戶進(jìn)行交互。
[0010]在其中一個(gè)實(shí)施例中,所述圖像識(shí)別模塊包括:
[0011]目標(biāo)物捕捉單元,用于根據(jù)所述手勢(shì)識(shí)別結(jié)果確定目標(biāo)物的位置;
[0012]圖像處理單元,用于提取目標(biāo)物的圖像特征;
[0013]圖像識(shí)別單元,用于將目標(biāo)物的圖像特征與預(yù)存的模版特征進(jìn)行比較以獲取目標(biāo)物信息;
[0014]結(jié)果輸出單元,用于輸出所述目標(biāo)物信息作為圖像識(shí)別結(jié)果。
[0015]在其中一個(gè)實(shí)施例中,所述目標(biāo)物為單獨(dú)個(gè)體或?yàn)閱为?dú)個(gè)體中的一個(gè)部分。
[0016]在其中一個(gè)實(shí)施例中,還包括:
[0017]語(yǔ)音采集模塊,用于采集用戶語(yǔ)音;
[0018]語(yǔ)音識(shí)別模塊,用于識(shí)別用戶的語(yǔ)音并輸出語(yǔ)音識(shí)別結(jié)果;
[0019]所述交互模塊還用于根據(jù)所述圖像識(shí)別結(jié)果和所述語(yǔ)音識(shí)別結(jié)果與用戶進(jìn)行交互。
[0020]在其中一個(gè)實(shí)施例中,所述交互模塊包括顯示單元和/或語(yǔ)音播放單元;其中,
[0021]所述顯示單元用于顯示所述圖像識(shí)別結(jié)果;
[0022]所述語(yǔ)音播放單元用于播放所述圖像識(shí)別結(jié)果。
[0023]—種自動(dòng)捕捉目標(biāo)物的方法,包括:
[0024]采集包含有用戶手勢(shì)和目標(biāo)物的圖像;
[0025]識(shí)別用戶手勢(shì)并輸出手勢(shì)識(shí)別結(jié)果,所述手勢(shì)識(shí)別結(jié)果為手拿物體的手勢(shì)或手指向物體的手勢(shì);
[0026]根據(jù)所述手勢(shì)識(shí)別結(jié)果確定目標(biāo)物的位置、識(shí)別目標(biāo)物,并輸出圖像識(shí)別結(jié)果;
[0027]根據(jù)所述圖像識(shí)別結(jié)果與用戶進(jìn)行交互。
[0028]在其中一個(gè)實(shí)施例中,所述根據(jù)所述手勢(shì)識(shí)別結(jié)果確定目標(biāo)物的位置、識(shí)別目標(biāo)物,并輸出圖像識(shí)別結(jié)果的步驟,包括:
[0029]根據(jù)所述手勢(shì)識(shí)別結(jié)果確定目標(biāo)物的位置;
[0030]提取目標(biāo)物的圖像特征;
[0031 ] 將目標(biāo)物的圖像特征與預(yù)存的模版特征進(jìn)行比較以獲取目標(biāo)物信息;
[0032]輸出所述目標(biāo)物信息作為圖像識(shí)別結(jié)果。
[0033]在其中一個(gè)實(shí)施例中,所述目標(biāo)物為單獨(dú)個(gè)體或?yàn)閱为?dú)個(gè)體中的一個(gè)部分。
[0034]在其中一個(gè)實(shí)施例中,還包括:
[0035]采集用戶語(yǔ)音;
[0036]識(shí)別用戶的語(yǔ)音并輸出語(yǔ)音識(shí)別結(jié)果;
[0037]所述根據(jù)所述圖像識(shí)別結(jié)果與用戶進(jìn)行交互的步驟具體為:
[0038]根據(jù)所述圖像識(shí)別結(jié)果和所述語(yǔ)音識(shí)別結(jié)果與用戶進(jìn)行交互。
[0039]在其中一個(gè)實(shí)施例中,所述根據(jù)所述圖像識(shí)別結(jié)果與用戶進(jìn)行交互的步驟包括顯示所述圖像識(shí)別結(jié)果的步驟和/或包括播放所述圖像識(shí)別結(jié)果的步驟。
[0040]上述自動(dòng)捕捉目標(biāo)物的系統(tǒng)和方法,通過(guò)圖像采集模塊采集包含有用戶手勢(shì)和目標(biāo)物的圖像,手勢(shì)識(shí)別模塊識(shí)別用戶手勢(shì)并輸出手勢(shì)識(shí)別結(jié)果,圖像識(shí)別模塊根據(jù)所述手勢(shì)識(shí)別結(jié)果確定目標(biāo)物的位置、識(shí)別目標(biāo)物,并輸出圖像識(shí)別結(jié)果,交互模塊根據(jù)所述圖像識(shí)別結(jié)果與用戶進(jìn)行交互,這樣即使需要對(duì)多個(gè)目標(biāo)物中的一個(gè)或?qū)σ粋€(gè)目標(biāo)物中的某一個(gè)部位進(jìn)行識(shí)別,也可以根據(jù)用戶的手勢(shì)準(zhǔn)確地捕捉到目標(biāo)物,然后再對(duì)目標(biāo)物進(jìn)行識(shí)別并與用戶進(jìn)行交互,提高了識(shí)別的準(zhǔn)確率和交互性能。
【附圖說(shuō)明】
[0041 ]圖1為一實(shí)施例中自動(dòng)捕捉目標(biāo)物的系統(tǒng)的模塊圖;
[0042]圖2為用戶手勢(shì)的示意圖之一;
[0043]圖3為用戶手勢(shì)的示意圖之二;
[0044]圖4為用戶手勢(shì)的示意圖之三;
[0045]圖5為另一實(shí)施例中自動(dòng)捕捉目標(biāo)物的系統(tǒng)模塊圖;
[0046]圖6為一實(shí)施例中自動(dòng)捕捉目標(biāo)物的方法的流程圖;
[0047]圖7為另一實(shí)施例中自動(dòng)捕捉目標(biāo)物的方法的流程圖。
【具體實(shí)施方式】
[0048]為了便于理解本發(fā)明,下面將參照相關(guān)附圖對(duì)本發(fā)明進(jìn)行更全面的描述。附圖中給出了本發(fā)明的較佳的實(shí)施例。但是,本發(fā)明可以以許多不同的形式來(lái)實(shí)現(xiàn),并不限于本文所描述的實(shí)施例。相反地,提供這些實(shí)施例的目的是使對(duì)本發(fā)明的公開(kāi)內(nèi)容的理解更加透徹全面。
[0049]除非另有定義,本文所使用的所有的技術(shù)和科學(xué)術(shù)語(yǔ)與屬于本發(fā)明的技術(shù)領(lǐng)域的技術(shù)人員通常理解的含義相同。本文所使用的術(shù)語(yǔ)只是為了描述具體的實(shí)施例的目的,不是旨在于限制本發(fā)明。本文所使用的術(shù)語(yǔ)“和/或”包括一個(gè)或多個(gè)相關(guān)的所列項(xiàng)目的任意的和所有的組合。
[0050]請(qǐng)參照?qǐng)D1,為一實(shí)施例中自動(dòng)捕捉目標(biāo)物的系統(tǒng)的模塊圖。
[0051]該自動(dòng)捕捉目標(biāo)物的系統(tǒng)可應(yīng)用于機(jī)器人、電視機(jī)等任意智能產(chǎn)品中,包括圖像采集模塊110、手勢(shì)識(shí)別模塊120、圖像識(shí)別模塊130以及交互模塊140。其中,圖像采集模塊110用于采集包含有用戶手勢(shì)和目標(biāo)物的圖像。手勢(shì)識(shí)別模塊120用于識(shí)別用戶手勢(shì)并輸出手勢(shì)識(shí)別結(jié)果,所述手勢(shì)識(shí)別結(jié)果為手拿物體的手勢(shì)或手指向物體的手勢(shì)。圖像識(shí)別模塊130用于根據(jù)所述手勢(shì)識(shí)別結(jié)果確定目標(biāo)物的位置、識(shí)別目標(biāo)物,并輸出圖像識(shí)別結(jié)果。交互模塊140用于根據(jù)所述圖像識(shí)別結(jié)果與用戶進(jìn)行交互。
[0052]圖像采集模塊110為攝像頭,用于采集包含有用戶手勢(shì)和目標(biāo)物的圖像信息。在一個(gè)實(shí)施例中,用戶的手勢(shì)可以是如圖2所示的五指呈收攏狀,也可以是圖3所示的手指呈指向狀。目標(biāo)物為單獨(dú)個(gè)體或?yàn)閱为?dú)個(gè)體中的一個(gè)部分。這里的單獨(dú)個(gè)體可以是任何物體(如蘋(píng)果、杯子、書(shū)本等),也可以是人,那么單獨(dú)個(gè)體的一部分就是指杯子的杯蓋、書(shū)本的封面、人的某個(gè)器官或部位等。
[0053]比如,用戶需要識(shí)別一個(gè)蘋(píng)果,那么只需要手握蘋(píng)果或手指著蘋(píng)果出現(xiàn)在攝像頭可視的范圍內(nèi)即可,這時(shí)圖像采集模塊110便會(huì)采集到包含有用戶手勢(shì)和蘋(píng)果的圖像信息。
[0054]手勢(shì)識(shí)別模塊120用于識(shí)別用戶手勢(shì)并輸出手勢(shì)識(shí)別結(jié)果,所述手勢(shì)識(shí)別結(jié)果為手拿物體的手勢(shì)或手指物體的手勢(shì)。具體地,用戶需要識(shí)別放置在不同位置的物體時(shí),就會(huì)做出不同的手勢(shì)。當(dāng)用戶在圖像采集模塊110的可視范圍內(nèi)做出相應(yīng)手勢(shì)時(shí),手勢(shì)識(shí)別模塊120會(huì)輸出一個(gè)手勢(shì)識(shí)別結(jié)果??梢岳斫猓謩?shì)識(shí)別結(jié)果還可以為其他手勢(shì),如雙手抱物體等,這里不作嚴(yán)格限制。
[0055]在一個(gè)實(shí)施例中,如果用戶做出如圖2所示的手勢(shì),手勢(shì)識(shí)別模塊120將該手勢(shì)與預(yù)設(shè)手勢(shì)模版進(jìn)行對(duì)比,輸出手勢(shì)識(shí)別結(jié)果為手拿物體的手勢(shì);如果用戶做出如圖3所示的手勢(shì),手勢(shì)識(shí)別模塊120將該手勢(shì)與預(yù)設(shè)手勢(shì)模版進(jìn)行對(duì)比,輸出手勢(shì)識(shí)別結(jié)果為手指向物體的手勢(shì)。
[0056]進(jìn)一步地,用戶還可以設(shè)置圖3所示的手勢(shì)為指向目標(biāo)物的一個(gè)部分,設(shè)置圖4所示的手勢(shì)為指向目標(biāo)物的整體。
[0057]其中,預(yù)設(shè)手勢(shì)模版可以自定義設(shè)置。
[0058]圖像識(shí)別模塊130用于根據(jù)所述手勢(shì)識(shí)別結(jié)果確定目標(biāo)物的位置、識(shí)別目標(biāo)物,并輸出圖像識(shí)別結(jié)果。手勢(shì)識(shí)別結(jié)果無(wú)論是手拿物體的手勢(shì)還是手指向物體的手勢(shì),圖像識(shí)別模塊130都能根據(jù)手勢(shì)識(shí)別結(jié)果確定目標(biāo)物的位置。
[0059]在一個(gè)實(shí)施例中,圖像識(shí)別模塊130包括目標(biāo)物捕捉單元、圖像處理單元、圖像識(shí)別單元以及結(jié)果輸出單元。其中,所述目標(biāo)物捕捉單元用于根據(jù)所述手勢(shì)識(shí)別結(jié)果確定目標(biāo)物的位置,所述圖像處理單元用于提取目標(biāo)物的圖像特征,所述圖像識(shí)別單元用于將目標(biāo)物的圖像特征與預(yù)存的模版特征進(jìn)行比較以獲取目標(biāo)物信息,所述結(jié)果輸出單元用于輸出所述目標(biāo)物信息作為圖像識(shí)別結(jié)果。
[0060]比如,用戶手拿一個(gè)蘋(píng)果,手勢(shì)識(shí)別結(jié)果為手拿物體的手勢(shì),那么所述目標(biāo)物捕捉單元便會(huì)確定用戶手中的蘋(píng)果即是目標(biāo)物,所述圖像處理單元便會(huì)提取蘋(píng)果的圖像特征(如顏色特征及紋理特征等),然后所述圖像識(shí)別單元用于將目標(biāo)物的圖像特征與預(yù)存的模版特征進(jìn)行比較,預(yù)存的模版特征可能包括各種水果的模版特征、各種學(xué)習(xí)用品的模版特征等等,經(jīng)過(guò)比較就可以識(shí)別該目標(biāo)物為蘋(píng)果,從而獲取到目標(biāo)物信息并輸出。
[0061]比如,用戶手指著嘴巴,手勢(shì)識(shí)別結(jié)果為手指物體的手勢(shì),那么所述目標(biāo)物捕捉單元便會(huì)確定用戶手指向的嘴巴即是目標(biāo)物,所述圖像處理單元便會(huì)將目標(biāo)物的圖像特征與預(yù)存的模版特征進(jìn)行比較,經(jīng)過(guò)比較就可以識(shí)別該目標(biāo)物為人的嘴巴,從而獲取到目標(biāo)物信息并輸出。
[0062]在一個(gè)實(shí)施例中,目標(biāo)物信息包括目標(biāo)物
當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
巴彦淖尔市| 澄城县| 兴义市| 西盟| 古交市| 江阴市| 河间市| 库尔勒市| 项城市| 石屏县| 洛浦县| 城口县| 昔阳县| 定日县| 扎鲁特旗| 鹤庆县| 安福县| 新源县| 谷城县| 新和县| 广宗县| 天津市| 颍上县| 祁东县| 河源市| 临夏县| 繁昌县| 建始县| 友谊县| 高碑店市| 保定市| 揭东县| 杂多县| 嵊泗县| 龙门县| 广州市| 天全县| 丁青县| 始兴县| 密山市| 营山县|