自動捕捉目標物的系統(tǒng)和方法_2

文檔序號：9453428閱讀：來源：國知局

的中文名稱、英文名稱等。可以理解，目標物信息還可以包括目標物的一些典故或造句等。如上述例中，所述結果輸出單元輸出的圖像識別結果為蘋果(apple)，圖像識別結果還可以包括蘋果的典故如牛頓的萬有引力，還可以包括apple的造句，如媽媽給了我一個蘋果(Mum gave me an apple)。
[0063]交互模塊140用于根據(jù)所述圖像識別結果與用戶進行交互。在一個實施例中，交互模塊140包括顯示單元和/或語音播放單元。其中，所述顯示單元用于顯示所述圖像識別結果，所述語音播放單元用于播放所述圖像識別結果。即交互模塊140可以以顯示圖像識別結果的方式與用戶交互，也可以以播放圖像識別結果的方式與用戶交互，還可以同時顯示和播放圖像識別結果。
[0064]比如，圖像識別模塊130輸出的圖像識別結果為蘋果(apple)，那么交互模塊140就會顯示蘋果的圖片、漢字及英語單詞，還可以同時播放蘋果的讀音。
[0065]請參照圖5，為另一實施例中自動捕捉目標物的系統(tǒng)的模塊圖。
[0066]該自動捕捉目標物的系統(tǒng)包括圖像采集模塊210、手勢識別模塊220、語音采集模塊230、語音識別模塊240、圖像識別模塊250及交互模塊260。
[0067]圖像采集模塊210用于采集包含有用戶手勢和目標物的圖像。具體地，圖像采集模塊210為攝像頭，用于采集包含有用戶手勢和目標物的圖像信息。在一個實施例中，用戶的手勢可以是如圖2所示的五指呈收攏狀，也可以是圖3所示的手指呈指向狀。目標物為單獨個體或為單獨個體中的一個部分。這里的單獨個體可以是任何物體(如蘋果、杯子、書本等)，也可以是人，那么單獨個體的一部分就是指杯子的杯蓋、書本的封面、人的器官等。
[0068]手勢識別模塊220用于識別用戶手勢并輸出手勢識別結果，所述手勢識別結果為手拿物體的手勢或手指向物體的手勢。具體地，用戶需要識別放置在不同位置的物體時，就會做出不同的手勢。當用戶在圖像采集模塊210的可視范圍內做出相應手勢時，手勢識別模塊220會輸出一個手勢識別結果。
[0069]語音采集模塊230用于采集用戶語音。具體地，在一個實施例中，用戶在啟動圖像采集模塊210的同時會自動啟動語音采集模塊230，用戶也可以在啟動圖像采集模塊210后，通過一個手勢來啟動語音采集模塊230。
[0070]語音識別模塊240用于識別用戶的語音并輸出語音識別結果。具體地，用戶輸出的語音識別結果包括交互句型。比如，用戶手拿一個蘋果問智能產(chǎn)品“這是什么”，那么語音識別模塊240輸出來的語音識別結果會包含“這是XX”這個交互句型，如這是蘋果。如果用戶指著爸爸的鼻子問“這是爸爸的什么”，那么語音識別模塊240輸出來的語音識別結果會包含“這是爸爸的XX”這個交互句型，如這是爸爸的鼻子。
[0071]圖像識別模塊250用于根據(jù)所述手勢識別結果確定目標物的位置、識別目標物，并輸出圖像識別結果。
[0072]交互模塊260用于根據(jù)所述圖像識別結果和所述語音識別結果與用戶進行交互。
[0073]比如，圖像識別模塊250輸出的圖像識別結果為杯子(cup)，語音識別模塊240輸出的語音識別結果包括“這是XX”的句型，那么交互模塊260與用戶交互時就會顯示和/或播放“這是杯子”、“this is a cup”。這樣非常有利于小孩子的學習。
[0074]請參考圖6，為一實施例中自動捕捉目標物的方法的流程圖。
[0075]該自動捕捉目標物的方法包括:
[0076]步驟SllO:采集包含有用戶手勢和目標物的圖像。
[0077]在一個實施例中，目標物為單獨個體或為單獨個體中的一個部分。這里的單獨個體可以是任何物體(如蘋果、杯子、書本等)，也可以是人，那么單獨個體的一部分就是指杯子的杯蓋、書本的封面、人的器官等。
[0078]步驟S120:識別用戶手勢并輸出手勢識別結果，所述手勢識別結果為手拿物體的手勢或手指向物體的手勢。
[0079]步驟S130:根據(jù)手勢識別結果確定目標物的位置、識別目標物，并輸出圖像識別結果。
[0080]步驟S140:根據(jù)圖像識別結果與用戶進行交互。
[0081]請參考圖7，為另一實施例中自動捕捉目標物的方法的流程圖。
[0082]該自動捕捉目標物的方法包括:
[0083]步驟S210:采集包含有用戶手勢和目標物的圖像。
[0084]步驟S220:識別用戶手勢并輸出手勢識別結果，所述手勢識別結果為手拿物體的手勢或手指向物體的手勢。
[0085]步驟S230:根據(jù)所述手勢識別結果確定目標物的位置、識別目標物，并輸出圖像識別結果。
[0086]步驟S240:采集用戶語音。
[0087]步驟S250:識別用戶的語音并輸出語音識別結果。
[0088]在一個實施例中，步驟S240和步驟S250可以在步驟S210之前執(zhí)行，也可以在步驟S210之后執(zhí)行。
[0089]步驟S260:根據(jù)圖像識別結果和語音識別結果與用戶進行交互。
[0090]上述自動捕捉目標物的系統(tǒng)，通過圖像采集模塊采集包含有用戶手勢和目標物的圖像，手勢識別模塊識別用戶手勢并輸出手勢識別結果，圖像識別模塊根據(jù)所述手勢識別結果確定目標物的位置、識別目標物，并輸出圖像識別結果，交互模塊根據(jù)所述圖像識別結果與用戶進行交互，這樣即使需要對多個目標物中的一個或對一個目標物中的某一個部位進行識別，也可以根據(jù)用戶的手勢準確地捕捉到目標物，然后再對目標物進行識別并與用戶進行交互，提高了識別的準確率和交互性能。
[0091]以上所述實施例的各技術特征可以進行任意的組合，為使描述簡潔，未對上述實施例中的各個技術特征所有可能的組合都進行描述，然而，只要這些技術特征的組合不存在矛盾，都應當認為是本說明書記載的范圍。
[0092]以上所述實施例僅表達了本發(fā)明的幾種實施方式，其描述較為具體和詳細，但并不能因此而理解為對發(fā)明專利范圍的限制。應當指出的是，對于本領域的普通技術人員來說，在不脫離本發(fā)明構思的前提下，還可以做出若干變形和改進，這些都屬于本發(fā)明的保護范圍。因此，本發(fā)明專利的保護范圍應以所附權利要求為準。
【主權項】
1.一種自動捕捉目標物的系統(tǒng)，其特征在于，包括: 圖像采集模塊，用于采集包含有用戶手勢和目標物的圖像；手勢識別模塊，用于識別用戶手勢并輸出手勢識別結果，所述手勢識別結果為手拿物體的手勢或手指向物體的手勢；圖像識別模塊，用于根據(jù)所述手勢識別結果確定目標物的位置、識別目標物，并輸出圖像識別結果；交互模塊，用于根據(jù)所述圖像識別結果與用戶進行交互。2.根據(jù)權利要求1所述的自動捕捉目標物的系統(tǒng)，其特征在于，所述圖像識別模塊包括: 目標物捕捉單元，用于根據(jù)所述手勢識別結果確定目標物的位置；圖像處理單元，用于提取目標物的圖像特征；圖像識別單元，用于將目標物的圖像特征與預存的模版特征進行比較以獲取目標物信息; 結果輸出單元，用于輸出所述目標物信息作為圖像識別結果。3.根據(jù)權利要求1所述的自動捕捉目標物的系統(tǒng)，其特征在于，所述目標物為單獨個體或為單獨個體中的一個部分。4.根據(jù)權利要求1所述的自動捕捉目標物的系統(tǒng)，其特征在于，還包括: 語音采集模塊，用于采集用戶語音；語音識別模塊，用于識別用戶的語音并輸出語音識別結果；所述交互模塊還用于根據(jù)所述圖像識別結果和所述語音識別結果與用戶進行交互。5.根據(jù)權利要求1所述的自動捕捉目標物的系統(tǒng)，其特征在于，所述交互模塊包括顯示單元和/或語音播放單元；其中，所述顯示單元用于顯示所述圖像識別結果；所述語音播放單元用于播放所述圖像識別結果。6.一種自動捕捉目標物的方法，其特征在于，包括: 采集包含有用戶手勢和目標物的圖像；識別用戶手勢并輸出手勢識別結果，所述手勢識別結果為手拿物體的手勢或手指向物體的手勢；根據(jù)所述手勢識別結果確定目標物的位置、識別目標物，并輸出圖像識別結果；根據(jù)所述圖像識別結果與用戶進行交互。7.根據(jù)權利要求6所述的自動捕捉目標物的方法，其特征在于，所述根據(jù)所述手勢識別結果確定目標物的位置、識別目標物，并輸出圖像識別結果的步驟，包括: 根據(jù)所述手勢識別結果確定目標物的位置；提取目標物的圖像特征；將目標物的圖像特征與預存的模版特征進行比較以獲取目標物信息；輸出所述目標物信息作為圖像識別結果。8.根據(jù)權利要求6所述的自動捕捉目標物的方法，其特征在于，所述目標物為單獨個體或為單獨個體中的一個部分。9.根據(jù)權利要求6所述的自動捕捉目標物的方法，其特征在于，還包括: 采集用戶語音；識別用戶的語音并輸出語音識別結果；所述根據(jù)所述圖像識別結果與用戶進行交互的步驟具體為: 根據(jù)所述圖像識別結果和所述語音識別結果與用戶進行交互。10.根據(jù)權利要求6所述的自動捕捉目標物的方法，其特征在于，所述根據(jù)所述圖像識別結果與用戶進行交互的步驟包括顯示所述圖像識別結果的步驟和/或包括播放所述圖像識別結果的步驟。
【專利摘要】本發(fā)明涉及一種自動捕捉目標物的系統(tǒng)和方法，所述系統(tǒng)包括：圖像采集模塊，用于采集包含有用戶手勢和目標物的圖像；手勢識別模塊，用于識別用戶手勢并輸出手勢識別結果，所述手勢識別結果為手拿物體的手勢或手指向物體的手勢；圖像識別模塊，用于根據(jù)所述手勢識別結果確定目標物的位置、識別目標物，并輸出圖像識別結果；交互模塊，用于根據(jù)所述圖像識別結果與用戶進行交互。本發(fā)明可以提高識別準確度和交互性能。
【IPC分類】G06K9/00
【公開號】CN105205454
【申請?zhí)枴緾N201510537481
【發(fā)明人】劉國華
【申請人】深圳市國華識別科技開發(fā)有限公司
【公開日】2015年12月30日
【申請日】2015年8月27日

完整全部詳細技術資料下載

當前第2頁1 2

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

自動捕捉目標物的系統(tǒng)和方法_2