一種圖文采集識別裝置制造方法
【專利摘要】本實用新型實施例提供的一種圖文采集識別裝置,包括:多點(diǎn)圖像信息采集單元和圖像信息識別單元,所述多點(diǎn)圖像信息采集單元與所述圖像信息識別單元連接,并將采集的被拍攝對象的多角度和/或多位置的圖像信息傳送給所述圖像信息識別單元作為所述圖像信息識別單元識別所述圖像信息對應(yīng)的圖文內(nèi)容信息的依據(jù);其中,所多點(diǎn)圖像信息采集單元包括至少一個可活動式攝像頭;或者,所述多點(diǎn)圖像信息采集單元包括多個攝像頭;或者,所述多點(diǎn)圖像信息采集單元包括一個固定式攝像頭,所述固定式攝像頭包括多個鏡頭。本實用新型實施例的實現(xiàn)使得在圖像信息采集過程中可以靈活地獲得需要采集圖像信息區(qū)域中的不同角度或不同位置的圖像信息,從而令后續(xù)的圖文識別處理過程中可以準(zhǔn)確識別出相應(yīng)的圖文內(nèi)容信息。
【專利說明】一種圖文采集識別裝置
【技術(shù)領(lǐng)域】
[0001]本實用新型涉及圖像采集識別處理【技術(shù)領(lǐng)域】,尤其涉及一種圖文采集識別裝置。
【背景技術(shù)】
[0002]隨著圖像處理技術(shù)的發(fā)展,相應(yīng)的圖像采集識別技術(shù)的應(yīng)用也日益廣泛,然而,目前的圖像采集識別技術(shù)中,通常為采用單個普通攝像頭固定安裝于待采集圖像區(qū)域中進(jìn)行圖像的采集操作,這種采集圖像的處理方式使得采集到的圖像信息經(jīng)常無法真實準(zhǔn)確地反應(yīng)被采集區(qū)域中的實際情況,即無法獲得被告采集區(qū)域中的真實準(zhǔn)確的圖像,進(jìn)而導(dǎo)致后續(xù)的識別處理過程中無法準(zhǔn)確識別出相應(yīng)的圖文內(nèi)容信息。
[0003]具體地,若以普通攝像頭進(jìn)行圖像采集,為了獲得對所需采集對象的覆蓋,則需要較遠(yuǎn)距離設(shè)置相應(yīng)的攝像頭。若試圖用廣角鏡或魚眼鏡在短距離對所需采集對象的覆蓋則將產(chǎn)生較大的失真。而且單一固定攝像頭其單一焦距導(dǎo)致所拍攝對象只在焦距合適的那一小部分最清楚,其它部分則由于不在最佳焦距位置處,則不夠清晰。而且對彎曲表面(比如對打開的書中部的大彎曲)難以實現(xiàn)不失真的拍攝。而且,普通攝像頭的拍攝角度也只能在正上方才能對全部被拍攝對象有效拍攝,如果從側(cè)面或斜面拍攝則容易使部分不在最佳焦距而不清晰,并且由于投射原理,距攝像頭遠(yuǎn)端的物體成像小,分辨率會下降很多。因此,若采用普通單個固定攝像頭(即普通攝像頭)對所需采集對象的全面覆蓋則對攝像頭分辨率要求很高,且無法達(dá)到理想拍攝效果。
[0004]再者,目前的圖書出版發(fā)行量已經(jīng)非常大。但目前還存在一部分人群,如兒童、盲人、老年人等,其不方便對圖書直接進(jìn)行閱讀,針對這部分人群需要輔助閱讀發(fā)聲設(shè)備進(jìn)行閱讀,而目前沒有針對普通圖書的輔助閱讀發(fā)聲設(shè)備。
【發(fā)明內(nèi)容】
[0005]本實用新型的目的是提供一種圖文采集識別裝置,從而可以準(zhǔn)確方便地采集到期望的圖像信息,以提高識別處理過程的準(zhǔn)確性。
[0006]本實用新型的目的是通過以下技術(shù)方案實現(xiàn)的:
[0007]—種圖文采集識別裝置,包括:多點(diǎn)圖像信息采集單元和圖像信息識別單元,所述多點(diǎn)圖像信息采集單元與所述圖像信息識別單元連接,并將采集的被拍攝對象的多角度和/或多位置的圖像信息傳送給所述圖像信息識別單元作為所述圖像信息識別單元識別所述圖像信息對應(yīng)的圖文內(nèi)容信息的依據(jù);其中,
[0008]所多點(diǎn)圖像信息采集單元包括至少一個可活動式攝像頭,所述可活動式攝像頭的拍照角度和/或位置是可調(diào)整的,所述可活動式攝像頭與驅(qū)動電機(jī)連接,所述驅(qū)動電機(jī)控制所述可活動式攝像頭的旋轉(zhuǎn)和/或移動;或者,所述多點(diǎn)圖像信息采集單元包括多個攝像頭,即二個或三個或四個或四個以上攝像頭,且每個攝像頭為固定式攝像頭或可活動式攝像頭,所述可活動式攝像頭的拍照角度和/或位置是可調(diào)整的,所述可活動式攝像頭是手動控制或與驅(qū)動電機(jī)連接,所述驅(qū)動電機(jī)控制所述可活動式攝像頭的旋轉(zhuǎn)和/或移動;或者,所述多點(diǎn)圖像信息采集單元包括一個固定式攝像頭,所述固定式攝像頭包括多個鏡頭。
[0009]所述可活動式攝像頭包括可旋轉(zhuǎn)式攝像頭和/或可移動式攝像頭,即所述可活動式攝像頭可旋轉(zhuǎn)或可移動或可移動可旋轉(zhuǎn);或者,所述可活動式攝像頭包括一個或多個可活動式鏡頭;所述可活動式攝像頭設(shè)置于需要采集所述圖像信息的區(qū)域的位置包括:所述區(qū)域的邊緣上方和/或斜上方和/或正上方。
[0010]所述固定式攝像頭包括一個或多個鏡頭,且所述攝像頭設(shè)置于需要采集所述圖像信息的區(qū)域的位置包括:所述區(qū)域的邊緣上方和/或斜上方和/或正上方。
[0011]所述圖像信息識別單元包括圖文識別模塊和動作識別模塊。
[0012]該裝置還包括:
[0013]音頻單元,與所述圖像信息識別單元連接,并在所述多點(diǎn)圖像信息采集單元將采集的圖書中當(dāng)前閱讀頁的或印刷品當(dāng)前閱讀位置的或閱讀操作指示位置的或包含書目信息或包含頁碼信息的圖像信息傳遞給所述圖像信息識別單元,且所述圖像信息識別單元根據(jù)所述當(dāng)前閱讀頁的或印刷品當(dāng)前閱讀位置的或閱讀操作指示位置的或包含書目信息或包含頁碼信息的圖像信息識別出該當(dāng)前閱讀頁的或印刷品當(dāng)前閱讀位置的或閱讀操作指示的或書目信息或頁碼信息的文字內(nèi)容信息對應(yīng)的音頻信息后,獲取所述音頻信息,再將所述對應(yīng)的音頻信息通過揚(yáng)聲器以音頻形式輸出;
[0014]和/ 或,
[0015]與所述圖像信息識別單元連接,且用于獲取音頻信息的音頻輸入單元,;
[0016]和/ 或,
[0017]與所述圖像信息識別單元和/或所述音頻輸入單元連接,且用于存儲器內(nèi)容信息的存儲單元;
[0018]和/ 或,
[0019]與所述圖像信息識別單元連接,且用于顯示內(nèi)容信息的顯示單元;
[0020]和/ 或,
[0021]與所述圖像信息識別單元連接,且用于與計算機(jī)通信的通信單元。
[0022]由上述本實用新型提供的技術(shù)方案可以看出,本實用新型實施例提供的一種圖文采集識別裝置由于采用了獨(dú)特的攝像頭布置方案,使得在圖像信息采集過程中可以靈活地獲得需要采集圖像信息區(qū)域中(即被拍攝對象)多點(diǎn)的圖像信息(即不同角度和/或不同位置的圖像信息),從而可以使得采集到的圖像信息能夠真實準(zhǔn)確地反應(yīng)被采集區(qū)域中的實際情況,進(jìn)而使得后續(xù)的圖文識別處理過程中可以準(zhǔn)確識別出相應(yīng)的圖文內(nèi)容信息。從而使得該裝置也可以但不限于作為一種圖文錄入裝置等,圖文錄入比如全文錄入,或隨著對印刷品進(jìn)行閱讀操作的指示的選擇部分圖文進(jìn)行錄入等。另一方面,在該圖文采集識別裝置中,由于可以準(zhǔn)確進(jìn)行圖文內(nèi)容信息的識別,因而可以針對普通圖書進(jìn)行圖文識別處理,并結(jié)合相應(yīng)的發(fā)聲功能實現(xiàn)針對普通圖書的輔助閱讀發(fā)聲處理,從而為人們提供一種可以對普通圖書進(jìn)行輔助發(fā)聲的輔助閱讀發(fā)聲設(shè)備。
【專利附圖】
【附圖說明】
[0023]為了更清楚地說明本實用新型實施例的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本實用新型的一些實施例,對于本領(lǐng)域的普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他附圖。
[0024]圖1為本實用新型實施例提供的圖文采集識別裝置的結(jié)構(gòu)示意圖一;
[0025]圖2為本實用新型實施例提供的圖文采集識別裝置的結(jié)構(gòu)示意圖二 ;
[0026]圖3為本實用新型實施例提供的包含多個攝像頭的圖文采集識別裝置的結(jié)構(gòu)示意圖一;
[0027]圖4為本實用新型實施例提供的包含多個攝像頭的圖文采集識別裝置的結(jié)構(gòu)示意圖二 ;
[0028]圖5為本實用新型實施例提供的包含多個攝像頭的圖文采集識別裝置的結(jié)構(gòu)示意圖三;
[0029]圖6為本實用新型實施例提供的設(shè)置于邊緣上方的攝像頭的結(jié)構(gòu)示意圖;
[0030]圖7為本實用新型實施例提供的設(shè)置于斜上方的攝像頭的結(jié)構(gòu)示意圖一;
[0031]圖8為本實用新型實施例提供的設(shè)置于斜上方的攝像頭的結(jié)構(gòu)示意圖二 ;
[0032]圖9為本實用新型實施例提供的設(shè)置于正上方的攝像頭的結(jié)構(gòu)示意圖;
[0033]圖10為本實用新型實施例提供的多個攝像頭拍攝圖書上曲面的示意圖一;
[0034]圖11為本實用新型實施例提供的多個攝像頭拍攝圖書上曲面的示意圖二;
[0035]圖12為本實用新型實施例提供的多個攝像頭拍攝圖書上曲面的示意圖三;
[0036]圖13為本實用新型實施例提供的可旋轉(zhuǎn)式攝像頭旋轉(zhuǎn)前拍攝圖書上曲面的示意圖;
[0037]圖14為本實用新型實施例提供的可旋轉(zhuǎn)式攝像頭旋轉(zhuǎn)后拍攝圖書上曲面的示意圖;
[0038]圖15為本實用新型實施例提供的應(yīng)用實施例結(jié)構(gòu)示意圖。
【具體實施方式】
[0039]下面結(jié)合本實用新型實施例中的附圖,對本實用新型實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本實用新型一部分實施例,而不是全部的實施例?;诒緦嵱眯滦偷膶嵤├?,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本實用新型的保護(hù)范圍。
[0040]下面將結(jié)合附圖對本實用新型實施例作進(jìn)一步地詳細(xì)描述。
[0041]本實用新型實施例提供了一種圖文采集識別裝置,其具體實現(xiàn)結(jié)構(gòu)如圖1所示,可以包括:多點(diǎn)圖像信息采集單元和圖像信息識別單元,所述多點(diǎn)圖像信息采集單元與所述圖像信息識別單元連接,并將采集的圖像信息傳遞給所述圖像信息識別單元作為所述圖像信息識別單元識別所述圖像信息對應(yīng)的圖文內(nèi)容信息的依據(jù),以便于所述圖像信息識別單元能夠根據(jù)所述圖像信息識別出圖文內(nèi)容信息,所述多點(diǎn)圖像信息采集單元采用拍照方式獲得所述圖像信息,即所述多點(diǎn)圖像信息采集單元通過其包含的攝像頭拍攝獲得所述圖像息。
[0042]進(jìn)一步的,為實現(xiàn)針對被拍攝對象的多角度和/或多位置的多點(diǎn)圖像拍攝,相應(yīng)的多點(diǎn)圖像信息采集單元可以采用以下任一結(jié)構(gòu)實現(xiàn):
[0043](I)所述多點(diǎn)圖像信息采集單元可以包括至少一個可活動式攝像頭,所述可活動式攝像頭與驅(qū)動電機(jī)連接,所述驅(qū)動電機(jī)控制所述可活動式攝像頭的旋轉(zhuǎn)和/或移動,所述可活動式攝像頭基于預(yù)定的控制方式或接收的控制信息控制其活動以對被拍攝對象進(jìn)行多角度和/或多位置的多點(diǎn)圖像拍攝。例如,根據(jù)反饋?zhàn)詣涌刂?如根據(jù)拍攝圖像識別后的反饋?zhàn)鲎詣诱{(diào)整),比如當(dāng)手指示處超出范圍了或部分文字超出范圍了或頁碼超出范圍了,則自動調(diào)整可活動式攝像頭的角度和/或位置,這樣產(chǎn)品在工作過程中無需或少需人工干預(yù),或者,根據(jù)用戶輸入的控制信息(如用戶執(zhí)行的特定肢體動作或用戶通過操作按鍵輸入的預(yù)定控制信息等)控制所述攝像頭轉(zhuǎn)動或移動,或者,也可以根據(jù)預(yù)先設(shè)定的時間間隔自動控制所述攝像頭旋轉(zhuǎn)或移動,以進(jìn)行針對被拍攝對象的多角度和/或多位置的多點(diǎn)拍攝。
[0044]具體地,所述可活動式攝像頭包括可旋轉(zhuǎn)式攝像頭和/或可移動式攝像頭,即所述可活動式攝像頭可旋轉(zhuǎn)或可移動或可移動可旋轉(zhuǎn);或者,所述可活動式攝像頭包括一個或多個可活動式鏡頭;若所述可活動式攝像頭包含多個,則多個可活動式攝像頭包含的每個攝像頭用于采集全部或部分場景的圖文內(nèi)容信息;所述可活動式攝像頭可以設(shè)置于需要采集所述圖像信息的區(qū)域的位置包括:所述區(qū)域的邊緣上方和/或斜上方和/或正上方。
[0045]進(jìn)一步地,如圖15所示,相應(yīng)的多點(diǎn)圖像信息采集單元具體可以包括攝像頭,以及用于驅(qū)動攝像頭活動的轉(zhuǎn)向電機(jī)和相應(yīng)的機(jī)構(gòu)/或者直線電機(jī)及相應(yīng)的機(jī)構(gòu)。
[0046](2)所述多點(diǎn)圖像信息采集單元包括多個攝像頭,所述多個攝像頭用于完成多角度和/或多位置的多點(diǎn)圖像拍攝,且每個攝像頭為固定式攝像頭或可活動式攝像頭,所述可活動式攝像頭是手動控制或與驅(qū)動電機(jī)連接,所述驅(qū)動電機(jī)控制所述可活動式攝像頭的旋轉(zhuǎn)和/或移動,即所述可活動式攝像頭為基于預(yù)定的控制方式或基于接收的控制信息或手動控制其活動以對被拍攝對象進(jìn)行多角度和/或多位置的多點(diǎn)圖像拍攝。例如,根據(jù)反饋?zhàn)詣涌刂?如根據(jù)拍攝圖像識別后的反饋?zhàn)鲎詣诱{(diào)整),比如當(dāng)手指示處超出范圍了或部分文字超出范圍了或頁碼超出范圍了,則自動調(diào)整可活動式攝像頭的角度和/或位置,這樣產(chǎn)品在工作過程中無需或少需人工干預(yù),或者,根據(jù)用戶輸入的控制信息(如用戶執(zhí)行的特肢體定動作或用戶通過操作按鍵輸入的預(yù)定控制信息等)控制所述攝像頭轉(zhuǎn)動或移動,或者,也可以根據(jù)預(yù)先設(shè)定的時間間隔自動控制所述攝像頭旋轉(zhuǎn)或移動,以進(jìn)行針對被拍攝對象的多角度和/或多位置的多點(diǎn)拍攝。
[0047]具體地,所述固定式攝像頭包括一個或多個鏡頭,且若所述固定式攝像頭包括多個鏡頭,則基于預(yù)定的控制方式或接收的控制信息控制各個鏡頭采集所述圖文內(nèi)容信息,且所述預(yù)定的控制方式包括控制多個鏡頭中的全部鏡頭或部分鏡頭進(jìn)行多角度和/或多位置的多點(diǎn)圖像拍攝;
[0048]所述多個攝像頭包含的每個攝像頭用于采集全部或部分場景的圖文內(nèi)容信息;
[0049]在該方案(2)中,所述攝像頭可以設(shè)置于需要采集所述圖像信息的區(qū)域的位置包括:所述區(qū)域的邊緣上方和/或斜上方和/或正上方。
[0050]也就是說,在該圖文采集識別裝置中,相應(yīng)的多點(diǎn)圖像信息采集單元可以包含多個攝像頭,如圖3、圖4和圖5所示,相應(yīng)的多個攝像頭可以是以固定或可活動的方式設(shè)置于被拍攝對象所在區(qū)域的邊緣上方和/或斜上方和/或正上方,例如,可以設(shè)置于圖書的邊緣上方和/或斜上方和/或正上方,當(dāng)閱讀者在閱讀時設(shè)置的位置需要不影響閱讀者閱讀圖書即可,具體可以參照圖6、圖7、圖8和圖9所示。同時,由于采用了多個攝像頭,大大減小了對每個攝像頭所需要的拍攝覆蓋,增大了整體覆蓋,從而保證對識別所需要的拍攝覆蓋,多個攝像頭可以各自拍攝進(jìn)行各自的識別工作,也可將拍攝結(jié)果綜合后以供識別。
[0051](3)所述多點(diǎn)圖像信息采集單元包括一個固定式攝像頭,所述固定式攝像頭包括多個鏡頭,且基于預(yù)定的控制方式或接收的控制信息控制所述多個鏡頭包含的各個鏡頭采集所述圖文內(nèi)容信息,從而可以通過所述多個鏡頭實現(xiàn)對被拍攝對象進(jìn)行多角度和/或多位置的多點(diǎn)圖像拍攝,且所述預(yù)定的控制方式包括控制多個鏡頭中的全部鏡頭或部分鏡頭進(jìn)行多角度和/或多位置的多點(diǎn)圖像拍攝。例如,根據(jù)反饋?zhàn)詣涌刂?如根據(jù)拍攝圖像識別后的反饋?zhàn)鲎詣诱{(diào)整),比如當(dāng)手指示處超出范圍了或部分文字超出范圍了或頁碼超出范圍了,則自動調(diào)整可活動式攝像頭的角度和/或位置,這樣產(chǎn)品在工作過程中無需或少需人工干預(yù),或者,根據(jù)用戶輸入的控制信息(如用戶執(zhí)行的肢體定動作或用戶通過操作按鍵輸入的預(yù)定控制信息等)控制所述各個鏡頭對被拍攝對象的多角度和/或多位置進(jìn)行拍攝,或者,也可以根據(jù)預(yù)先設(shè)定的各個鏡頭采集被拍攝對象的多角度和/或多位置的圖像信息的方式自動控制所述各個鏡頭進(jìn)行拍攝(比如,可以設(shè)定各個鏡頭為依次拍攝被拍攝對象獲得相應(yīng)的圖像信息,也可以設(shè)定各個鏡頭同時拍攝被拍攝對象獲得相應(yīng)的圖像信息,或者,也可以設(shè)定部分鏡頭拍攝被拍攝對象獲得相應(yīng)的圖像信息,等等)。
[0052]具體地,在該方案(3)中,所述固定式攝像頭可以設(shè)置于需要采集所述圖像信息的區(qū)域的位置包括:所述區(qū)域的邊緣上方和/或斜上方和/或正上方,具體可以參照圖6、圖7、圖8和圖9所示。
[0053]固定攝像頭通常有固定的視野,但多個攝像頭可形成全面的覆蓋,而可活動式攝像頭在某一角度位置時有固定的視野,但其通過活動改變視野,因此也能形成全面的覆蓋,在具體實施中,如果固定攝像頭松動了,并不能視為可活動式攝像頭,同樣,即使攝像頭是可以活動的,但如果其工作過程中并不是靠活動來獲得所需的特別效果,比如全面的覆蓋等,則實際上仍屬于固定攝像頭方案。比如,若將可以活動的攝像頭事先調(diào)整到合適的角度位置等,但實際使用中并不需要進(jìn)行活動,或活動對特別的效果比如全面的覆蓋等作用很小,則實際上仍屬于固定攝像頭方案。
[0054]本實用新型實施例提供的圖文采集識別裝置中,所述圖文內(nèi)容信息具體可以但不限于包括:印刷品的圖片或文字內(nèi)容信息,和/或,空間靜物的圖片信息,和/或,肢體動作信息,和/或,對印刷品進(jìn)行閱讀操作的指示信息,和/或,操作物體的動作信息;即所述圖文內(nèi)容信息可以為印刷品的圖片或文字內(nèi)容信息、空間靜物的圖片信息、肢體動作信息、對印刷品進(jìn)行閱讀操作的指示信息以及操作物體的動作信息中的至少一項。對應(yīng)的相應(yīng)的圖像信息識別單元包括圖文識別模塊和動作識別模塊,以用于識別相應(yīng)的圖文或動作信息,相應(yīng)的圖文識別模塊和動作識別模塊均為現(xiàn)有技術(shù)中已存在的模塊,故在此不對其具體實現(xiàn)方式進(jìn)行詳細(xì)描述。
[0055]也就是說,相應(yīng)的圖像信息識別單元可以根據(jù)采集到的圖像信息識別出印刷品中的圖片或文字信息,或者,也可以識別出空間靜物的圖片(如根據(jù)采集到的空間靜物的圖像信息確定相應(yīng)的空間靜物的對應(yīng)圖片或文字說明等內(nèi)容信息),或者,也可以識別出用戶執(zhí)行的手勢動作等肢體動作信息(如識別預(yù)定的肢體動作所對應(yīng)的執(zhí)行指令含義等),或者,也可以識別出用戶操作物體的動作信息,或者,也可以識別出用戶對印刷品進(jìn)行閱讀時的閱讀操作指示,等等。進(jìn)一步地,對印刷品進(jìn)行閱讀操作的指示信息可以通過肢體動作信息或操作物體的動作信息實現(xiàn),即可以將特定的肢體動作或操作物體的動作作為某種閱讀操作的指示信息;也就是說,所述對印刷品進(jìn)行閱讀操作的指示信息可以包括:通過手或手持物體在印刷品上進(jìn)行的閱讀指示操作信息,如確定指示一點(diǎn)閱讀的指示或確定需要閱讀內(nèi)容的指示或確定是否需要閱讀的指示等,比如手在印刷品上指點(diǎn)、單擊、雙擊、滑動、翻頁坐寸O
[0056]本實用新型實施例提供的一種圖文采集識別裝置由于采用了獨(dú)特的攝像頭布置方案,使得在圖像信息采集過程中可以靈活地獲得需要采集被拍攝對象的多點(diǎn)圖像信息,即采集被拍攝對應(yīng)的不同角度和/或不同位置的圖像信息,從而可以使得采集到的圖像信息能夠真實準(zhǔn)確地反應(yīng)被拍攝對象的實際情況,進(jìn)而使得后續(xù)的圖文識別處理過程中可以準(zhǔn)確識別出相應(yīng)的圖文內(nèi)容信息,如準(zhǔn)確地識別出印刷品中的文字或圖片信息,或者,識別出用戶的肢體動作的含義,或者,識別出用戶操作物體執(zhí)行的動作的含義,或者,識別出用戶通過肢體動作或操作物體對圖書等印刷品的閱讀操作的含義,或者,識別出用戶指示的文字或圖片等等。
[0057]在本實用新型實施例提供的圖文采集識別裝置中,為便于用戶基于該裝置實現(xiàn)針對印刷品的有聲閱讀,則如圖2所示,在該裝置中還可以包括音頻單元,所述多點(diǎn)圖像信息采集單元將采集的圖書中當(dāng)前閱讀頁或印刷品當(dāng)前閱讀位置或閱讀操作指示位置或包含書目信息的或包含頁碼信息的圖像信息傳遞給所述圖像信息識別單元,所述圖像信息識別單元識別出根據(jù)所述當(dāng)前閱讀頁或印刷品當(dāng)前閱讀位置或閱讀操作指示位置或包含書目信息或包含頁碼信息的圖像信息識別出該當(dāng)前閱讀頁或印刷品當(dāng)前閱讀位置或閱讀操作指示位置或書目信息的或頁碼信息的文字內(nèi)容信息對應(yīng)的音頻信息并通知所述音頻單元,所述音頻單元將所述對應(yīng)的音頻信息以音頻形式輸出,從而可以實現(xiàn)針對印刷品中文字內(nèi)容的有聲朗讀,便于不方便直觀對圖書進(jìn)行閱讀的人群獲得普通圖書中的內(nèi)容信息。
[0058]進(jìn)一步地,參照圖15所示,相應(yīng)的圖像信息識別單元可以包括CPU (中央處理器)及存儲器等部件,相應(yīng)的音頻單元可以包括揚(yáng)聲器及相應(yīng)的驅(qū)動電路。
[0059]在通過所述音頻單元對印刷品進(jìn)行有聲閱讀操作過程中,所述多點(diǎn)圖像信息采集單元還包含閱讀位置信息采集模塊,用于通過攝像頭采集用戶閱讀操作位置(即用戶指定的印刷品當(dāng)前閱讀位置)的文字圖像信息,且所述圖像信息識別單元識別所述用戶閱讀操作位置的文字圖像信息包含的文字內(nèi)容,并將識別確定的所述文字內(nèi)容對應(yīng)的音頻信息或所述文字內(nèi)容轉(zhuǎn)換獲得的音頻信息通知所述音頻單元。其中,所述文字內(nèi)容對應(yīng)的音頻信息可以為該部分文字內(nèi)容的朗讀音頻信息,也可以為該文字內(nèi)容對應(yīng)的其他音頻信息,如對該文字內(nèi)容的解釋說明等音頻信息。
[0060]相應(yīng)的文字識別目前已經(jīng)逐漸進(jìn)入實用階段,相應(yīng)的識別處理過程可以包括:首先對拍照的圖像預(yù)處理,該預(yù)處理主要包括二值化、噪聲去除、傾斜較正等處理,然后進(jìn)行文字特征抽取,包括對文字影像細(xì)線化后,取得字的筆劃端點(diǎn)、交叉點(diǎn)之?dāng)?shù)量及位置,或以筆劃段為特征,配合比對方法進(jìn)行比對,從而識別文字。由于文字識別技術(shù)已經(jīng)為現(xiàn)有技術(shù),故在此不再對其進(jìn)行詳細(xì)說明。
[0061]在該圖文采集識別裝置中,由于可以準(zhǔn)確進(jìn)行圖文內(nèi)容信息的識別,因而可以針對普通圖書進(jìn)行圖文識別處理,并結(jié)合相應(yīng)的發(fā)聲功能實現(xiàn)針對普通圖書的輔助閱讀發(fā)聲處理,從而為人們提供一種可以對普通圖書進(jìn)行輔助發(fā)聲的輔助閱讀發(fā)聲設(shè)備,這就使得兒童、盲人、老年人等不方便對圖書直接進(jìn)行閱讀的人群可以借助該圖文采集識別裝置進(jìn)行輔助閱讀,極大地方便了這部分人群對普通圖書的閱讀操作。而且,識別過程的準(zhǔn)確性還可以保證圖書閱讀過程能夠順暢地進(jìn)行,進(jìn)一步保證了閱讀用戶具有較佳的閱讀體驗。
[0062]在本實用新型實施例提供的圖文采集識別裝置中,為便于保存識別出的圖文內(nèi)容信息,在該裝置中還可以包括存儲單元,用于保存所述圖像信息識別單元識別出的所述圖文內(nèi)容信息,以方便后續(xù)對所述圖文內(nèi)容信息的調(diào)用。
[0063]在本實用新型實施例提供的圖文采集識別裝置中,所述多點(diǎn)圖像信息采集單元還可以采集的包含有圖書的書目信息的圖像信息并傳遞給所述圖像信息識別單元,所述圖像信息識別單元根據(jù)所述包含有圖書的書目信息的圖像信息識別出圖書名稱。進(jìn)一步地,還可以通過音頻或顯示的方式輸出所述圖書名稱,例如,可以通過所述音頻單元朗讀出圖書名稱,或通過顯示屏顯示出圖書名稱。
[0064]進(jìn)一步地,所述多點(diǎn)圖像信息采集單元可以通過所述攝像頭采集圖書封皮的圖像信息作為包含所述圖書的書目信息的圖像信息,所述圖像信息識別單元則可以通過識別所述圖書封皮(包含封面、封底等)的圖像信息中的文字確定圖書名稱,或者,也可以通過識別所述圖書封皮的圖像信息確定圖書名稱,或者,還可以通過識別所述圖書封皮的圖像信息中的標(biāo)簽確定圖書名稱,相應(yīng)的標(biāo)簽包括特制的標(biāo)簽或編碼,或者也可以包括ISBN條碼(國際標(biāo)準(zhǔn)書號,Internat1nal Standard Book Number)等目前已經(jīng)存在的標(biāo)簽或編碼。
[0065]由于每本書的封面和封底圖像均各不相同,故可以通過拍攝到的圖像信息進(jìn)行對比識別,或提取特征對比從而識別出具體為哪一本圖書,從而確定相應(yīng)的圖書名稱。而且,為便于識別,還可以在圖書中設(shè)置相應(yīng)的便于識別的標(biāo)簽,使得根據(jù)該標(biāo)簽可以確定當(dāng)前圖書的具體圖書名稱,相應(yīng)的標(biāo)簽可以為印制于圖書上的標(biāo)簽,也可以為粘貼于圖書上的標(biāo)簽,且相應(yīng)的標(biāo)簽上可以為圖片或編碼或文字等內(nèi)容信息。由于具體的圖像識別技術(shù)已經(jīng)為現(xiàn)有技術(shù),故在此不再對其進(jìn)行詳細(xì)說明。
[0066]在本發(fā)明實施例提供的圖文采集識別裝置中,所述多點(diǎn)圖像信息采集單元還可以采集包含有頁碼信息的圖像信息并傳遞給所述圖像信息識別單元,所述圖像信息識別單元根據(jù)所述包含有頁碼信息的圖像信息識別出頁碼。進(jìn)一步地,還可以通過音頻或顯示的方式輸出所述圖書名稱,例如,可以通過所述音頻單元朗讀出頁碼,或通過顯示屏顯示出頁碼。
[0067]所述頁碼信息采集模塊通過識別所述圖書內(nèi)頁的圖像信息確定當(dāng)前閱讀的頁碼,或者,通過識別所述圖書內(nèi)頁的圖像信息中的文字或數(shù)字頁碼確定當(dāng)前閱讀的頁碼。
[0068]該圖文采集識別裝置還可以包括顯示單元,用于顯示設(shè)定的內(nèi)容信息和/或采集識別過程中獲得的圖像和文字信息和/或外部獲得的內(nèi)容信息,例如,可以顯示當(dāng)前圖書閱讀的頁碼或圖書名稱等信息,或者,顯示針對圖書的解釋說明信息(如作者介紹等),或者,顯示所述圖像信息識別單元識別出的用戶的操作指令,或者,播放用于對圖書進(jìn)行解釋的視頻彳目息,等等。
[0069]具體地,該圖文采集識別裝置還可以包括以下任一項或多項單元:
[0070]音頻輸入單元,用于獲取音頻信息。相應(yīng)的獲取后的音頻信息可以通過存儲單元進(jìn)行保存。
[0071]存儲單元,包括存儲音頻信息和/或保存采集識別過程中獲得的圖像和/或文字信息和/或保存外部獲得的內(nèi)容信息,保存的語音信息可以在需要時通過音頻單元進(jìn)行播放,例如,通過音頻輸入單元和該存儲單元及音頻單元的配合,可以校正語言學(xué)習(xí)過程中用戶的發(fā)音是否準(zhǔn)確等。
[0072]通信單元,用于與計算機(jī)之間進(jìn)行通信。
[0073]輸入單元,與所述圖像信息識別單元連接,用于獲得輸入信息,比如按鍵輸入、手寫輸入,屏幕輸入等。
[0074]再者,為加強(qiáng)用戶與該圖文采集識別裝置之間的互動處理,提升用戶使用該圖文采集識別裝置的體驗,在該裝置中還可以包括互動處理模塊,用于獲取用戶的互動操作控制信息,并根據(jù)所述互動操作控制信息執(zhí)行預(yù)定的互動操作,且所述互動操作控制信息包括肢體動作、操作物體的動作、語音信息、屏幕輸入或操作按鍵中的至少一項;在互動處理過程中,圖文采集識別裝置還可以通過所述音頻單元向用戶播放特定提示聲音信息,或者也可以通過所述顯示單元向用戶顯示特定的內(nèi)容信息,且用戶可以根據(jù)相應(yīng)的提示聲音信息或顯示的特定的內(nèi)容信息向圖文采集識別裝置傳遞相應(yīng)的互動操作控制信息,以便于與圖文采集識別裝置進(jìn)行互動。具體地,相應(yīng)的互動操作控制信息可以包括在印刷品上進(jìn)行的閱讀操作指示信息等,以通過肢體動作進(jìn)行互動操作為例,對于閱讀普通圖書的用戶可以通過手或手持物體的動作與圖文采集識別裝置之間互動以對閱讀方式或閱讀內(nèi)容進(jìn)行互動控制等,如通過預(yù)定手勢控制重新閱讀一次當(dāng)前位置的內(nèi)容等。通過該互動處理模塊可以識別閱讀用戶的肢體動作或操作物體動作,以便于該裝置可以與閱讀用戶之間進(jìn)行互動,從而提升閱讀用戶的閱讀體驗,使得圖書成為有聲媒體和互動媒體。
[0075]在本實用新型實施例中,通過相應(yīng)的多點(diǎn)圖像采集近距離就可以對所需采集對象的覆蓋且不失真。具體地,相應(yīng)的活動攝像頭或多個攝像頭會有多個焦距,這樣就能使所采集對象所有部分都處于最佳焦距,以保證各部分的圖像均清晰。
[0076]例如,參照圖10、圖11、圖12、圖13和圖14所示,由于采用了多攝像頭或可活動式攝像頭(如可轉(zhuǎn)頭式攝像頭)的結(jié)構(gòu),對于彎曲表面(比如圖書中部的大彎曲面)總能有合適的拍攝角度和位置,因此能有效地對其進(jìn)行拍攝識別,相應(yīng)的拍攝角度無論正上方還是偵愐斜面都能對拍攝對象有效拍攝,各部分都在良好焦距內(nèi)而獲得清晰圖像和良好的分辨率。而且,相應(yīng)的多點(diǎn)圖像采集使得對攝像頭分辨率要求較低,或者說以同樣分辨率的攝像頭對所拍攝物進(jìn)行拍攝可以達(dá)到更高的分辨率(更有利于識別)。
[0077]進(jìn)一步地,如圖15所示,除上述音頻輸入單元(即語音輸入模塊)外,還可以包括手寫輸入模塊,屏幕輸入模塊或手勢輸入模塊等。相應(yīng)的通信接口可以為USB接口等。相應(yīng)的存儲單元還可以包括擴(kuò)展存儲空間,如SD卡等。
[0078]以上所述,僅為本實用新型較佳的【具體實施方式】,但本實用新型的保護(hù)范圍并不局限于此,任何熟悉本【技術(shù)領(lǐng)域】的技術(shù)人員在本實用新型披露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本實用新型的保護(hù)范圍之內(nèi)。因此,本實用新型的保護(hù)范圍應(yīng)該以權(quán)利要求書的保護(hù)范圍為準(zhǔn)。
【權(quán)利要求】
1.一種圖文采集識別裝置,其特征在于,包括:多點(diǎn)圖像信息采集單元和圖像信息識別單元,所述多點(diǎn)圖像信息采集單元與所述圖像信息識別單元連接,并將采集的被拍攝對象的多角度和/或多位置的圖像信息傳送給所述圖像信息識別單元作為所述圖像信息識別單元識別所述圖像信息對應(yīng)的圖文內(nèi)容信息的依據(jù);其中, 所多點(diǎn)圖像信息采集單元包括至少一個可活動式攝像頭,所述可活動式攝像頭的拍照角度和/或位置是可調(diào)整的,所述可活動式攝像頭與驅(qū)動電機(jī)連接,所述驅(qū)動電機(jī)控制所述可活動式攝像頭的旋轉(zhuǎn)和/或移動;或者,所述多點(diǎn)圖像信息采集單元包括多個攝像頭,且每個攝像頭為固定式攝像頭或可活動式攝像頭,所述可活動式攝像頭的拍照角度和/或位置是可調(diào)整的,所述可活動式攝像頭是手動控制或與驅(qū)動電機(jī)連接,所述驅(qū)動電機(jī)控制所述可活動式攝像頭的旋轉(zhuǎn)和/或移動;或者,所述多點(diǎn)圖像信息采集單元包括一個固定式攝像頭,所述固定式攝像頭包括多個鏡頭。
2.根據(jù)權(quán)利要求1所述的圖文采集識別裝置,其特征在于,所述可活動式攝像頭包括可旋轉(zhuǎn)式攝像頭和/或可移動式攝像頭;或者,所述可活動式攝像頭包括一個或多個可活動式鏡頭;所述可活動式攝像頭設(shè)置于需要采集所述圖像信息的區(qū)域的位置包括:所述區(qū)域的邊緣上方和/或斜上方和/或正上方。
3.根據(jù)權(quán)利要求1所述的圖文采集識別裝置,其特征在于,所述固定式攝像頭包括一個或多個鏡頭,且所述攝像頭設(shè)置于需要采集所述圖像信息的區(qū)域的位置包括:所述區(qū)域的邊緣上方和/或斜上方和/或正上方。
4.根據(jù)權(quán)利要求1所述的圖文采集識別裝置,其特征在于,所述圖像信息識別單元包括圖文識別模塊和動作識別模塊。
5.根據(jù)權(quán)利要求1、2、3或4所述的圖文采集識別裝置,其特征在于,該裝置還包括: 音頻單元,與所述圖像信息識別單元連接,并在所述多點(diǎn)圖像信息采集單元將采集的圖書中當(dāng)前閱讀頁的或印刷品當(dāng)前閱讀位置的或閱讀操作指示位置的或包含書目信息或包含頁碼信息的圖像信息傳遞給所述圖像信息識別單元,且所述圖像信息識別單元根據(jù)所述當(dāng)前閱讀頁的或印刷品當(dāng)前閱讀位置的或閱讀操作指示位置的或包含書目信息或包含頁碼信息的圖像信息識別出該當(dāng)前閱讀頁的或印刷品當(dāng)前閱讀位置的或閱讀操作指示的或書目信息的或頁碼信息的文字內(nèi)容信息對應(yīng)的音頻信息后,獲取所述音頻信息,再將所述對應(yīng)的音頻信息通過揚(yáng)聲器以音頻形式輸出; 和/或, 與所述圖像信息識別單元連接,且用于獲取音頻信息的音頻輸入單元; 和/或, 與所述圖像信息識別單元和/或所述音頻輸入單元連接,且用于存儲器內(nèi)容信息的存儲單元; 和/或, 與所述圖像信息識別單元連接,且用于顯示內(nèi)容信息的顯示單元; 和/或, 與所述圖像信息識別單元連接,且用于與計算機(jī)通信的通信單元; 和/或, 與所述圖像信息識別單元連接,且用于獲得輸入信息的輸入單元。
【文檔編號】H04N1/04GK204046697SQ201420038757
【公開日】2014年12月24日 申請日期:2014年1月21日 優(yōu)先權(quán)日:2013年1月25日
【發(fā)明者】陳旭 申請人:陳旭