欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

使用聽覺信號捕獲和呈現(xiàn)文本的制作方法

文檔序號:6454998閱讀:162來源:國知局

專利名稱::使用聽覺信號捕獲和呈現(xiàn)文本的制作方法
技術(shù)領(lǐng)域
:公開的實施例一般涉及設(shè)計成幫助有某些缺陷的人并增強這些人的獨立性的自適應(yīng)技術(shù)的領(lǐng)域。具體而言,公開的實施例涉及協(xié)助把文本處理成可聽見的聲音的系統(tǒng),以供那些遭受誦讀困難、弱視或者其它有閱讀困難的缺陷的人使用。
背景技術(shù)
:現(xiàn)代社會嚴重依賴基于模擬文本(analogtext)的信息來傳遞和記錄知識。然而,對于為數(shù)不少的人來說,即使并非不可能,閱讀仍是令人生畏的。這種人包括那些有學(xué)習(xí)障礙(LD)、失明以及由糖尿病視網(wǎng)膜病變、白內(nèi)障、與年齡相關(guān)的黃斑變性(AMD)、青光眼等所造成其它視覺損傷的人。目前的研究表明在20人中至少1人患有誦讀困難(LD的一種常見形式),且IO人中至少1人受到使人讀或?qū)懽址芟薜钠渌问降腖D所影響。LD是影響人執(zhí)行例如閱讀和拼寫等的語言動作的能力的遺傳神經(jīng)生理學(xué)差異。這種殘疾在不同的個體中可以表現(xiàn)出具有不同劇烈程度的不同癥狀。如誦讀困難之類的LD的確切起因和病理生理學(xué)仍存在爭議,并且迄今為止尚未找到使狀況完全康復(fù)的治療方法。通常,將受LD影響的個體納入針對調(diào)整學(xué)習(xí)以盡力幫助此類個體以常規(guī)方式閱讀的治療程序。雖然,早期診斷是幫助LD個體成功的關(guān)鍵,但是由于缺乏對該殘疾的系統(tǒng)性檢測,仍在很多成年人和兒童中有未發(fā)現(xiàn)的狀況。對于大多數(shù)來說,針對LD的現(xiàn)代方法一直是從教育的角度出發(fā),希望強制受LD影響的人們象其他人一樣學(xué)習(xí)。這些方法導(dǎo)致多種多樣的結(jié)果,因為LD是基于生理方面的。純粹的意志或決心不足以重寫大腦和使竟爭環(huán)境^^平。本公開的實施例通過提供一種幫助受LD影響的個體的備選方法以解決此問題。除了LD群體之外,還有巨大的并且正在增加的弱視或者無視力人群。他們中的許多是老年人并且受影響的群體將在后20年中隨著嬰兒潮達到70歲及以上而增加。根據(jù)美國國立衛(wèi)生研究院(2004),許多個體有視力減弱或者可能發(fā)生視力減弱的狀況,例如,糖尿病的視網(wǎng)膜病、白內(nèi)障、老年或者中年AMD以及青光眼。見附表統(tǒng)計。另外,三百三十萬人因其它原因失明或者存在弱視。這些群體遭受的無能力去讀和閱讀可以對這些個體的日常生活產(chǎn)生破壞性的影響。例如,閱讀困難可以妨礙簡單動作和活動的執(zhí)行,并使得受影響的個體喪失對基于文本的重要信息的獲取、獨立性和相關(guān)的自尊。這樣,就存在一種技術(shù)需求,可以幫助LD群體容易地獲取基于文本的信息。<table>tableseeoriginaldocumentpage11</column></row><table>本公開的實施例被設(shè)計來滿足LD群體和弱視或者無視力群體的至少一些需要。
發(fā)明內(nèi)容本發(fā)明的一方面包括一種用于捕獲在對象上發(fā)現(xiàn)的文本的設(shè)備。本設(shè)備包含圖像捕獲子系統(tǒng),該圖像捕獲子系統(tǒng)包括配置成捕獲多個圖像以形成視頻流的視頻照相機。本圖像捕獲子系統(tǒng)配置成從視頻流產(chǎn)生主圖像。本設(shè)備又包含光學(xué)字符識別("OCR")子系統(tǒng),該OCR子系統(tǒng)配置成處理主圖像以形成對應(yīng)于對象上的至少一些文本的數(shù)字文本。本發(fā)明的另一個方面包括一種用于捕獲在對象上發(fā)現(xiàn)的文本的系統(tǒng)。本系統(tǒng)包含包含配置成捕獲多個圖像以形成視頻流的視頻照相機的圖像捕獲子系統(tǒng),其中該圖像捕獲子系統(tǒng)配置成從視頻流產(chǎn)生主圖像;配置成從該主圖像創(chuàng)建數(shù)字文本的文本捕獲沖莫塊;以及配置成將i某體類型與在對象上發(fā)現(xiàn)的文本關(guān)聯(lián)的材料上下文組件,其中該系統(tǒng)配置成根據(jù)々某體類型組織此數(shù)字文本。本發(fā)明的另一方面涉及,其中外殼包含OCR子系統(tǒng)和圖像捕獲子系統(tǒng)的特征。本發(fā)明的另一方面涉及,其中文本閱讀器系統(tǒng)配置成將數(shù)字文本轉(zhuǎn)換為多種輸出格式的特征。本發(fā)明的另一方面涉及,其中外殼包含文本讀取系統(tǒng)、OCR系統(tǒng)和圖像捕獲子系統(tǒng)的特征。本發(fā)明的另一方面涉及,其中圖像捕獲子系統(tǒng)包括配置成確定該設(shè)備是否與該對象的表面水平的水平檢測器的特征。本發(fā)明的另一方面涉及,其中水平檢測器配置有指示器用于在該設(shè)備與對象表面成合適的角度時發(fā)出信號的特征。本發(fā)明的另一方面涉及,其中圖像捕獲子系統(tǒng)還包括配置成當捕獲多個捕獲的圖像時補償設(shè)備的不穩(wěn)定定位的圖像穩(wěn)定器的特征。本發(fā)明的另一方面涉及,其中圖像捕獲子系統(tǒng)還包括配置成為OCR處理優(yōu)化多個捕獲的圖像的色差檢測器的特征。本發(fā)明的另一方面涉及,其中圖像捕獲子系統(tǒng)還包括配置成在捕獲之前改變圖像的變焦裝置(zoom)的特征。本發(fā)明的另一方面涉及,其中圖像捕獲子系統(tǒng)還包括焦距調(diào)節(jié)器的特征。本發(fā)明的另一方面涉及,其中圖像捕獲子系統(tǒng)還包括光圈調(diào)節(jié)器的特征。本發(fā)明的另一方面涉及,其中光圏調(diào)節(jié)器配置成與焦距調(diào)節(jié)器一起操作來改變其中對象呈現(xiàn)的景深的特征。本發(fā)明的另一方面涉及,其中圖像捕獲子系統(tǒng)還包括可調(diào)快門的特征。本發(fā)明的另一方面涉及,其中視頻照相機有在設(shè)備內(nèi)傾斜使得自動可調(diào)鏡頭與對象的表面水平的一個或多個自動可調(diào)鏡頭的特征。本發(fā)明的另一方面涉及,其中圖像捕獲子系統(tǒng)還包括光源的特征。本發(fā)明的另一方面涉及,其中文本閱讀器系統(tǒng)還配置成翻譯數(shù)字文本的特征。本發(fā)明的另一方面涉及,其中輸出格式是不同于在對象上所發(fā)現(xiàn)語言的語言的特征。本發(fā)明的另一方面涉及,其中輸出格式是從語音、布萊葉盲文和顯示大字印刷文本的組中選擇的特征。本發(fā)明的另一方面涉及,其中從不平坦對象捕獲文本的特征。本發(fā)明的另一方面涉及,在本設(shè)備中包含存儲器。本發(fā)明的另一方面涉及,其中該存儲器配置成存儲從由字典、辭典、拼寫檢查程序和詞匯表組成的組中選擇的元素的特征。本發(fā)明的另一方面涉及,其中存儲器配置成存儲來自于數(shù)字文本的多個關(guān)4建信息的特征。本發(fā)明的另一方面涉及,其中存儲器還配置成能夠允許對多個關(guān)鍵信息進行搜索的特征。本發(fā)明的另一方面涉及,其中顯示器配置成顯示數(shù)字文本的特征。本發(fā)明的另一方面涉及,其中文本閱讀器系統(tǒng)還配置成在顯示器上呈現(xiàn)第一輸出格式的特征。本發(fā)明的另一方面涉及,其中文本閱讀器系統(tǒng)還配置成呈現(xiàn)語音形式的第二輸出格式的特征。本發(fā)明的另一方面涉及,其中文本閱讀器系統(tǒng)還配置成將第一輸出格式與第二輸出格式同步的特征。本發(fā)明的另一方面涉及,其中文本閱讀器系統(tǒng)還配置成在讀第二輸出格式的對應(yīng)文本時強調(diào)第一輸出格式的文本的特征。本發(fā)明的另一方面涉及,其中材料上下文組件還配置成將布局格式與^某體類型關(guān)聯(lián)的特征。本發(fā)明的另一方面涉及,其中材料上下文組件還配置成評估媒體類型和布局格式以確定在對象上發(fā)現(xiàn)的文本的布局的特征。本發(fā)明的另一方面涉及,其中存儲組件配置成存儲組織的數(shù)字文本的特征。本發(fā)明的另一方面涉及,其中輸出組件配置成將組織的數(shù)字文本轉(zhuǎn)換為輸出格式的特征。本發(fā)明的另一方面涉及,其中從由書、報紙、藥丸瓶、處方、飯店菜單和街道標志組成的組中選擇々某體類型的特征。本發(fā)明的另一方面涉及,其中布局格式包括從由列、腳注、圖片、標題、文本大小和文本顏色組成的組中選擇的元素的特征。本發(fā)明的另一方面涉及一種用于捕獲在對象上發(fā)現(xiàn)的文本以形成數(shù)字文本的方法。該方法包含捕獲此對象的多個圖像從多個圖像形成視頻流;從視頻流產(chǎn)生主圖像;以及處理此主圖像以形成數(shù)字文本。本發(fā)明的另一方面涉及,將^(某體類型與在對象上發(fā)現(xiàn)的文本關(guān)聯(lián)。本發(fā)明的另一方面涉及,根據(jù)i某體類型組織數(shù)字文本。本發(fā)明的另一方面涉及,將布局格式與》某體類型關(guān)聯(lián)。本發(fā)明的另一方面涉及,評估々某體類型和布局格式以確定在對象上發(fā)現(xiàn)的文本的布局。本發(fā)明的另一方面涉及,管理數(shù)字文本以用于后續(xù)訪問。本發(fā)明的另一方面涉及,將用于呈現(xiàn)的數(shù)字文本轉(zhuǎn)換為輸出格式。本發(fā)明的另一方面涉及,翻譯數(shù)字文本。本發(fā)明的另一方面涉及,翻譯數(shù)字文本,其中輸出格式是不同于在對象上所發(fā)現(xiàn)的文本的語言。本發(fā)明的另一方面涉及,翻譯數(shù)字文本,其中輸出格式是從由語音、布萊葉盲文和顯示大字印刷文本組成的組中選擇的。本發(fā)明的另一個方面涉及,顯示第一輸出格式以及將第二輸出格式作為語音發(fā)出。本發(fā)明的另一個方面涉及,將第一輸出格式與第二輸出格式同步。本發(fā)明的另一方面涉及,在讀第二輸出格式的對應(yīng)文本時強調(diào)第一輸出格式的文本。本發(fā)明的另一方面涉及,存儲從由字典、辭典、拼寫檢查程序和詞匯表組成的組中選擇的元素。本發(fā)明的另一方面涉及,存儲來自于數(shù)字文本的多個關(guān)鍵:信息。本發(fā)明的另一方面涉及,允許對多個關(guān)鍵信息進行搜索。本發(fā)明的另一方面涉及,>火不平坦的對象捕獲文本。本發(fā)明的另一方面涉及,創(chuàng)建用于成像的環(huán)境。本發(fā)明的另一方面涉及,照亮對象。本發(fā)明的另一方面涉及,調(diào)整焦距。本發(fā)明的另一方面涉及,在將對象成像時使用圖像濾波器(imagefilter)來增強對比度。本發(fā)明的另一方面涉及,通過照亮對象、自動調(diào)整焦距和使用圖像濾波器來增強多個捕獲的圖像。本發(fā)明的另一方面涉及,通過在照亮對象、自動調(diào)整焦距和使用圖像濾波器時實現(xiàn)反饋環(huán)路來增強多個捕獲的圖像。本發(fā)明的另一個方面涉及,一種呈現(xiàn)在基本平坦的對象上發(fā)現(xiàn)的文本的系統(tǒng)。本系統(tǒng)包含配置成定位用于成像的基本平坦的對象的對象操作子系統(tǒng);配置成捕獲基本平坦的對象的圖像的成像才莫塊;配置成從該基本平坦的對象的圖像捕獲文本的文本捕獲才莫塊;配置成將文本轉(zhuǎn)換為數(shù)字文本的OCR組件;配置成將纟某體類型與在基本平坦的對象上發(fā)現(xiàn)的文本關(guān)聯(lián)的材料上下文組件;以及配置成將數(shù)字文本轉(zhuǎn)換為輸出格式的輸出才莫塊,其中該系統(tǒng)配置成在將數(shù)字文本轉(zhuǎn)換為輸出格式之前根據(jù)々某體類型組織數(shù)字文本。本發(fā)明的另一方面涉及,一種用于捕獲在對象上發(fā)現(xiàn)的文本的系統(tǒng)。該系統(tǒng)包含配置成定位用于成像的對象的對象操作^t塊;配置成將對象成像的成像4莫塊;配置成從對象的圖像捕獲文本的文本捕獲模塊;配置成將來自于對象的文本轉(zhuǎn)換為數(shù)字文本的OCR組件;以及配置成組織數(shù)字文本以保持對象上的文本布局的材料上下文組件。本發(fā)明的另一方面涉及,一種用于捕獲在不平坦的對象上發(fā)現(xiàn)的文本的系統(tǒng)。本系統(tǒng)包含配置成將用于成像的不平坦的對象定位的對象操作模塊;配置成從不平坦的對象捕獲文本的成像模塊;以及配置成將文本轉(zhuǎn)換為數(shù)字文本的OCR組件。本發(fā)明的另一方面涉及,用于捕獲在對象上發(fā)現(xiàn)的文本的系統(tǒng)。本系統(tǒng)包含配置成操作對象的翻頁組件;配置成將對象定位的取景組件;配置成增強對象的對比度的燈配置成產(chǎn)生勾邊圖像的聚焦組件;配置成產(chǎn)生對象的圖像的圖像捕獲組件;配置成將圖像轉(zhuǎn)換為OCR適合的圖像的轉(zhuǎn)換組件;配置成處理OCR適合的圖像以創(chuàng)建排版頁掃描的圖像排版組件;配置成創(chuàng)建調(diào)節(jié)的圖像的圖像調(diào)節(jié)組件;配置成將調(diào)節(jié)的圖像轉(zhuǎn)換為數(shù)字文本的OCR組件,其中數(shù)字文本存儲在第一數(shù)據(jù)結(jié)構(gòu)中;配置成組織第一數(shù)據(jù)結(jié)構(gòu)以保持(retain)對象上的文本的布局的材料上下文組件;配置成將第一數(shù)據(jù)結(jié)構(gòu)存儲為第一存儲的數(shù)字文本的存儲組件;配置成管理從存儲組件訪問第一存儲的數(shù)字文本的庫管理程序組件;以及配置成包含翻頁組件、取景組件、燈、圖像捕獲組件、轉(zhuǎn)換組件、圖像排版組件、圖像調(diào)節(jié)組件、OCR組件和材料上下文組件的外殼。本發(fā)明的另一方面涉及,其中材料上下文組件還配置成將布局格式與i某體類型關(guān)聯(lián)的特征。本發(fā)明的另一方面涉及,其中材料上下文組件還配置成評估々某體類型和布局格式以確定在對象上發(fā)現(xiàn)的文本的布局的特征。本發(fā)明的另一方面涉及,其中圖像增強才莫塊為基本平坦的對象的成像創(chuàng)建環(huán)境的特征。本發(fā)明的另一方面涉及,其中輸出格式從由語音、布萊葉盲文和顯示大字印刷文本組成的組中選擇的特征。本發(fā)明的另一方面涉及,其中文本捕獲才莫塊還配置成從多個圖像捕獲文本的特征。本發(fā)明的另一方面涉及,其中輸出;f莫塊配置成將數(shù)字文本轉(zhuǎn)換為輸出格式的特征。本發(fā)明的另一方面涉及,其中文本捕獲沖莫塊還配置成從多個圖像捕獲文本的特征。本發(fā)明的另一方面涉及,其中輸出模塊還配置成翻譯數(shù)字文本的特征。本發(fā)明的另一方面涉及,其中輸出格式是不同于在對象上所發(fā)現(xiàn)的文本的語言的特征。本發(fā)明的另一個方面涉及,其中輸出格式還配置成顯示第一輸出格式并且在讀的時候發(fā)出第二輸出格式的特征。本發(fā)明的另一方面涉及,其中輸出;f莫塊還配置成將第一輸出格式與第二輸出格式同步的特征。本發(fā)明的另一方面涉及,其中輸出模塊還配置成在讀第二輸出格式的對應(yīng)文本時強調(diào)笫一輸出格式的文本的特征。本發(fā)明的另一方面涉及,其中數(shù)據(jù)模塊還配置成管理數(shù)字文本以用于后續(xù)訪問的特征。本發(fā)明的另一方面涉及,其中數(shù)據(jù)模塊還配置成管理對數(shù)字文本的訪問的特4i。本發(fā)明的另一方面涉及,其中輸出模塊配置成將數(shù)字文本轉(zhuǎn)換為輸出格式的特征。本發(fā)明的另一方面涉及,其中輸出模塊還配置成翻譯數(shù)字文本的特征。本發(fā)明的另一方面涉及,其中輸出格式是不同于在不平坦的對象上發(fā)現(xiàn)的文本的語言的特征。本發(fā)明的另一方面涉及,其中輸出格式從由語音、布萊葉盲文和顯示大字印刷文本組成的組中選擇的特征。本發(fā)明的另一方面涉及,其中輸出格式是語音并且作為打印文本顯示的特征。本發(fā)明的另一方面涉及,其中外殼還配置成包含存儲組件的特征。本發(fā)明的另一方面涉及,其中外殼還配置成包含庫管理程序組件的特征。本發(fā)明的另一方面涉及,其中輸出組件配置成將第一存儲的數(shù)字文本轉(zhuǎn)換為輸出格式的特征。本發(fā)明的另一個方面涉及,一種用于呈現(xiàn)在基本平坦的對象上發(fā)現(xiàn)的文本的方法。本方法包含定位基本平坦的對象用于成像從基本平坦的對象捕獲圖像;將圖像轉(zhuǎn)換為數(shù)字文本將々某體類型與在基本平坦的對象上發(fā)現(xiàn)的文本關(guān)聯(lián);根據(jù)媒體類型組織數(shù)字文本;以及將數(shù)字文本轉(zhuǎn)換為輸出格式。本發(fā)明的另一個方面涉及,一種用于捕獲在對象上發(fā)現(xiàn)的文本的方法。本方法包含定位對象用于成像;捕獲對象的圖像將圖像轉(zhuǎn)換為數(shù)字文本;將i某體類型與在對象上發(fā)現(xiàn)的文本關(guān)聯(lián)以及根據(jù)纟某體類型組織數(shù)字文本。本發(fā)明的另一個方面涉及,一種用于捕獲在不平坦的對象上發(fā)現(xiàn)的文本的方法。本方法包含定位用于成像的不平坦的對象;從不平坦的對象捕獲圖像;以及將圖像轉(zhuǎn)換為數(shù)字文本。本發(fā)明的另一方面涉及,一種用于捕獲在對象上發(fā)現(xiàn)的文本的方法。本方法包含操作對象來顯露對象的期望部分用于成像;對對象取景用于成像;照亮對象以增強對比度;聚焦于對象;捕獲對象的圖像;將圖像轉(zhuǎn)化為OCR適合的圖像;處理OCR適合的圖像以創(chuàng)建排版頁掃描;調(diào)節(jié)排版頁掃描以創(chuàng)建調(diào)節(jié)的圖像;將調(diào)節(jié)的圖像轉(zhuǎn)換為數(shù)字文本;在第一數(shù)據(jù)結(jié)構(gòu)中存儲數(shù)字文本;組織第一數(shù)據(jù)結(jié)構(gòu)以保持在對象上的文本的布局;以及將第一數(shù)據(jù)結(jié)構(gòu)存儲為第一存儲的數(shù)字文本。本發(fā)明的另一方面涉及,將布局格式與々某體類型關(guān)聯(lián)。本發(fā)明的另一方面涉及,評估媒體類型和布局格式以確定在基本平坦的對象上發(fā)現(xiàn)的文本的布局。本發(fā)明的另一方面涉及,管理數(shù)字文本以用于后續(xù)訪問。本發(fā)明的另一方面涉及,創(chuàng)建用于成像的環(huán)境。本發(fā)明的另一方面涉及,將多個圖像轉(zhuǎn)換為數(shù)字文本。本發(fā)明的另一方面涉及,>夂人由語音、布萊葉盲文和顯示大字印刷文本組成的組中選擇輸出格式。本發(fā)明的另一方面涉及,將布局格式與々某體類型關(guān)聯(lián)。本發(fā)明的另一方面涉及,評估々某體類型和布局格式以確定在對象上發(fā)現(xiàn)的文本的布局。本發(fā)明的另一方面涉及,管理數(shù)字文本以用于后續(xù)訪問。本發(fā)明的另一方面涉及,將用于呈現(xiàn)的數(shù)字文本轉(zhuǎn)換為輸出格式。本發(fā)明的另一方面涉及,翻譯數(shù)字文本。本發(fā)明的另一方面涉及,將輸出格式轉(zhuǎn)換為不同于在對象上所發(fā)現(xiàn)的文本的語言。本發(fā)明的另一方面涉及,照亮對象。本發(fā)明的另一方面涉及,調(diào)整焦距以變化景深。本發(fā)明的另一方面涉及,在將對象成像時使用圖像濾波器來提高對比度。本發(fā)明的另一方面涉及,通過照亮對象、自動調(diào)整焦距和使用圖像濾波器來增強多個捕獲的圖像。本發(fā)明的另一方面涉及,通過在照亮對象、自動調(diào)整焦距和使用圖像濾波器時實現(xiàn)反饋環(huán)路來增強多個捕獲的圖像。本發(fā)明的另一方面涉及,管理數(shù)字文本以用于后續(xù)訪問。本發(fā)明的另一方面涉及,將用于呈現(xiàn)的數(shù)字文本轉(zhuǎn)換為輸出格式。本發(fā)明的另一方面涉及,組織數(shù)字文本以保持對象上的文本布局。本發(fā)明的另一方面涉及,將々某體類型與在對象上發(fā)現(xiàn)的文本關(guān)聯(lián)。本發(fā)明的另一方面涉及,根據(jù)々某體類型組織數(shù)字文本。本發(fā)明的另一方面涉及,將布局格式與々某體類型關(guān)聯(lián)。本發(fā)明的另一方面涉及,評估々某體類型和布局格式以確定在對象上發(fā)現(xiàn)的文本的布局。圖1提供本發(fā)明的一些實施例的高度概述。圖2A和2B圖解本發(fā)明的示例手持實施例的正^L圖和側(cè)視圖。圖3A和3B圖解圖2A和2B所示裝置的后視圖和俯視圖。圖4A和4B提供在打開的配置中的示例獨立實施例的等距視圖和閉合配置中的獨立實施例的俯視圖。圖5A、5B和5C提供4A和4B所示獨立實施例的側(cè)視圖、外部前板的放大圖以及內(nèi)部背板的放大圖。圖6示出能被本發(fā)明的示例實施例捕獲和/或處理的含有黑色文本白色背景的書的樣本頁。圖7示出能^皮本發(fā)明的示例實施例捕獲和/或處理的彩色雜志刊物的樣本頁。圖8A、8B和8C圖解示例獨立實施例的示意圖。具體實施例方式本發(fā)明描述用于捕獲文本和使用聽覺信號來呈現(xiàn)文本的方法、系統(tǒng)、設(shè)備和圖像用戶接口。參考本發(fā)明的一些實施例,附圖中闡圖解了其示例。雖然結(jié)合實施例描述了本發(fā)明,但是應(yīng)該理解這無意將本發(fā)明限制于這些特定實施例。相反,本發(fā)明要覆蓋由所附權(quán)利要求所限定的本發(fā)明的精神和范圍內(nèi)的替換、修改和等效物。而且,在以下的說明中,為透徹地理解本發(fā)明,闡述了許多具體細節(jié)。然而,對本領(lǐng)域技術(shù)人員顯而易見是,沒有這些具體細節(jié)也可以實施本發(fā)明。在其它情況下,沒有詳細"i兌明本領(lǐng)域技術(shù)人員公知的方法、過程和組件,以免妨礙對本發(fā)明多個方面的理解。根據(jù)一些實施例,提供了一種允許系統(tǒng)將來自文檔或者其它對象的文本讀給人的系統(tǒng)。系統(tǒng)概述圖1提供本發(fā)明的一些實施例的高度概述。圖1的系統(tǒng)包括對象操作子系統(tǒng)102、成像子系統(tǒng)104、數(shù)據(jù)子系統(tǒng)106、以及輸出子系統(tǒng)108。子系統(tǒng)102-108包括以軟件、硬件或軟>哽件結(jié)合的方式實現(xiàn)的組件。對象操作子系統(tǒng)102包括諸如取景(fmming)110、頁照明(pagelighting)112、聚焦114和翻頁(pageturning)116的功能組件。成像子系統(tǒng)104包括諸如圖像捕獲118、頁排版(pagecomposition)120、圖像調(diào)節(jié)(imageconditioning)122和OCR124的功能組件。數(shù)據(jù)子系統(tǒng)106包括諸如材料上下文(materialcontext)126、存儲器128和庫管理程序(librarian)130的功能組件。輸出子系統(tǒng)108包括諸如文本到語音132、布萊葉盲文(Braille)機134、大的打印顯示器136和翻譯器(未示出)的功能組件。取景組件110幫助定位書或其它對象以使實施例的照相機組件能夠獲取書的頁或?qū)ο蟮谋砻娴倪m合圖像??梢允褂靡龑?dǎo)機構(gòu)來定位書或其它對象。引導(dǎo)機構(gòu)的非限制性示例包括機械式頁引導(dǎo)和光投影(下文中參考頁照明組件112作進一步說明)。頁照明組件112確保使用最佳照明以獲得高對比度(或其它合適的對比度)的圖像。作為非限制性示例,可以使用集成到系統(tǒng)中的LCD光源來提供合適的照明。例如,對于彩色圖像,頁照明112最優(yōu)地提供自然光語的光。另外,頁照明組件112所提供的光投影可以通過建立(laydown)光影圖像(lightandshadowimage)來引導(dǎo)書相對于成像裝置的圖像取景器的放置來用作書或其它對象的取景引導(dǎo)。聚焦組件114提供用于產(chǎn)生勾邊圖像的焦距的自動調(diào)整。例如,對于光學(xué)字符識別("OCR")應(yīng)用,高光圈系數(shù)是符合需要的。這樣,聚焦組件114將焦距調(diào)整到高光圈系數(shù)值來生成要應(yīng)用光學(xué)字符識別的圖像。聚焦組件l14可以包括微距聚焦特征用于近距攝影調(diào)焦。根據(jù)一些實施例,聚焦可以手動或者自動完成。在自動聚焦的情況,可以在反饋環(huán)路中結(jié)合成像子系統(tǒng)104使用計算機軟件或者計算機硬件或者計算機軟件和硬件的結(jié)合來完成期望的聚焦。翻頁組件116包括自動翻頁器,用于自動地翻頁以便將書的每一頁顯露給本系統(tǒng)的成像設(shè)備以獲得顯露的頁的圖像。根據(jù)一些實施例,翻頁組件116可以包括用戶可以通過按按^L來選擇翻頁的半自動翻頁器。翻頁組件116與成像子系統(tǒng)104同步,從而在頁被翻到新頁時成像子系統(tǒng)104能意識到新頁。響應(yīng)于新頁,成像子系統(tǒng)104捕獲新頁的圖像。可對每一新頁進行照明和焦距調(diào)整。翻頁組件116使書、雜志或者其它印刷材料的自動數(shù)字化成為可能。因此,用戶可以將書放在本設(shè)備中并且允許本設(shè)備在指定時間內(nèi)無人看管運行。在稍后的時間,用戶可以回來收集該書內(nèi)容的數(shù)字化版本。如果需要,該數(shù)字化的內(nèi)容可以轉(zhuǎn)移到另外的個人設(shè)備,并且/或者轉(zhuǎn)換為不同的數(shù)據(jù)格式,比如MP3或另一音頻文件格式。無需用戶輸入而取景、翻頁和組織內(nèi)容的能力是一些實施例的重要方面。圖像捕獲組件118捕獲頁或者其它對象的圖像并且將該圖像轉(zhuǎn)換為適合光學(xué)字符識別的格式。作為非限制性的例子,圖像捕獲組件118可以用照相的方式捕獲圖像然后將捕獲的圖像轉(zhuǎn)換為位圖。作為另一個非限制性的例子,圖像捕獲組件118可以捕獲流式視頻并且將該流式視頻轉(zhuǎn)換為合并的圖像。圖像捕獲組件118可以自動配置成使成像設(shè)備旋轉(zhuǎn)以解決給定頁的表面彎曲;基本平坦的對象很少有表面彎曲,然而不平坦的對象在它們的表面上有較大的表面彎曲。一個將使該概念顯而易見的例子是圖6,它的頁被描述為不平坦的結(jié)構(gòu)。圖像捕獲組件l18包括用于選擇最佳圖像的圖像處理軟件。與圖像捕獲組件關(guān)聯(lián)的成像裝置可以包含多個可變焦距的鏡頭。掃描來處理捕獲的圖像。例如,頁排版組件120識別在雜志的不同文章間的邏輯邊界,并且可以在該頁上的圖片和文本間進行區(qū)分。此外,頁排版組件120確定字體大小、頁面方式、特殊的頁輪廓,等等。例如,雜志的頁面方式通知頁包括按列組織的不同文章的段落。特殊的頁輪廓的一個例子是華爾街日報印刷報紙的頁輪廓。圖像調(diào)節(jié)組件122對捕獲的圖像應(yīng)用圖像濾波器以改進光學(xué)字符識別性能。例如,圖像調(diào)節(jié)組件122可以根據(jù)頁的不同部分的色彩提高頁的不同部分的對比度。此外,圖像調(diào)節(jié)組件122可以包括有頁照明組件112以及聚焦組件114的反饋環(huán)路用于優(yōu)化圖像調(diào)節(jié)處理。OCR組件124將經(jīng)調(diào)節(jié)的圖像轉(zhuǎn)換為數(shù)字文本。OCR組件124包括將文本的特性和/或客戶的特性納入考慮的幾個引擎。作為非限制性的例子,需要用特殊的引擎來處理法律、醫(yī)學(xué)的和外文文本。可能需要不同的引擎用來根據(jù)系統(tǒng)中可用的處理能力來創(chuàng)建不同版本的數(shù)字文本。例如,可以為處理能力有限的平臺創(chuàng)建薄的或者輕的版本。材料上下文組件126將與數(shù)字文本關(guān)聯(lián)的數(shù)據(jù)結(jié)構(gòu)組織成適于給定的i某體類型的形式,以便保持與對象上的文本對應(yīng)的文本布局。例如,在書々某體類型的上下文中,數(shù)據(jù)結(jié)構(gòu)^支組織成對應(yīng)于書的布局格式,即有腳注的章節(jié)。在雜志媒體類型情況下,數(shù)據(jù)結(jié)構(gòu)被組織成對應(yīng)于文章的布局結(jié)構(gòu)。在用于醫(yī)學(xué)處方的標簽々某體類型情況下,OCR組件可以將文本的關(guān)鍵元素標記為"醫(yī)生姓名,,或者"醫(yī)院電話號碼",用于隨后由搜索功能使用。此外,材料上下文組件126有能力根據(jù)涉及不同4某體類型的布局格式的一組預(yù)定義上下文輪廓來組織數(shù)據(jù)結(jié)構(gòu)。根據(jù)一些實施例,材料上下文組件126可以配置成根據(jù)用戶行為來學(xué)習(xí)輪廓。存儲組件128存儲數(shù)字文本以及用于組織和引用數(shù)字文本的關(guān)聯(lián)元數(shù)據(jù)。此類數(shù)據(jù)可以采用本領(lǐng)域中公知的任何適合格式存儲在與系統(tǒng)關(guān)聯(lián)的存儲器中。本實施例中采用的存儲器包括任何適合類型的存儲器和數(shù)據(jù)存儲裝置。一些例子包括作為計算機可讀的存儲器的可移動的磁纟某體或光存儲々某體,例如磁盤或磁帶。.庫管理程序組件130管理對于存儲的數(shù)字文本的訪問。庫管理程序組件130提供一個或多個功能性,比如瀏覽、分類、加入書簽、突出顯示、拼寫檢查、搜索、以及編輯。庫管理程序組件130可以隨意地包括具有語音功能的的字分析器,該具有語音功能的字分析器有權(quán)訪問辭典和包括例如法律、醫(yī)學(xué)、化學(xué)和工程字典的多個字典。該用戶可以選擇按不同的格式輸出數(shù)字文本。例如,文本到語音組件132可用于將數(shù)字文本轉(zhuǎn)換為語音。布萊葉盲文機134可用于將數(shù)字文本轉(zhuǎn)換為布萊葉盲文。用戶有利用顯示組件136將數(shù)字文字轉(zhuǎn)換為用于大字印刷顯示的格式的選擇權(quán)。此外,根據(jù)一些實施例,用戶有將數(shù)字文本翻譯為不同語言以供作為語音、布萊葉盲文或大字印刷輸出的選擇權(quán)。作為本文更詳細地描述,一些實施例包括外殼、圖像捕獲系統(tǒng)以及存儲器。在一些實施例中,外殼包括使用戶可以佩戴該設(shè)備的機械裝置。本領(lǐng)域中公知的任何機械裝置(例如帶子回形針、腕帶等等)都可用來完成此目的。在一些實施例中,外殼框架祐:設(shè)計為以帽舌的形式適合用戶。系統(tǒng)特征成像子系統(tǒng)配置成以數(shù)字方式捕獲基于文本的圖像用于隨后的OCR處理。如這里所使用,術(shù)語"捕獲(動詞)"或者"捕獲(名詞)"指的是捕獲視頻流或者對圖像拍照并且區(qū)別于掃描。視頻處理,拍照和掃描之間的區(qū)別對于本領(lǐng)域技術(shù)人員來說是清晰的并且是容易理解的,但是為明確起見,掃描涉及將要記錄的印刷材料貼著玻璃表面平放或者在頁的表面移動掃描裝置。相對于掃描,與通過數(shù)字攝影捕獲基于文本的圖像相關(guān)的優(yōu)勢包括更為容易使用和更為可調(diào)整。不同于使用掃描器的情況,本成像裝置不需要平直地貼著要^f支成像的表面放置,因此允許用戶具有將成像裝置離上述表面保持一段距離的自由和靈活性,例如,遠離書頁一英尺以上的距離。因此,這樣的成像裝置足夠適于對例如藥丸瓶或展開的餐館菜單這樣的不平表面成此,本發(fā)明的一些實施例可以從平坦的和不平坦的對象捕獲圖像。用這樣的方式捕獲圖像能夠快速獲取數(shù)字圖像并且允許自動或半自動翻頁。在難于掃描的物品(例如藥丸瓶)的情況中,與成像子系統(tǒng)關(guān)聯(lián)的軟件模塊調(diào)節(jié)低于掃描完美的圖像用于OCR處理。這樣,用戶具有在寬范圍條件下使用本裝置的靈活性。根據(jù)一些實施例,成像子系統(tǒng)包括電源、多個鏡頭、水平檢測機構(gòu)、變焦距機構(gòu)、用于改變焦距的機構(gòu)、用于改變光圈的機構(gòu)、視頻捕獲單元(例如應(yīng)用于閉路電視攝像機的那些視頻捕獲單元)以及快門。電源可能是電池、交流電、太陽能電池或者本領(lǐng)域中公知的任何其他的方式。在本發(fā)明一些實施例中,電池壽命延續(xù)最少兩小時。在其它的實施例中,電池壽命延續(xù)最少四小時。然而在其他的實施例中,電池壽命延續(xù)最少十小時。為了優(yōu)化捕獲的圖像的質(zhì)量,一些實施例包括確定成像裝置是否與被成像的表面水平的水平檢測機構(gòu)。本領(lǐng)域中公知的任何水平檢測機構(gòu)可用于此目的。水平檢測機構(gòu)與指示器通信,指示器以信號告知用戶何時該裝置相對于成像的表面處于適合的角度(或反之處于不適合的角度)。指示器使用的信號可以是視覺的、聲音的或者觸覺的。一些實施例包括至少一個自動可調(diào)鏡頭,該自動可調(diào)鏡頭可以在裝置內(nèi)部按不同的角度傾斜,使得與被成像的表面水平以及補償用戶的誤差。為避免近距離處圖像失真,一些實施例包括多個鏡頭,其中一個是微距鏡頭,以及變焦距機構(gòu),比如數(shù)字和/或光學(xué)變焦距。在一些實施例中,本裝置包括以布拉格幾何學(xué)操作的鏡頭,比如布拉格鏡頭。實施例可以包括用于改變焦距的機構(gòu)和用于在預(yù)定范圍內(nèi)改變光圈以創(chuàng)建不同的景深的機構(gòu)。圖像子系統(tǒng)^皮設(shè)計來完成寬的焦深以用于在與成像裝置不同的距離處捕獲基于文本的圖像。這樣,本裝置適應(yīng)于捕獲從街道標志到書頁的對象。根據(jù)一些實施例,成像裝置的最小焦深對應(yīng)于光圏系數(shù)5.6。在一些實施例中,成像裝置具有光圈系數(shù)為10或者更大的焦深。在一些實施例中,成像裝置提供電子或機械的快門,并且還提供用于在預(yù)定范圍內(nèi)調(diào)整快門速度的機構(gòu)。在一些實施例中,成像裝置具有最小的快門速度l/60秒。在其它實施例中,成像裝置具有最小快門速度1/125秒。一些實施例包括用于改變成像裝置的ISO速度以在不同照明條件下捕獲基于文本的圖像的機構(gòu)。在一些實施例中,成像裝置包括用來補償用戶成像裝置的不穩(wěn)定的位置的圖像穩(wěn)定機構(gòu)。除一次照相捕獲模型外,一些實施例還包括用于連續(xù)視頻捕獲的視頻單元。例如,可以使用視頻捕獲單元記錄圖像的短片并且處理該圖像的短片以從視頻流的合成中生成一個主圖像。這樣,可以在多個數(shù)字視頻圖像中記錄不平坦的表面(例如展開而沒有平放的報紙)并且通過在被成像的表面之上緩慢移動本裝置來精確捕獲它。成像子系統(tǒng)的軟件組件能因此從視頻流構(gòu)建最終整合的合成圖像以用于后續(xù)OCR處理來實現(xiàn)強化的精確度。類似地,可以處理輸入到成像子系統(tǒng)的流式視頻以用于后續(xù)OCR處理。執(zhí)行上述功能的軟件在本領(lǐng)域中是公知的。因此,可以通過視頻單元采用連續(xù)視頻捕獲來對平坦的和不平坦的對象成像。另外,一些實施例包括一個或多個光源以用于提高由本裝置捕獲的圖像的質(zhì)量。在本領(lǐng)域中公知的光源可以用于這樣的目的。例如,光源可以是閃光單元、白熾燈、或者LED燈。在一些實施例中,使用的光源使對比度最優(yōu)化并且減少眩光水平。在一體實施例中,光入射。在一些實施例中,圖像捕獲系統(tǒng)還包括處理器和軟件實現(xiàn)的圖像探測器以及濾波器,該濾波器所起作用是為后續(xù)OCR處理優(yōu)化圖像的某些視覺參數(shù)。為了優(yōu)化圖像(具體而言為包含彩色文本的圖像)以用于后續(xù)OCR處理,一些實施例還包括色差檢測機構(gòu)以及用于調(diào)整捕獲的圖像的色差的機構(gòu)。作為一個例子,圖7示出頁700,其中在該頁上的給定區(qū)域702包含文本。區(qū)域702有兩個子區(qū)域。子區(qū)域704沒有背景色,而子區(qū)域706有背景色。區(qū)域702中的文本跨越子區(qū)域704和706。子區(qū)域允許對區(qū)域702的所有子區(qū)域進行精確的OCR處理。為了補償這不足的對比度,一些實施例的色差檢測機構(gòu)獲取用于確定此基于文本的圖像中是否有足夠的對比度的信息。這樣的信息被輸入到與色差調(diào)整機構(gòu)相關(guān)聯(lián)的程序中。如果例如對比度等級不符合特定范圍,該程序?qū)⒄{(diào)整圖像捕獲系統(tǒng)的多種設(shè)置,例如,照明、白平衡以及色差來增強此圖像。這些調(diào)整,連同對上述的所有其它操作設(shè)置的其它改變(例如調(diào)整快門、光圈、鏡頭傾斜,等等),為要成像的對象及其周圍的環(huán)境做好了準備。本發(fā)明的一個特征是在對環(huán)境的調(diào)整之后自動地開始圖像重捕獲。也可以在成像子系統(tǒng)發(fā)出其它視覺的或者聽覺的提示給用戶以后由用戶手動執(zhí)行重捕獲。在一些實施例中,成像子系統(tǒng)還包括CMOS圖像傳感器單位。為了方便手不穩(wěn)的用戶以及避免圖像失真,手持實施例還包括本領(lǐng)域技術(shù)人員公知的圖像穩(wěn)定機構(gòu)。附加特征本系統(tǒng)可以包括用戶接口,用戶接口包括諸如音量控制、喇。八、頭戴式受話器/耳機插孔、麥克風以及顯示器的多個組件。顯示器可能是單色或者彩色顯示器。在一個實施例中,使用具有最小640x480分辨率的LCD顯示器。LCD顯示器也可以是觸摸屏顯示器。根據(jù)某些實施例,用戶界面包括用戶可以向系統(tǒng)輸入簡單系統(tǒng)命令的聲音命令接口。在備選實施例中,本系統(tǒng)包括布萊葉盲文顯示器以適應(yīng)視力受損的用戶。在另外其它實施例中,布萊葉盲文顯示器是本系統(tǒng)中的外圍裝置。某些實施例還包括用于從本系統(tǒng)到計算站的數(shù)據(jù)傳輸(例如圖像的傳輸)的數(shù)據(jù)端口。本領(lǐng)域中公知的用于數(shù)據(jù)傳輸?shù)暮线m部件均可用于此目的。在一個實施例中,數(shù)據(jù)端口是用于與裝置有線通信的USB2.O插槽。一些實施例能按802.11a/b/g/n(Wi-Fi)標準以無線方式實現(xiàn)。在另一實施例中,釆用紅外線(IR)端口來將圖像數(shù)據(jù)傳輸至計算站。又一個實施例包括單獨的USB底座(USBcradle),它具有電池充電機構(gòu)和/或數(shù)據(jù)傳輸機構(gòu)的功能。又一些其他實施例采用藍牙射頻或者超寬帶寬的衍生物來進行數(shù)據(jù)傳輸。本發(fā)明的另一方面提供一種手持裝置,它包含外殼、圖像捕獲系統(tǒng)、存儲器、處理器、OCR系統(tǒng)以及文本閱讀器系統(tǒng)。圖2和圖3中提供示例實施例的圖解。由于包括在這些實施例中的附加組件,內(nèi)存需求比沒有集成OCR系統(tǒng)和集成文本閱讀器系統(tǒng)的實施例大。本領(lǐng)域技術(shù)人員將認識到,還可以將上述某些元件合并到本手持裝置中。圖2A和圖2B圖解本發(fā)明的示例手持實施例200的前視圖202以及側(cè)視圖204。圖2示出觸摸屏206、圖像捕獲機構(gòu)208、耳機210、鏡頭212、接觸滑動器214(比如縮放控制214a)、音量控制214b、翻頁器214c、電池電源插槽216、拼寫檢查接口218、字典接口220以及觸控筆226。觸摸屏206示出了數(shù)字文本的顯示222。突出顯示的文本224指示正在為用戶大聲讀出的文本。圖3A和3B是圖2A和2B中圖解的手持裝置的后視圖以及俯視圖。圖3A示出光源302、可調(diào)焦距的鏡頭304、喇叭306、用來支撐本手持裝置的可展開臂308和電池插槽310。圖3B描述了USB數(shù)據(jù)端口312、IP端口314、USB照相機端口316以及紅外線(IR)端口318。OCR系統(tǒng)以及文本閱讀器系統(tǒng)在本領(lǐng)域中是^^知的。OCR系統(tǒng)的例子非限制地包括FineRreader(ABBYY)、OmniPage(Scansolt)、Envision(Adlibsoftware)、Cuneiform,PageGenieRecognita,Presto、TextBridge等等。文本閱讀器系統(tǒng)的例子非限制地包括Kurzwell1000以及3000、MicrosoftWord、JAWS、eReader、WriteOutloud、ZoomText、Proloquo、WYNN、Window-Eyes以及Hal。在一些實施例中,使用的文本閱讀器系統(tǒng)符合DAISY(數(shù)字可訪問的信息系統(tǒng))標準。在一些實施例中,手持裝置包括至少一千兆字節(jié)的FLASH存儲器存儲裝置和650兆赫或更高的嵌入式計算能力來適應(yīng)對本文描述的多種軟件組件(例如平面檢測機構(gòu)、用于改善圖像質(zhì)量、對比度以及色彩等的圖像調(diào)節(jié)器或者濾波器)的存儲。本裝置還可以在其存儲器中包括字典、一個或多個翻譯程序及其關(guān)聯(lián)的字和命令的數(shù)據(jù)庫、拼寫檢測器以及辭典。類似地,手持裝置可以使用擴展詞匯表利用特定領(lǐng)域的技術(shù)語言(例如,法律或醫(yī)學(xué)常用的拉丁文短語或者用于工程或科學(xué)工作的技術(shù)詞匯)來增加OCR的精確度。以此方式將OCR功能擴充為識別生僻的或者行業(yè)專用的詞匯和短語并將專業(yè)文獻的上下文納入考慮,這增加了OCR操作的精確度。在又一些其它實施例中,手持裝置包括在LCD顯示器上顯件。例如,美國專利號6,324,511(其公開的內(nèi)容通過引用結(jié)合于本文)手持裝置還可以包含當接近頁尾時發(fā)信號告知用戶或者在文本閱讀的同時發(fā)信號告知本頁中的大致位置的信號軟件組件。這樣的信號可以是3見覺的、聲音的或者觸覺的。例如,可以采用一連串的嘟嘟響或者不同音階的聲響向用戶提供聲音提示。手持裝置還可以包括數(shù)字/視頻放大鏡(magnifier),如本領(lǐng)域中公知的放大鏡。本領(lǐng)域中可用的數(shù)字放大鏡的例子包括Opal、Adobe、Quicklook以及Amigo。在某些實施例中,連同從圖像捕獲系統(tǒng)獲得的圖像一起,數(shù)字/視頻放大鏡將文本的放大圖像作為補充輸入提供到OCR系統(tǒng)。在其它實施例中,放大4免作為與本裝置其余部分分開的單元來實現(xiàn)功能并且僅用于為用戶顯示放大的文本。本發(fā)明另一方面提供獨立的自動化裝置,包含外殼、自動翻頁器、頁固定器、圖像捕獲系統(tǒng)、存儲器、處理器、OCR系統(tǒng)以及文本閱讀器。這種裝置可以是完全獨立的裝置,沒有可分開的圖像/動印刷品數(shù)字化的本裝置移動版本的對接站。圖4A、4B、5A、5B和5C中提供一些實施例的圖解。本領(lǐng)域技術(shù)人員將認識到,還可以將前文描述的某些元件合并到本獨立的裝置中。圖4A提供打開配置中的示例獨立實施例的等距視圖402。圖4B描述閉合配置中的獨立示范實施例的俯視圖420。處于打開配置中的獨立實施例的等距視圖402示出外殼的兩半404a、404b、照相機鏡頭408以及閱讀裝置410。此獨立的裝置的外殼配置成能夠?qū)?06放置于其中。本獨立裝置處于閉合配置中的俯視圖420示出照相機鏡頭408定位成獲得書406的頁424的圖像??梢蕴峁┳詣臃撈?圖4A或4B中未示出)來將書406的頁翻頁。圖5A提供圖4中圖示的獨立示范實施例的側(cè)視圖502,而圖5B描述外部前板522的放大視圖520以及圖5C描述內(nèi)部背板562的放大視圖560。側(cè)視圖502示出處于閉合配置中的本裝置,其中示出外殼的兩半504a、504b通過鉸鏈506鉸接在一起、前板522、背板562、放置在本裝置中靠著后面板562的內(nèi)部的書508以及電源線512。外殼的頂部510可以由允許觀察內(nèi)部的透明材料、例如透明塑料制成。圖5B中的放大視圖520示出外部前板522包括用于顯示文本525的顯示器524、閱讀裝置526、音量控制532、語音速率控制534、字體大小控制536、開/關(guān)按鈕538以及喇叭528。在圖5C中的內(nèi)部背板562的放大視圖示出用于將書頁568固定到位的臂564以及用于翻頁568的自動翻頁臂566。本自動翻頁器和頁固定器分別與外殼以及圖像捕獲系統(tǒng)耦合,圖像捕獲系統(tǒng)的位置設(shè)置成與放書的位置相對。自動翻頁器在本領(lǐng)域中是公知的并且是現(xiàn)成可用的。參見U.S.20050145097、U.S.20050120601,SureTumTM高級翻頁技術(shù)(Kirtas技術(shù)),其公開通過引用全部結(jié)合于本文。另外,本裝置可以在沒有自動翻頁器時使用,而代之以,依靠用戶翻動書的頁。圖8A、8B以及8C中圖解這種裝置的例子,其中圖解了備選示例獨立實施例的示意圖。圖8A、8B和8C示出便攜式獨立系統(tǒng)800,其包含可折疊臂810以及可折疊書板804??烧郫B臂810具有對接機構(gòu)806、絞鏈802并且耦合到可折疊書板804??梢允褂脤訖C構(gòu)806來對接便攜式成像裝置808??烧郫B臂和書框架允許將成像裝置定位于與書或者其它對象相距供本裝置進行圖像捕獲的最佳距離處。系統(tǒng)800包括用于OCR處理的模塊和用于將數(shù)字文本轉(zhuǎn)換為語音的才莫塊。在某些實施例中,系統(tǒng)字快門的手動輸入來確定是否已翻頁的機構(gòu)。一些實施例包括用于顯示數(shù)字文本的顯示器812。在又一些其它實施例中,包括布萊葉盲文機以用于輸出數(shù)字文本。提供了一些本文論述的公布專利,只是因為它們是在本發(fā)明申請的提交日之前公開的。本文無任何內(nèi)容應(yīng)理解為承認由于先前發(fā)明而使本發(fā)明無權(quán)優(yōu)先于此類公布專利。除非另行定義,否則本文所使用的所有技術(shù)和科學(xué)術(shù)語具有與本發(fā)明所屬的領(lǐng)域技術(shù)人員所普遍理解的含義相同的含義。本文提到的所有公布專利通過引用全部結(jié)合于本公開,并且描述了引述這些公布專利所參考的方法和/或材料。]上文描述,出于解釋的目的,是參考特定的實施例來進行描述的。然而,上文的圖解論述無意視為本發(fā)明的窮舉或?qū)⒈景l(fā)明限于所公開的具體形式。根據(jù)上述原理可實現(xiàn)多種修改和變化。選擇和描述這些實施例是為了最好地解釋本發(fā)明的原理和它的實際應(yīng)用,從而使本領(lǐng)域技術(shù)人員最好地利用本發(fā)明,并且具有多種修改的多種實施例適用于所設(shè)想的具體應(yīng)用。權(quán)利要求1.一種用于捕獲在對象上發(fā)現(xiàn)的文本的設(shè)備,所述設(shè)備包含圖像捕獲子系統(tǒng),包括配置成捕獲多個圖像以形成視頻流的視頻照相機,其中所述圖像捕獲子系統(tǒng)配置成從視頻流產(chǎn)生主圖像;以及配置成處理所述主圖像以形成對應(yīng)于所述對象上的至少一些文本的數(shù)字文本的光學(xué)字符識別("OCR")子系統(tǒng)。2.如權(quán)利要求1所述的設(shè)備,還包含容納所述OCR子系統(tǒng)和所述圖像捕獲子系統(tǒng)的外殼。3.如權(quán)利要求1所述的設(shè)備,還包含配置成將所述數(shù)字文本轉(zhuǎn)換為多個輸出格式的文本閱讀器系統(tǒng)。4.如權(quán)利要求1所述的設(shè)備,其中所述圖像捕獲子系統(tǒng)還包括配置成確定所述設(shè)備是否與所述對象的表面水平的水平檢測器。5.如權(quán)利要求1所述的設(shè)備,其中所述圖像捕獲子系統(tǒng)還包括配置成在捕獲多個捕獲的圖像時補償所述設(shè)備的不穩(wěn)定定位的成像穩(wěn)定器。6.如權(quán)利要求l所述的設(shè)備,其中所述圖像捕獲子系統(tǒng)還包括配置成為OCR處理來優(yōu)化所述多個捕獲的圖像的色差檢測器。7.權(quán)利要求3所述的設(shè)備,其中所述文本閱讀器系統(tǒng)還配置成翻譯所述數(shù)字文本。8.如權(quán)利要求l所述的設(shè)備,其中所述對象是不平坦的。9.一種用于捕獲在對象上發(fā)現(xiàn)的文本的系統(tǒng),所述系統(tǒng)包含圖像捕獲子系統(tǒng),包括配置成捕獲多個圖像以形成視頻流的視頻照相機,其中所述圖像捕獲子系統(tǒng)配置成從所述視頻流產(chǎn)生主圖像;配置成從所述主圖像創(chuàng)建數(shù)字文本的文本捕獲才莫塊;以及,配置成將^^某體類型與在對象上發(fā)現(xiàn)的所述文本關(guān)聯(lián)的材料上下文組件,其中所述系統(tǒng)配置成根據(jù)所述々某體類型組織所述數(shù)字文本。10.如權(quán)利要求9所述的系統(tǒng),其中所述材料上下文組件還配置成將布局格式與所述媒體類型關(guān)聯(lián)。11.如權(quán)利要求10所述的系統(tǒng),其中所述材料上下文組件還配置成評估所述媒體類型和布局格式以確定在所述對象上發(fā)現(xiàn)的文本的布局。12.如權(quán)利要求10所述的系統(tǒng),其中所述媒體類型選自由書、報紙、藥丸瓶、處方、飯店菜單和街道標志組成的組。13.如權(quán)利要求10所述的系統(tǒng),其中所述布局格式包括從由列、腳注、圖片、大字標題、文本尺寸和文本顏色組成的組中選擇的元素。14.一種用于捕獲在對象上發(fā)現(xiàn)的文本的方法包含捕獲所述對象的多個圖像;從所述多個圖像形成視頻流;從所述視頻流生成主圖像;以及處理所述主圖像以形成數(shù)字文本。15.如權(quán)利要求14所述的方法,還包括將^(某體類型與在所述對象上發(fā)現(xiàn)的文本關(guān)聯(lián)。16.如權(quán)利要求15所述的方法,還包括根據(jù)所述i某體類型組織所述數(shù)字文本。17.如權(quán)利要求15所述的方法,還包括將布局格式與所述々某體類型關(guān)聯(lián)。18.如權(quán)利要求17所述的方法,還包括評估所述纟某體類型和布局;^各式以確定在所述對象上發(fā)現(xiàn)的文本的布局。19.如權(quán)利要求14所述的方法,還包括將用于呈現(xiàn)的所述數(shù)字文本轉(zhuǎn)換為輸出格式。20.如權(quán)利要求19所述的方法,還包括翻譯所述數(shù)字文本。21.如權(quán)利要求14所述的方法,其中所述對象是不平坦的。22.如權(quán)利要求14所述的方法,還包括創(chuàng)建用于成像的環(huán)境。23.—種用于呈現(xiàn)在基本平坦的對象上發(fā)現(xiàn)的文本的系統(tǒng),所述系統(tǒng)包含配置成定位用于成像的所述基本平坦的對象的對象操作子系統(tǒng);配置成捕獲所述基本平坦的對象的圖像的成像才莫塊;配置成從所迷基本平坦的對象的圖像捕獲文本的文本捕獲才莫塊;配置成將所述文本轉(zhuǎn)換為數(shù)字文本的光學(xué)字符識別("OCR")組件;配置成將^某體類型與在所述基本平坦的對象上發(fā)現(xiàn)的所述文本關(guān)聯(lián)的材料上下文組件;以及配置成將數(shù)字文本轉(zhuǎn)換為輸出格式的輸出模塊,其中所述系統(tǒng)配置成在將所述數(shù)字文本轉(zhuǎn)換為輸出格式之前根據(jù)所述纟某體類型組織所述數(shù)字文本。24.如權(quán)利要求23所述的系統(tǒng),其中所述材料上下文組件還配置成將布局格式與所述媒體類型關(guān)聯(lián)。25.如權(quán)利要求24所述的系統(tǒng),其中所述材料上下文組件還配置成評估所述J(某體類型和布局格式以確定在所述對象上發(fā)現(xiàn)的文本的布局。26.如權(quán)利要求23所述的系統(tǒng),還包含為成像所述基本平坦的對象創(chuàng)建環(huán)境的圖像增強模塊。27.—種用于捕獲在對象上發(fā)現(xiàn)的文本的系統(tǒng),所述系統(tǒng)包含配置成定位用于成像的所述對象的對象操作才莫塊;配置成對所述對象成像的成像才莫塊;配置成從所述對象的圖像捕獲文本的文本捕獲才莫塊;配置成將來自于所述對象的文本轉(zhuǎn)換為數(shù)字文本的OCR組件;以及配置成組織所述數(shù)字文本以保持所述對象上的文本布局的材料上下文組件。28.如權(quán)利要求27所述的系統(tǒng),其中所述文本捕獲才莫塊還配置成從多個所述圖像捕獲文本。29.如權(quán)利要求28所述的系統(tǒng),其中所述輸出模塊還配置成翻譯所述數(shù)字文本。30.—種用于捕獲在不平坦的對象上發(fā)現(xiàn)的文本的系統(tǒng),所述系統(tǒng)包含配置成定位用于成像的所述不平坦的對象的對象操作才莫塊;配置成從所述不平坦的對象捕獲文本的成像模塊;配置成將所述文本轉(zhuǎn)換為數(shù)字文本的OCR組件。31.如權(quán)利要求30所述的系統(tǒng),所述系統(tǒng)還包含配置成將所述數(shù)字文本轉(zhuǎn)換為輸出格式的輸出模塊。32.如權(quán)利要求31所述的系統(tǒng),其中所述輸出格式還配置成翻譯所述數(shù)字文本。33.如權(quán)利要求30所述的系統(tǒng),所述系統(tǒng)還包含配置成將々某體類型與在所述對象上發(fā)現(xiàn)的所述文本關(guān)聯(lián)的材料上下文組件。34.如權(quán)利要求33所述的系統(tǒng),其中所述材料上下文組件還配置成將布局格式與所述々某體類型關(guān)聯(lián)。35.如權(quán)利要求34所述的系統(tǒng),其中所述材料上下文組件還配置成評估所述媒體類型和布局格式以確定在所述對象上發(fā)現(xiàn)的文本的布局。36.—種用于捕獲在對象上發(fā)現(xiàn)的文本的系統(tǒng),所述系統(tǒng)包含a.配置成對所述對象進行操作的翻頁組件;b.配置成將所述對象定位的取景組件;c.配置成提高所述對象上的對比度的燈光;d.配置成產(chǎn)生勾邊圖像的聚焦組件;e.配置成產(chǎn)生所述對象的圖像的圖像捕獲組件;f.配置成將所述圖像轉(zhuǎn)換為OCR適合的圖像的轉(zhuǎn)換組件;g.配置成處理所述OCR適合的圖像以創(chuàng)建排版頁掃描的圖像排版組件;h.配置成創(chuàng)建調(diào)節(jié)的圖像的圖像調(diào)節(jié)組件;i.配置成將所述調(diào)節(jié)的圖像轉(zhuǎn)換為數(shù)字文本的OCR組件,其中所述數(shù)字文本存^f諸于第一數(shù)據(jù)結(jié)構(gòu)中;j.配置成組織所述第一數(shù)據(jù)結(jié)構(gòu)以保持所述對象上的所述文本的布局的材料上下文組件;k.配置成將所述第一數(shù)據(jù)結(jié)構(gòu)存儲為第一存儲的數(shù)字文本的存儲組件;l.配置成管理從所述存儲組件訪問所述第一存儲的數(shù)字文本的庫管理程序組件;以及m.配置成包含所述翻頁組件、所述取景組件、所述燈、所述圖像捕獲組件、所述轉(zhuǎn)換組件、所述圖像排版組件、所述圖像調(diào)節(jié)組件、所述OCR組件和所述材料上下文組件的外殼。37.如權(quán)利要求36所述的系統(tǒng),其中所述外殼還配置成包含所述存儲組件。38.如權(quán)利要求36所述的系統(tǒng),還包含配置成將所述第一存儲的數(shù)字文本轉(zhuǎn)換為輸出格式的輸出組件。39.—種呈現(xiàn)在基本平坦的對象上發(fā)現(xiàn)的文本的方法,包括定位用于成像的所述基本平坦的對象;從所述基本平坦的對象捕獲圖像;將所述圖像轉(zhuǎn)換為數(shù)字文本;將媒體類型與在所述基本平坦的對象上發(fā)現(xiàn)的所述文本關(guān)聯(lián);根據(jù)所述4某體類型組織所述數(shù)字文本;以及將所述數(shù)字文本轉(zhuǎn)換為輸出格式。40.如權(quán)利要求39所述的方法,還包括將布局格式與所述4某體類型關(guān)聯(lián)。41.如權(quán)利要求40所述的方法,還包括評估所述媒體類型和布局格式以確定在所述基本平坦的對象上發(fā)現(xiàn)的文本的布局。42.如權(quán)利要求39所述的方法,還包括創(chuàng)建用于成像的環(huán)境。43.如權(quán)利要求39所述的方法,還包括將多個圖像轉(zhuǎn)換為數(shù)字文本。44.一種用于捕獲在對象上發(fā)現(xiàn)的文本的方法,包括定位用于成像的所述對象;捕獲所述對象的圖像;將所述圖像轉(zhuǎn)換為數(shù)字文本;將々某體類型與在所述對象上發(fā)現(xiàn)的所述文本關(guān)聯(lián);以及根據(jù)所述纟某體類型組織所述數(shù)字文本。45.如權(quán)利要求44所述的方法,還包括將布局格式與所述媒體類型關(guān)聯(lián)。46.如權(quán)利要求45所述的方法,還包括評估所述i某體類型和布局格式以確定在所述對象上發(fā)現(xiàn)的文本的布局。47.如權(quán)利要求44所述的方法,還包括將用于呈現(xiàn)的所述數(shù)字文本轉(zhuǎn)換為輸出格式。48.如權(quán)利要求47所述的方法,還包括翻譯所述數(shù)字文本。49.如權(quán)利要求44所述的方法,還包括通過照亮所述對象,自動調(diào)整焦距和使用圖像濾波器來增強多個捕獲的圖像。50.如權(quán)利要求49所述的方法,還包括通過在照亮所述對象,自動調(diào)整焦距和使用圖像濾波器時實現(xiàn)反饋環(huán)路來增強多個捕獲的圖像。51.—種捕獲在不平坦的對象上發(fā)現(xiàn)的文本的方法,包括定位用于成像的所述不平坦的對象;從所述不平坦的對象捕獲圖像;以及將所述圖像轉(zhuǎn)換為數(shù)字文本。52.如權(quán)利要求51所述的方法,還包括組織所述數(shù)字文本以保持在所述對象上的文本布局。53.—種用于捕獲在對象上發(fā)現(xiàn)的文本的方法,包括a.操作對象來顯露用于成像的所述對象的期望部分;b.對用于成像的所述對象取景;c.照亮所述對象以提高對比度;d.聚焦所述對象;e.捕獲所述對象的圖像;f.將所述圖像轉(zhuǎn)換為光學(xué)字符識別("OCR")適合的圖像;g.處理所述OCR適合的圖像以創(chuàng)建排版頁掃描;h.調(diào)節(jié)所述排版頁掃描以創(chuàng)建調(diào)節(jié)的圖像;i.將所述調(diào)節(jié)的圖像轉(zhuǎn)換為數(shù)字文本;j.在第一數(shù)據(jù)結(jié)構(gòu)中存儲所述數(shù)字文本;k.組織所述第一數(shù)據(jù)結(jié)構(gòu)以保持所述對象上的所述文本的布局;以及1.將所述第一數(shù)據(jù)結(jié)構(gòu)存儲為第一存儲的數(shù)字文本。全文摘要用于捕獲在對象上發(fā)現(xiàn)的文本的設(shè)備。該設(shè)備包含圖像捕獲子系統(tǒng),該子系統(tǒng)包括配置成捕獲多個圖像以形成視頻流的視頻照相機。圖像捕獲子系統(tǒng)配置成從視頻流產(chǎn)生主圖像。該設(shè)備又包含光學(xué)字符識別(“OCR”)子系統(tǒng),該OCR子系統(tǒng)配置成處理主圖像以便形成對應(yīng)于所述對象上的至少一些文本的數(shù)字文本。文檔編號G06K9/00GK101460959SQ200780020152公開日2009年6月17日申請日期2007年3月29日優(yōu)先權(quán)日2006年3月30日發(fā)明者B·P·富斯申請人:洛奎特公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
阿鲁科尔沁旗| 海伦市| 高州市| 寿光市| 越西县| 镇安县| 衡阳县| 舞阳县| 孟州市| 视频| 乐安县| 攀枝花市| 新绛县| 吉安市| 渝北区| 凌海市| 宜城市| 大竹县| 手机| 平昌县| 定边县| 那曲县| 鹤庆县| 德兴市| 张掖市| 镇康县| 南漳县| 台南县| 通许县| 柞水县| 黔西| 株洲市| 厦门市| 石城县| 铜鼓县| 本溪| 吉水县| 琼中| 佛冈县| 赤峰市| 河西区|