一種基于用戶眼球的單詞查詢方法

文檔序號(hào)：8543670閱讀：211來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種基于用戶眼球的單詞查詢方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及屬于模式分類、計(jì)算機(jī)視覺領(lǐng)域，具體設(shè)及一種基于用戶眼球的單詞查詢方法。
【背景技術(shù)】
[0002] 當(dāng)今社會(huì)信息化發(fā)展的今天，人們?cè)陔娔X上閱讀的習(xí)慣也越來越普遍。而我們閱讀的內(nèi)容的多樣化的同時(shí)也產(chǎn)生了很多需求，比如一個(gè)非英語作為其母語的學(xué)生在閱讀英文類的書籍是難免會(huì)發(fā)生不認(rèn)識(shí)的單詞的情況。對(duì)于該樣一種情形，在互聯(lián)網(wǎng)發(fā)達(dá)的今天已經(jīng)有了很多的電子詞典軟件輔助我們查閱陌生單詞提高我們的效率。就我們目前的情況而言，已經(jīng)成熟并大量投入使用的詞典有金山詞霸，有道詞典，靈格斯詞霸等等。它們目前的查詢方式有W下幾個(gè)；通過鍵盤輸入單詞查詢方式，通過鼠標(biāo)指針移動(dòng)取詞查詢方式。其中第二種查找方式為用戶的查詢提供了很大的便捷性，備受廣大用戶喜愛。但是該種方式也有其缺點(diǎn)，第一當(dāng)我們發(fā)現(xiàn)又不認(rèn)識(shí)的單詞時(shí)，必須將鼠標(biāo)指針移動(dòng)到該單詞的位置，該還是比較麻煩；第二當(dāng)我們的鼠標(biāo)指針不小屯、落到一個(gè)認(rèn)識(shí)的單詞上時(shí)，它也會(huì)出現(xiàn)該單詞的釋義，從而擋住了其他單詞的位置，使我們?cè)陂喿x時(shí)不得不把鼠標(biāo)的位置擺放到一個(gè) 特定的區(qū)域，W免影響到我們閱讀的連貫性。

【發(fā)明內(nèi)容】

[0003] 本發(fā)明的目的在于克服上述現(xiàn)有技術(shù)中存在的缺點(diǎn)，提供一種基于用戶眼球的單詞查詢方法，具有方便快捷的優(yōu)點(diǎn)。
[0004] 為實(shí)現(xiàn)上述目的，本發(fā)明采用W下技術(shù)方案；包括W下步驟：
[0005] 1)判斷用戶初始詞匯量；
[0006] 2)計(jì)算用戶眼球區(qū)域時(shí)間；
[0007] 3)根據(jù)用戶眼球在該區(qū)域停留的時(shí)間和用戶的詞匯量判斷用戶不認(rèn)識(shí)的單詞并列表；
[000引 4)用戶閱讀完后，對(duì)列表中的單詞進(jìn)行篩選，選出陌生單詞并更新分類器。
[0009] 所述的1)判斷用戶初始詞匯量的具體方法為：
[0010] (1-1)通過錄入若干相關(guān)度高的英語文章，統(tǒng)計(jì)每個(gè)常用單詞的詞頻；
[0011] (1-。對(duì)統(tǒng)計(jì)出來的詞頻進(jìn)行排序；
[001引（1-扣將出現(xiàn)頻率高的詞庫錄入詞典中；
[0013] (1-4)對(duì)每個(gè)詞庫我們隨機(jī)抽取單詞作為該詞庫的樣本單詞；
[0014] (l-W根據(jù)用戶填寫自己的個(gè)人信息后，我們將對(duì)應(yīng)詞庫的樣本單詞給用戶，讓其進(jìn)行判斷，根據(jù)其答題情況，通過決策樹算法判斷出用戶的詞匯量；
[0015] (1-6)判斷出用戶詞匯量后，將用戶的正確率統(tǒng)計(jì)出來，通過第二步的單詞頻率，推斷出用戶在該詞匯量下對(duì)單詞的掌握程度。
[0016] 所述的2)計(jì)算用戶眼球區(qū)域時(shí)間的具體方法為：
[0017] (2-1)定義電腦屏幕分為m*n個(gè)區(qū)域，每個(gè)區(qū)域Area;用（Xbi，Ybi，Xei，Yei)表示；
[001引（2-。用電腦攝像頭拍攝用戶臉部，通過Viola人臉檢測(cè)器檢測(cè)出人臉位置；
[0019] (2-3)對(duì)人臉位置區(qū)域進(jìn)行圖像去噪預(yù)處理操作；
[0020] (2-4)利用AAM人臉模型找到人眼球中屯、坐標(biāo)，通過坐標(biāo)映射算法算出人眼注視在屏幕的區(qū)域（Area,)和當(dāng)前注視的時(shí)刻t;
[0021] (2-5)通過在一個(gè)區(qū)域Area,內(nèi)計(jì)算當(dāng)前注視時(shí)刻的最大值和最小值算眼球在該區(qū)域內(nèi)的注視時(shí)間。
[0022] 所述3)根據(jù)用戶眼球在該區(qū)域停留的時(shí)間判斷用戶不認(rèn)識(shí)的單詞并列表的方式為；當(dāng)用戶該注視時(shí)間大于設(shè)定的闊值時(shí)提取該區(qū)域內(nèi)的單詞。
[0023] 所述選4)選出陌生單詞的方法為：
[0024] (4-1)通過上一步所知道的用戶的區(qū)域我們將該區(qū)域內(nèi)所有的單詞提取出來；
[0025] (4-2)依靠用戶的詞匯量，利用我們之前訓(xùn)練好的一個(gè)分類模型將該區(qū)域內(nèi)所有的單詞進(jìn)行分類；
[0026] (4-3)對(duì)分類的結(jié)果為陌生詞的單詞進(jìn)行詞典查找為用戶列出該單詞的釋義列表。
[0027] 所述4)中選出陌生單詞的方法為；分類用戶的陌生詞和已知詞選取的特征為單詞的詞頻和其長度還有單詞之間的相似度作為特征，訓(xùn)練SVM分類器判斷用戶所注視區(qū)域內(nèi)的所有單詞是否有用戶的陌生詞。
[002引所述訓(xùn)練SVM分類器的訓(xùn)練步驟為：
[0029] (5-1)通過logistic函數(shù)將特征值歸一化
[0030]
【主權(quán)項(xiàng)】
1. 一種基于用戶眼球的單詞查詢方法，其特征在于：包括以下步驟： 1) 判斷用戶初始詞匯量； 2) 計(jì)算用戶眼球區(qū)域時(shí)間； 3) 根據(jù)用戶眼球在該區(qū)域停留的時(shí)間和用戶的詞匯量判斷用戶不認(rèn)識(shí)的單詞并列表； 4) 用戶閱讀完后，對(duì)列表中的單詞進(jìn)行篩選，選出陌生單詞并更新分類器。
2. 根據(jù)權(quán)利要求1所述的一種基于用戶眼球的單詞查詢方法，其特征在于：所述的1) 判斷用戶初始詞匯量的具體方法為： (1-1)通過錄入若干相關(guān)度高的英語文章，統(tǒng)計(jì)每個(gè)常用單詞的詞頻； (1-2)對(duì)統(tǒng)計(jì)出來的詞頻進(jìn)行排序； (1-3)將出現(xiàn)頻率高的詞庫錄入詞典中； (1-4)對(duì)每個(gè)詞庫我們隨機(jī)抽取單詞作為該詞庫的樣本單詞； (1-5)根據(jù)用戶填寫自己的個(gè)人信息后，我們將對(duì)應(yīng)詞庫的樣本單詞給用戶，讓其進(jìn)行判斷，根據(jù)其答題情況，通過決策樹算法判斷出用戶的詞匯量； (1-6)判斷出用戶詞匯量后，將用戶的正確率統(tǒng)計(jì)出來，通過（1-2)的單詞頻率，推斷出用戶在該詞匯量下對(duì)單詞的掌握程度。
3. 根據(jù)權(quán)利要求1所述的一種基于用戶眼球的單詞查詢方法，其特征在于：所述的2) 計(jì)算用戶眼球區(qū)域時(shí)間的具體方法為： (2-1)定義電腦屏幕分為m*n個(gè)區(qū)域，每個(gè)區(qū)域八^81用（XbDYbDX e^YeJ表示； (2-2)用電腦攝像頭拍攝用戶臉部，通過Viola人臉檢測(cè)器檢測(cè)出人臉位置； (2-3)對(duì)人臉位置區(qū)域進(jìn)行圖像去噪預(yù)處理操作； (2-4)利用AAM人臉模型找到人眼球中心坐標(biāo)，通過坐標(biāo)映射算法算出人眼注視在屏幕的區(qū)域（Areai)和當(dāng)前注視的時(shí)刻t ; (2-5)通過在一個(gè)區(qū)域Areai內(nèi)計(jì)算當(dāng)前注視時(shí)刻的最大值和最小值算眼球在該區(qū)域內(nèi)的注視時(shí)間。
4. 根據(jù)權(quán)利要求1所述的一種基于用戶眼球的單詞查詢方法，其特征在于：所述3)根據(jù)用戶眼球在該區(qū)域停留的時(shí)間判斷用戶不認(rèn)識(shí)的單詞并列表的方式為：當(dāng)用戶該注視時(shí) 間大于設(shè)定的閾值時(shí)提取該區(qū)域內(nèi)的單詞。
5. 根據(jù)權(quán)利要求1所述的一種基于用戶眼球的單詞查詢方法，其特征在于：所述選4) 選出陌生單詞的方法為： (4-1)通過上一步所知道的用戶的區(qū)域我們將該區(qū)域內(nèi)所有的單詞提取出來； (4-2)依靠用戶的詞匯量，利用我們之前訓(xùn)練好的一個(gè)分類模型將該區(qū)域內(nèi)所有的單詞進(jìn)行分類； (4-3)對(duì)分類的結(jié)果為陌生詞的單詞進(jìn)行詞典查找為用戶列出該單詞的釋義列表。
6. 根據(jù)權(quán)利要求1所述的一種基于用戶眼球的單詞查詢方法，其特征在于：所述4)中選出陌生單詞的方法為：分類用戶的陌生詞和已知詞選取的特征為單詞的詞頻和其長度還有單詞之間的相似度作為特征，訓(xùn)練SVM分類器判斷用戶所注視區(qū)域內(nèi)的所有單詞是否有用戶的陌生詞。
7. 根據(jù)權(quán)利要求6所述的一種基于用戶眼球的單詞查詢方法，其特征在于：所述訓(xùn)練 SVM分類器的訓(xùn)練步驟為： (5-1)通過logistic函數(shù)將特征值歸一化
(5-5)選擇真陽性率（true positive rate, TPR)從而確定向量機(jī)參數(shù)進(jìn)行訓(xùn)練； (5-6)將用戶所注視區(qū)域的單詞輸入訓(xùn)練模型進(jìn)行計(jì)算，將所得結(jié)果與模型的參數(shù)進(jìn) 行比較，當(dāng)誤差值小于定義的誤差時(shí)，則判定該單詞為陌生詞，否則為已知詞。
8.根據(jù)權(quán)利要求1所述的一種基于用戶眼球的單詞查詢方法，其特征在于：所述4)完成后，用于對(duì)用戶將該列表中認(rèn)識(shí)的單詞打鉤，然后提交；系統(tǒng)根據(jù)該列表的內(nèi)容，生成新的訓(xùn)練數(shù)據(jù)對(duì)我們的分類模型進(jìn)一步的訓(xùn)練；更新分類器以供用戶的下一次使用。
【專利摘要】本發(fā)明涉及一種基于用戶眼球的單詞查詢方法，包括以下步驟：1)判斷用戶初始詞匯量；2)計(jì)算用戶眼球區(qū)域時(shí)間；3)根據(jù)用戶眼球在該區(qū)域停留的時(shí)間和用戶的詞匯量判斷用戶不認(rèn)識(shí)的單詞并列表；4)用戶閱讀完后，對(duì)列表中的單詞進(jìn)行篩選，選出陌生單詞并分類。通過眼睛定位屏幕區(qū)域的時(shí)間來推測(cè)用戶是否在該屏幕區(qū)域中有陌生詞，不需要通過鼠標(biāo)移動(dòng)到該區(qū)域來，以方便用戶閱讀的連貫性和便捷性。
【IPC分類】G06K9-62, G06F17-27
【公開號(hào)】CN104866470
【申請(qǐng)?zhí)枴緾N201510283624
【發(fā)明人】惠維, 張哲 , 蔣志平, 韓勁松, 魏堯, 趙季中
【申請(qǐng)人】西安交通大學(xué)
【公開日】2015年8月26日
【申請(qǐng)日】2015年5月28日

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：惠維;張哲;蔣志平;韓勁松;魏堯;趙季中;
技術(shù)所有人：西安交通大學(xué);
我是此專利的發(fā)明人

上一篇：一種基于局部敏感哈希策略的實(shí)例匹配方法
上一篇：具有第二語言模式的輸入法編輯器的制造方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

眼球運(yùn)動(dòng)檢查方法相關(guān)技術(shù)

壓迫眼球的方法相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于用戶眼球的單詞查詢方法