檢索設(shè)備和檢索方法
【專利摘要】根據(jù)實施例,提供一種檢索設(shè)備和檢索方法。設(shè)備包括獲取部、分割部、提取部、計算部和檢索部。獲取部被配置成獲取多個第一點序列。分割部被配置成將多個第一點序列的每一個分割成多個第二點序列。提取部被配置成提取多個第二點序列中的每一個的特征向量。計算部被配置成基于多個第二點序列之間的最佳路徑,計算多個第一點序列之間的距離,多個第二點序列屬于多個第一點序列中的每一個。檢索部被配置成使用距離來檢索與多個第一點序列相對應(yīng)的數(shù)據(jù)。
【專利說明】檢索設(shè)備和檢索方法
[0001] 相關(guān)申請的交叉引用
[0002] 本申請是基于并且要求2013年5月31日提交的第2013-116419號日本專利申請 的優(yōu)先權(quán);其全部內(nèi)容通過引用而結(jié)合在本文中。
【技術(shù)領(lǐng)域】
[0003] 這里所述的實施例一般與檢索設(shè)備和檢索方法有關(guān)。
【背景技術(shù)】
[0004] 已知一種從數(shù)據(jù)庫檢索與由點序列組成的查詢相匹配或類似的數(shù)據(jù)的技術(shù)。
【發(fā)明內(nèi)容】
[0005] 實施例的目的在于提供一種檢索設(shè)備,該檢索設(shè)備能夠在提高檢索精確度的同時 抑制檢索速度的減少。
[0006] 根據(jù)實施例,設(shè)備包括獲取部、分割部、提取部、計算部和檢索部。獲取部被配置成 獲取多個第一點序列。分割部被配置成將多個第一點序列的每一個分割成多個第二點序 列。提取部被配置成提取多個第二點序列中的每一個的特征向量。計算部被配置成基于多 個第二點序列之間的最佳路徑來計算多個第一點序列之間的距離,該多個第二點序列屬于 多個第一點序列中的每一個。檢索部被配置成使用距離來檢索與多個第一點序列相對應(yīng)的 數(shù)據(jù)。
[0007] 根據(jù)如上所述的設(shè)備,檢索速度的減少能夠被抑制并且檢索精確度能夠被提高。
【專利附圖】
【附圖說明】
[0008] 圖1是圖解實施例的典型檢索設(shè)備的配置圖;
[0009] 圖2是圖解實施例中的筆劃的實例的圖;
[0010] 圖3是圖解實施例中的筆劃的實例的圖;
[0011] 圖4是圖解實施例中的墨水?dāng)?shù)據(jù)(ink data)的數(shù)據(jù)結(jié)構(gòu)的實例的圖;
[0012] 圖5是圖解表示實施例中的副筆劃的數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)的實例的圖;
[0013] 圖6是圖解實施例中的DP匹配的實例的圖;
[0014] 圖7是圖解實施例的檢索實例的圖;
[0015] 圖8是圖解實施例的顯示實例的圖;
[0016] 圖9是圖解實施例的處理實例的流程圖;
[0017] 圖10是圖解實施例的檢索設(shè)備的典型硬件配置的圖;
[0018] 圖11是圖解實施例的檢索設(shè)備的實例的圖。
【具體實施方式】
[0019] 下面參照附圖將給出實施例的詳細描述。
[0020] 在實施例中,將給出以下情況的描述:由用戶手寫的手寫字符串被用作從預(yù)先書 寫的(例如,大量的)手寫文檔進行檢索的查詢。這里,在實施例中,主要地,例如,將給出字 符串的描述。但是,查詢可以是自由手寫的,由用戶繪畫的諸如線或者標(biāo)記的字符碼沒有被 分割給自由手寫。任何方法可以被用作用于通過用戶指定手寫字符串的方法。例如,用戶可 以實際上手寫字符串以指定查詢。用戶可以從現(xiàn)存的手寫文檔選擇要被用作查詢的部分。 用戶可以從用于查詢的模板中選擇要被用作查詢的部分??梢允褂眠@些方法的結(jié)合。
[0021] 圖1是圖解實施例的典型檢索設(shè)備10的配置圖。如圖1所示,檢索設(shè)備10包括 輸入單元11、獲取單元13、墨水?dāng)?shù)據(jù)存儲單元15、分割單元17、提取單元19、特征向量存儲 單元21、計算部23、檢索單元25、顯示控制單元27和顯示單元29。
[0022] 輸入單元11能夠通過例如輸入裝置來實現(xiàn),輸入裝置允許手寫輸入,輸入裝置諸 如是觸摸屏、觸摸板、電子筆或者計算機鼠標(biāo)。獲取單元13、分割單元17、提取單元19、計算 部23、檢索單元25和顯示控制單元27可以通過例如由諸如中央處理單元(CPU)的處理單 元執(zhí)行程序來實現(xiàn),即,通過軟件來實現(xiàn),或者可以通過諸如集成電路(1C)的硬件來實現(xiàn)。 換句話說,這些單元可以通過結(jié)合軟件和硬件來實現(xiàn)。墨水?dāng)?shù)據(jù)存儲單元15和特征向量存 儲單元21可以通過例如存儲裝置來實現(xiàn),該存儲裝置允許磁的、光的或電的存儲,例如可 以是硬盤驅(qū)動器(HDD)、固態(tài)驅(qū)動器(SSD)、存儲卡、光盤或者隨機存取存儲器(RAM)。顯示 單元29可以通過例如諸如觸摸顯示器和液晶顯示器的顯示裝置來實現(xiàn)。
[0023] 輸入單元11將多個第一點序列輸入到檢索設(shè)備10。在實施例中,輸入單元11將 多個筆劃(多個第一點序列的一個實例)輸入到檢索設(shè)備10,筆劃是用戶以字符和類似的內(nèi) 容為意圖而手寫(繪畫)或指定的。但是,不應(yīng)該以限定意義來解釋。在實施例中,輸入單元 11是觸摸屏。假定用戶使用用于在觸摸屏上手寫的記錄筆或者手指,以便輸入多個筆劃。 但是,不應(yīng)該以限定意義來解釋。輸入單元11可以通過例如觸摸板、電子筆或者計算機鼠 標(biāo)來實現(xiàn)。
[0024] 筆劃意思是通過用戶手寫的一個筆劃,即,從記錄筆或者手指與觸摸屏的輸入表 面開始接觸的時間直到記錄筆或者手指舉起離開輸入表面(從筆向下狀態(tài)直到筆向上狀 態(tài))的軌跡。例如,表示筆劃的數(shù)據(jù)包括在記錄筆或者手指相對于觸摸屏的輸入表面的軌跡 上的采樣點(時間序列坐標(biāo)值)、軌跡的外接矩形和軌跡的筆壓力。
[0025] 具體地,當(dāng)記錄筆或者手指相對于觸摸屏的輸入表面變成筆向下狀態(tài)時,觸摸屏 對記錄筆或者手指相對于輸入表面的軌跡上點、軌跡的筆壓力和從開始輸入軌跡的時間所 經(jīng)過的時間進行周期性采樣。當(dāng)記錄筆或者手指變成筆向上狀態(tài)時,觸摸屏提取軌跡的外 接矩形,以便生成表示筆劃的數(shù)據(jù),并且將該數(shù)據(jù)輸入到檢索設(shè)備10。
[0026] 圖2和圖3是圖解實施例中的筆劃的實例的圖。在圖2所示的實例中,圖解筆劃 的采樣點。在圖3所示的實例中,圖解在圖2中所示的采樣點按時間順序經(jīng)過線性插值的 筆劃。在圖2和圖3所示的實例中,周期性地執(zhí)行采樣(以固定周期)。但是,由于用戶的書 寫速度而改變了采樣點之間的坐標(biāo)距離。這里,筆劃中的采樣點的數(shù)目對于每個筆劃是不 同的。
[0027] 獲取單元13獲取多個第一點序列。在實施例中,獲取單元13從輸入單元11順序 地獲取筆劃輸入,以便獲取多個筆劃。當(dāng)筆劃的獲得完成時,即,當(dāng)從輸入單元11完成筆劃 的輸入時,獲取單元13將墨水?dāng)?shù)據(jù)存儲在墨水?dāng)?shù)據(jù)存儲單元15中,該墨水?dāng)?shù)據(jù)為表示獲取 的筆劃的一組數(shù)據(jù)。這里,從輸入單元11輸入筆劃的完成包括用戶結(jié)束書寫手寫字符串的 情況,進行手寫字符串的保存操作的情況,以及類似的情況。即,墨水?dāng)?shù)據(jù)起到表示對于每 個頁面(文檔)的筆劃組的數(shù)據(jù)。
[0028] 在獲取單元13將多個筆劃組存儲在墨水?dāng)?shù)據(jù)存儲單元15中的情況下,墨水?dāng)?shù)據(jù) 能夠與頁面(文檔)ID相關(guān)聯(lián),以便識別個別筆劃組。換句話說,獲取單元13能夠使表示筆 劃的數(shù)據(jù)與筆劃ID相關(guān)聯(lián),以便識別個別筆劃。
[0029] 圖4是圖解實施例中的墨水?dāng)?shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)的實例的圖,并且圖解通過獲取單元 13在墨水?dāng)?shù)據(jù)存儲單元15中存儲的墨水?dāng)?shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)。在實施例中,墨水?dāng)?shù)據(jù)通過三層 數(shù)據(jù)結(jié)構(gòu)被表示,該三層數(shù)據(jù)結(jié)構(gòu)包括墨水?dāng)?shù)據(jù)結(jié)構(gòu),筆劃結(jié)構(gòu)和點結(jié)構(gòu)。但是,不應(yīng)該以 限定意義來解釋。
[0030] 墨水?dāng)?shù)據(jù)結(jié)構(gòu)是包括構(gòu)成筆劃組的筆劃的總數(shù)和構(gòu)成筆劃組的各個筆劃的筆劃 結(jié)構(gòu)的結(jié)構(gòu)。筆劃結(jié)構(gòu)是包括以下的結(jié)構(gòu):構(gòu)成筆劃的采樣點的總數(shù)、開始輸入筆劃的開始 時間(筆向下狀態(tài)開始的時間)、筆劃的外接矩形、和構(gòu)成筆劃的各個采樣點的點結(jié)構(gòu)。在實 施例中,筆劃的外接矩形具有包含筆劃的最小面積的矩形形狀。但是,不應(yīng)該以限定意義來 解釋。點結(jié)構(gòu)是包括X坐標(biāo)、y坐標(biāo)、筆壓力和距離采樣點的開始時間的時間差的結(jié)構(gòu)。這 里,包括X坐標(biāo)和y坐標(biāo)的坐標(biāo)系統(tǒng)能夠是這樣的坐標(biāo)系統(tǒng),原點在觸摸屏的輸入表面上的 左上角(角度),X坐標(biāo)的值朝著觸摸屏的右側(cè)變得更大,并且y坐標(biāo)的值朝著觸摸屏的下側(cè) 變得更大。
[0031] 在觸摸屏不能對筆壓力進行采樣的情況下,或者在筆壓力不被用于隨后的處理的 情況下,點結(jié)構(gòu)中的壓力可以被省略或者指示無效的值可以被設(shè)定成點結(jié)構(gòu)中的筆壓力。 在觸摸屏不能對諸如開始時間和距離開始時間的時間差的時間進行采樣的情況下,或者在 時間不被用于隨后的處理的情況下,指示點結(jié)構(gòu)的次序可以被設(shè)定成點結(jié)構(gòu)中的時間差, 點結(jié)構(gòu)中的時間差可以被省略,或者指示無效的值可以被設(shè)定成點結(jié)構(gòu)中的時間差。
[0032] 在筆劃結(jié)構(gòu)的每個項目中,可以書寫實際數(shù)據(jù)。為了分別管理來自彼此的墨水?dāng)?shù) 據(jù)結(jié)構(gòu)的數(shù)據(jù)和筆劃結(jié)構(gòu)的數(shù)據(jù),對應(yīng)筆劃結(jié)構(gòu)的鏈接信息可以被寫入墨水?dāng)?shù)據(jù)結(jié)構(gòu)中的 筆劃結(jié)構(gòu)的區(qū)域中。類似地,在點結(jié)構(gòu)的每個項目中,可以書寫實際數(shù)據(jù)。為了分別管理來 自彼此的筆劃結(jié)構(gòu)的數(shù)據(jù)和點結(jié)構(gòu)的數(shù)據(jù),對應(yīng)點結(jié)構(gòu)的鏈接信息可以被寫入筆劃結(jié)構(gòu)中 的點結(jié)構(gòu)的區(qū)域中。
[0033] 分割單元17將通過獲取單元13獲取的多個第一點序列中的每一個分割成多個第 二點序列。在實施例中,分割單元17將構(gòu)成筆劃組(多個筆劃)的每個筆劃分割成多個副筆 劃,筆劃組由存儲在墨水?dāng)?shù)據(jù)存儲單元15中的墨水?dāng)?shù)據(jù)指示。分割單元17將表示各個副 筆劃的數(shù)據(jù)和指示哪個數(shù)據(jù)表示這個數(shù)據(jù)所屬于的筆劃的鏈接信息添加到墨水?dāng)?shù)據(jù)存儲 單元15中存儲的墨水?dāng)?shù)據(jù)。
[0034] 圖5是圖解表示實施例中的副筆劃的數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)的實例的圖,并且圖解通過 分割單元17添加到墨水?dāng)?shù)據(jù)存儲單元15中的數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)。在實施例中,表示副筆劃 的數(shù)據(jù)通過兩層數(shù)據(jù)結(jié)構(gòu)被表示,兩層數(shù)據(jù)結(jié)構(gòu)包括副筆劃結(jié)構(gòu)和點結(jié)構(gòu)。但是,不應(yīng)該以 限定意義來解釋。
[0035] 副筆劃結(jié)構(gòu)是包括以下的結(jié)構(gòu):構(gòu)成副筆劃的采樣點的總數(shù)、開始輸入副筆劃的 開始時間、對于副筆劃所屬于的筆劃的筆劃結(jié)構(gòu)的指針、副筆劃的外接矩形、和構(gòu)成副筆劃 的各個采樣點的點結(jié)構(gòu)。
[0036] 分割單元17將筆劃分割成多個副筆劃,因此例如多個副筆劃的各個曲率變成等 于或小于閾值。這里,筆劃的曲率可以在每個采樣點被計算。但是,采樣點的數(shù)目依賴于筆 劃的尺寸和采樣率而改變。因此,在這樣的情形下,允許計算曲率的點對于每個筆劃改變。
[0037] 因此,分割單元17通過固定數(shù)量的采樣點來近似筆劃,并且進行重新采樣,以便 確保采樣點之間的恒定距離。分割單元17例如通過線性插值計算重新采樣點的坐標(biāo)值,以 便確保采樣點之間的恒定距離。在這種情況下,在分割單元17減少重新采樣點的數(shù)目時, 筆劃被近似成直線。
[0038] 例如,在作為分割目標(biāo)的筆劃S中從重新采樣點Sbase到重新采樣點Si的曲率C s (base,i )由方程式(1)來表不。
[0039]
【權(quán)利要求】
1. 一種設(shè)備,其特征在于,所述設(shè)備包含: 獲取部,所述獲取部被配置成獲取多個第一點序列; 分割部,所述分割部被配置成將所述多個第一點序列中的每一個分割成多個第二點序 列; 提取部,所述提取部被配置成提取所述多個第二點序列中的每一個的特征向量; 計算部,所述計算部被配置成基于所述多個第二點序列之中的最佳路徑,來計算所述 多個第一點序列之間的距離,所述多個第二點序列屬于所述多個第一點序列中的每一個, 和 檢索部,所述檢索部被配置成使用所述距離來檢索與所述多個第一點序列相對應(yīng)的數(shù) 據(jù)。
2. 如權(quán)利要求1所述的設(shè)備,其特征在于, 所述分割部被配置成將所述多個第一點序列中的每一個分割成所述多個第二點序列, 以使所述多個第二點序列中的每一個的曲率變成等于或小于閾值。
3. 如權(quán)利要求1所述的設(shè)備,其特征在于, 所述分割部被配置成將所述多個第一點序列中的每一個分割成所述多個第二點序列, 以使所述多個第二點序列中的每一個的長度變成等于或小于閾值。
4. 如權(quán)利要求1所述的設(shè)備,其特征在于, 所述分割部被配置成將所述多個第一點序列中的每一個分割成所述多個第二點序列, 以使所述多個第二點序列的數(shù)目變成第一數(shù)目。
5. 如權(quán)利要求1所述的設(shè)備,其特征在于,進一步包含顯示控制器,所述顯示控制器被 配置成在顯示單元上顯示檢索的數(shù)據(jù)。
6. 如權(quán)利要求5所述的設(shè)備,其特征在于, 所述多個第一點序列構(gòu)成由用戶手寫的字符串的筆劃組, 所述多個第二點序列中的每一個與所述筆劃組的筆劃的副筆劃相對應(yīng), 所述數(shù)據(jù)是指示字符串的字符串?dāng)?shù)據(jù), 所述獲取部被配置成通過順序地獲取構(gòu)成所述筆劃組的筆劃,來獲取所述筆劃組, 所述分割部被配置成將構(gòu)成所述筆劃組的每個所述筆劃分割成多個副筆劃, 所述計算部被配置成基于屬于構(gòu)成所述筆劃組的每個所述筆劃的所述副筆劃之間的 最佳路徑,來計算構(gòu)成所述筆劃組的所述筆劃之間的距離, 所述檢索部被配置成使用所述距離,來檢索與所述筆劃組相對應(yīng)的所述字符串?dāng)?shù)據(jù), 并且 所述顯示控制器被配置成在所述顯示單元上顯示檢索的所述字符串?dāng)?shù)據(jù)。
7. 如權(quán)利要求1所述的設(shè)備,其特征在于, 所述獲取部被配置成獲取由用戶指定的所述多個第一點序列。
8. -種方法,其特征在于,包含: 獲取多個第一點序列; 將所述多個第一點序列中的每一個分割成多個第二點序列; 提取所述多個第二點序列中的每一個的特征向量; 基于屬于所述第一點序列中的每一個的所述多個第二點序列之間的最佳路徑,來計算 所述多個第一點序列之間的距離;并且 使用所述距離來檢索與所述多個第一點序列相對應(yīng)的數(shù)據(jù)。
【文檔編號】G06F17/30GK104216940SQ201410082975
【公開日】2014年12月17日 申請日期:2014年3月7日 優(yōu)先權(quán)日:2013年5月31日
【發(fā)明者】柴田智行, 登內(nèi)洋次郎 申請人:株式會社東芝