欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于互聯(lián)網(wǎng)檢索關(guān)鍵詞識別視頻偏好的方法及系統(tǒng)的制作方法

文檔序號:10553027閱讀:246來源:國知局
一種基于互聯(lián)網(wǎng)檢索關(guān)鍵詞識別視頻偏好的方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及一種基于互聯(lián)網(wǎng)檢索關(guān)鍵詞識別視頻偏好的方法及系統(tǒng),其方法包括以下步驟,S1,初始化詞典;S2,將視頻類關(guān)鍵詞進行切割,得到多個分詞;S3,將多個分詞分別進行反向語義分析檢索;并分別對多個分詞的檢索結(jié)果進行評分;S4,將多個分詞分別進行基礎(chǔ)語義分析檢索,并分別對多個分詞的檢索結(jié)果進行評分;S5,將多個分詞分別進行正向語義分析檢索,并分別對多個分詞的檢索結(jié)果進行評分;S6,對檢索視頻類關(guān)鍵詞的互聯(lián)網(wǎng)的網(wǎng)站域名進行域名評分;S7,對步驟S3至S6中的評分結(jié)果進行組裝綜合,得到本次檢索行為的最終評分;S8,根據(jù)最終評分識別視頻偏好。本發(fā)明識別能力強,擁有視頻偏好環(huán)境下的語義識別能力。
【專利說明】
一種基于互聯(lián)網(wǎng)檢索關(guān)鍵詞識別視頻偏好的方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及一種識別視頻偏好的方法及系統(tǒng),具體的涉及一種基于互聯(lián)網(wǎng)檢索關(guān) 鍵詞識別視頻偏好的方法及系統(tǒng)。
【背景技術(shù)】
[0002] 計算機科學(xué)領(lǐng)域的一個重要分支就是"人工智能",它企圖了解智能的實質(zhì),并生 產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機器,該領(lǐng)域的研究包括機器人、 語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。在自然語言處理方面,如何讓計算機識 別和理解人類的語言,并且模擬人類思維方式去思考、推理問題,是完成"人工智能"這個人 類偉大理想的重要舉措。不管是中文,英文語言環(huán)境中,除了"你""我""他"等這類個別的例 外以外,詞組才是人類表達(dá)語義的最小單位。中文由于其深厚而且博大精深的文化底蘊, "長字符串"形式的書寫方式使得計算機在理解中文方面遠(yuǎn)比理解英文要困難很多。因為英 文本身就是以"詞"為最小的存在單位,書寫方式是以空格區(qū)分每個詞分割,所以計算機能 通過空格來很好的識別英文的一個最小語義表達(dá)。中文的復(fù)雜程度、表達(dá)語義的能力遠(yuǎn)遠(yuǎn) 高于英文,同樣一個詞在不同的語用、語境下表達(dá)的意思是完全不同的。比如"乒乓球拍賣 完了",可以理解為"兵乓球_拍賣完了"、也可以是"兵乓球拍_賣完了",再比如"XXX行賄 YYY"和"YYY行賄XXX"。同樣的內(nèi)容不同的分割、不同的順序,表達(dá)的意思就完全不一樣。所 以若想讓計算機識別中文文本,第一步要做的就是告訴計算機在一句話中,哪幾個字是一 個詞組。而這就是分詞的過程。而由于中文具有非常強的歧義性,所以準(zhǔn)確分詞技術(shù)是一項 非常復(fù)雜和具有挑戰(zhàn)性的工作。
[0003] 現(xiàn)有技術(shù)方案是通過關(guān)鍵字進行檢索的,關(guān)鍵字檢索運用最常見的地方是基于關(guān) 鍵字檢索的客戶問答系統(tǒng),在很多門戶網(wǎng)站上均部署有此類機器問答系統(tǒng),其實此類系統(tǒng) 就是傳統(tǒng)FAQ(Frequently Asked Questions)的升級,當(dāng)FAQ過多時用戶可能不方便查找自 己關(guān)心的信息,于是有了這種升級和改進,專注于用戶"問什么,答什么"。這種識別方法比 較簡單,成本低見效快,但是準(zhǔn)確度不高,容易誤判,不能進行語義識別。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明所要解決的技術(shù)問題是提供一種高準(zhǔn)確度的、可以進行語義分析的基于互 聯(lián)網(wǎng)檢索關(guān)鍵詞識別視頻偏好的方法及系統(tǒng)。
[0005] 本發(fā)明解決上述技術(shù)問題的技術(shù)方案如下:一種基于互聯(lián)網(wǎng)檢索關(guān)鍵詞識別視頻 偏好的方法,包括以下步驟,
[0006] S1,初始化詞典,其中詞典包括停止詞典、基礎(chǔ)詞典、正向詞典、反向詞典和核心詞 血. ,、,
[0007] S2,將視頻類關(guān)鍵詞在停止詞典的輔助作用下,通過與核心詞典匹配進行切割,得 到多個分詞;
[0008] S3,將多個分詞分別通過反向詞典進行反向語義分析檢索,并根據(jù)預(yù)設(shè)的反向語 義分析檢索規(guī)則分別對多個分詞的反向語義分析檢索結(jié)果進行評分;
[0009] S4,將多個分詞分別通過基礎(chǔ)詞典進行基礎(chǔ)語義分析檢索,并根據(jù)預(yù)設(shè)的基礎(chǔ)語 義分析檢索規(guī)則分別對多個分詞的基礎(chǔ)語義分析檢索結(jié)果進行評分;
[0010] S5,將多個分詞分別通過正向詞典進行正向語義分析檢索,并根據(jù)預(yù)設(shè)的正向語 義分析檢索規(guī)則分別對多個分詞的正向語義分析檢索結(jié)果進行評分;
[0011] S6,對檢索視頻類關(guān)鍵詞的互聯(lián)網(wǎng)的網(wǎng)站域名根據(jù)預(yù)設(shè)的域名評分規(guī)則進行域名 評分;
[0012] S7,對步驟S3、S4、S5和S6中的評分結(jié)果進行組裝綜合,得到本次檢索行為的最終 評分;
[0013] S8,根據(jù)最終評分識別視頻偏好。
[0014]本發(fā)明的有益效果是:本發(fā)明一種基于互聯(lián)網(wǎng)檢索關(guān)鍵字識別視頻偏好的方法通 過分割關(guān)鍵詞,然后進行反向檢索、基礎(chǔ)檢索和正向檢索,在反向檢索、基礎(chǔ)檢索和正向檢 索的過程中分別進行語義評分,接著進行域名評分,將語義評分和域名評分的結(jié)果進行綜 合語義判斷,識別結(jié)果者有了質(zhì)的飛躍,識別能力強,擁有視頻偏好環(huán)境下的語義識別能 力。
[0015] 在上述技術(shù)方案的基礎(chǔ)上,本發(fā)明還可以做如下改進。
[0016] 進一步,所述停止詞典用于存放動詞和助詞。
[0017] 進一步,所述基礎(chǔ)詞典用于存放視頻信息。
[0018] 進一步,所述正向詞典用于存放視頻類語義正向輔助詞。
[0019] 進一步,所述反向詞典用于存放視頻類語義反向輔助詞。
[0020] 進一步,所述核心詞典用于通過添加基礎(chǔ)詞典、正向詞典和反向詞典中的詞來拆 分關(guān)鍵詞。
[0021 ]采用上述進一步方案的有益效果是:可自由擴展核心詞典,運行過程中可動態(tài)操 作核心詞典。
[0022] 進一步,多個分詞通過調(diào)用匹配引擎分別在反向詞典、基礎(chǔ)詞典和正向詞典進行 檢索。
[0023] 采用上述進一步方案的有益效果是:全過程在內(nèi)存中完成,識別速度快。
[0024] 進一步,所述匹配引擎以Lucene為應(yīng)用主體,結(jié)合詞典和文法分析算法的 IKAnalyzer3的核心API來實現(xiàn)匹配功能。
[0025] 進一步,所述反向詞典和基礎(chǔ)詞典以內(nèi)存索引的方式供匹配引擎使用。
[0026]基于上述一種基于互聯(lián)網(wǎng)檢索關(guān)鍵詞識別視頻偏好的方法,本發(fā)明還提供一種基 于互聯(lián)網(wǎng)檢索關(guān)鍵詞識別視頻偏好的系統(tǒng)。
[0027] -種基于互聯(lián)網(wǎng)檢索關(guān)鍵字識別視頻偏好的系統(tǒng),包括初始化模塊、分詞模塊、反 向語義分析評分模塊、基礎(chǔ)語義分析評分模塊、正向語義分析評分模塊、域名評分模塊、綜 合評分模塊和識別模塊,
[0028] 所述初始化模塊,其用于初始化詞典,其中詞典包括停止詞典、基礎(chǔ)詞典、正向詞 典、反向詞典和核心詞典;
[0029] 所述分詞模塊,其用于將視頻類關(guān)鍵詞在停止詞典的輔助作用下,通過與核心詞 典匹配進行切割,得到多個分詞;
[0030] 所述反向語義分析評分模塊,其用于將多個分詞分別通過反向詞典進行反向語義 分析檢索;并根據(jù)預(yù)設(shè)的反向語義分析檢索規(guī)則分別對多個分詞的反向語義分析檢索結(jié)果 進tx評分;
[0031] 所述基礎(chǔ)語義分析評分模塊,其用于將多個分詞分別通過基礎(chǔ)詞典進行基礎(chǔ)語義 分析檢索,并根據(jù)預(yù)設(shè)的基礎(chǔ)語義分析檢索規(guī)則分別對多個分詞的基礎(chǔ)語義分析檢索結(jié)果 進tx評分;
[0032] 所述正向語義分析評分模塊,其用于將多個分詞分別通過正向詞典進行正向語義 分析檢索,并根據(jù)預(yù)設(shè)的正向語義分析檢索規(guī)則分別對多個分詞的正向語義分析檢索結(jié)果 進tx評分;
[0033] 所述域名評分模塊,其用于對檢索視頻類關(guān)鍵詞的互聯(lián)網(wǎng)的網(wǎng)站域名根據(jù)預(yù)設(shè)的 域名評分規(guī)則進行域名評分;
[0034] 所述綜合評分模塊,其用于對所述反向語義分析評分模塊、基礎(chǔ)語義分析評分模 塊、正向語義分析評分模塊和域名評分模塊中的評分結(jié)果進行組裝綜合,得到本次檢索行 為的最終評分;
[0035] 所述識別模塊,其用于根據(jù)最終評分識別視頻偏好。
[0036]本發(fā)明的有益效果是:本發(fā)明一種基于互聯(lián)網(wǎng)檢索關(guān)鍵字識別視頻偏好的系統(tǒng)通 過分割關(guān)鍵詞,然后進行反向檢索、基礎(chǔ)檢索和正向檢索,在反向檢索、基礎(chǔ)檢索和正向檢 索的過程中分別進行語義評分,接著進行域名評分,將語義評分和域名評分的結(jié)果進行綜 合語義判斷,識別結(jié)果者有了質(zhì)的飛躍,識別能力強,擁有視頻偏好環(huán)境下的語義識別能 力。
【附圖說明】
[0037]圖1為本發(fā)明一種基于互聯(lián)網(wǎng)檢索關(guān)鍵字識別視頻偏好的方法的流程圖;
[0038]圖2為本發(fā)明一種基于互聯(lián)網(wǎng)檢索關(guān)鍵字識別視頻偏好的系統(tǒng)的框圖。
【具體實施方式】
[0039] 以下結(jié)合附圖對本發(fā)明的原理和特征進行描述,所舉實例只用于解釋本發(fā)明,并 非用于限定本發(fā)明的范圍。
[0040] 如圖1所示,一種基于互聯(lián)網(wǎng)檢索關(guān)鍵詞識別視頻偏好的方法,包括以下步驟,
[0041 ] S1,初始化詞典,其中詞典包括停止詞典、基礎(chǔ)詞典、正向詞典、反向詞典和核心詞 血. ,、,
[0042] S2,將視頻類關(guān)鍵詞在停止詞典的輔助作用下,通過與核心詞典匹配進行切割,得 到多個分詞;
[0043] S3,將多個分詞分別通過反向詞典進行反向語義分析檢索;并根據(jù)預(yù)設(shè)的反向語 義分析檢索規(guī)則分別對多個分詞的反向語義分析檢索結(jié)果進行評分;
[0044] S4,將多個分詞分別通過基礎(chǔ)詞典進行基礎(chǔ)語義分析檢索,并根據(jù)預(yù)設(shè)的基礎(chǔ)語 義分析檢索規(guī)則分別對多個分詞的基礎(chǔ)語義分析檢索結(jié)果進行評分;
[0045] S5,將多個分詞分別通過正向詞典進行正向語義分析檢索,并根據(jù)預(yù)設(shè)的正向語 義分析檢索規(guī)則分別對多個分詞的正向語義分析檢索結(jié)果進行評分;
[0046] S6,對檢索視頻類關(guān)鍵詞的互聯(lián)網(wǎng)的網(wǎng)站域名根據(jù)預(yù)設(shè)的域名評分規(guī)則進行域名 評分;
[0047] S7,對步驟S3、S4、S5和S6中的評分結(jié)果進行組裝綜合,得到本次檢索行為的最終 評分;
[0048] S8,根據(jù)最終評分識別視頻偏好。
[0049] 所述停止詞典用于存放動詞和助詞,例如:也、啊、又、比、與、但...。所述基礎(chǔ)詞典 用于存放視頻信息,例如:名稱:孔子,歸屬:國內(nèi)電影,主演:周潤發(fā)。所述正向詞典用于存 放視頻類語義正向輔助詞,例如:下載、視頻時長、好萊塢、價格、...。所述反向詞典用于存 放視頻類語義反向輔助詞,例如:翻拍、低清、槍版、斷裂、壞了 ...。所述核心詞典用于通過 添加基礎(chǔ)詞典、正向詞典和反向詞典中的詞來拆分關(guān)鍵詞;運行過程中可動態(tài)操作核心詞 典。
[0050] 本發(fā)明一種基于互聯(lián)網(wǎng)檢索關(guān)鍵詞識別視頻偏好的方法使用了開源的分詞工具 IKAnalyzer進行分詞,多個分詞通過調(diào)用匹配引擎分別在反向詞典、基礎(chǔ)詞典和正向詞典 進行檢索;全過程在內(nèi)存中完成,識別速度快。所述匹配引擎以Lucene為應(yīng)用主體,結(jié)合詞 典和文法分析算法的IKAnalyzer3的核心API來實現(xiàn)匹配功能。所述反向詞典和基礎(chǔ)詞典以 內(nèi)存索引的方式供匹配引擎使用。
[0051 ] 在進行域名評分時,在服務(wù)內(nèi)部預(yù)先建立好對應(yīng)的評分匹配規(guī)則,例如:
[0052] V. ba i du. com +5 分; www. iqiy i. G〇m +5 分-;
[0053] www. youku. com +5 ^; www, tudou. com +.5 分:〇
[0054]本發(fā)明一種基于互聯(lián)網(wǎng)檢索關(guān)鍵字識別視頻偏好的方法通過分割關(guān)鍵詞,然后進 行反向檢索、基礎(chǔ)檢索和正向檢索,在反向檢索、基礎(chǔ)檢索和正向檢索的過程中分別進行語 義評分,接著進行域名評分,將語義評分和域名評分的結(jié)果進行綜合語義判斷,識別結(jié)果者 有了質(zhì)的飛躍,識別能力強,擁有視頻偏好環(huán)境下的語義識別能力。
[0055] 在本具體實施例中,以"18812345678"來至"v. baidu. com/12897483"的搜索關(guān)鍵 詞"古劍奇譚電視"為例,結(jié)合圖1說明通過搜索關(guān)鍵字進行語義分析識別視頻偏好的具體 方法。
[0056] S1,初始化詞典,接收搜索關(guān)鍵詞"古劍奇譚電視",執(zhí)行S2。
[0057] S2,將"古劍奇譚電視"在停止詞典的輔助作用下,通過與核心詞典匹配進行切割, 拆分為:"古劍奇譚"、"電視",執(zhí)行S3。
[0058] S3,匹配引擎分別將"古劍奇譚"、"電視"通過反向詞典進行反向匹配,最終未匹配 成功,不進行加分,執(zhí)行S4。
[0059] S4,匹配引擎分別將"古劍奇譚"、"電視"通過基礎(chǔ)詞典進行基礎(chǔ)匹配,最終,"古劍 奇譚"匹配成功:{名稱:古劍奇譚,歸屬:國內(nèi)電視劇,主演:李易峰、楊冪},"電視"在視頻中 匹配成功,隨后產(chǎn)生初始分?jǐn)?shù),執(zhí)行S5。
[0060] S5,匹配引擎分別將"古劍奇譚"、"電視"通過正向詞典進行正向匹配,最終未匹配 成功,不進行加分操作,執(zhí)行S6。
[0061] S6,將檢索視頻類關(guān)鍵詞的互聯(lián)網(wǎng)的網(wǎng)站域名"V.baidu.com/12897483"進行分析 打分,經(jīng)過拆解最終同"v. baidu. com"匹配成功,進行加分操作,執(zhí)行S7。
[0062] S7,對步驟S3、S4、S5和S6的得分結(jié)果進行綜合評分,產(chǎn)生該次搜索行為的最終得 分,執(zhí)行S8。
[0063] S8,對產(chǎn)生的結(jié)果和任務(wù)信息進行格式化,最終返回并保存類似以下的結(jié)果:
[0065]至此,通過搜索關(guān)鍵字進行語義分析識別客戶視頻偏好的具體方法流程結(jié)束。 [0066]基于上述一種基于互聯(lián)網(wǎng)檢索關(guān)鍵詞識別視頻偏好的方法,本發(fā)明還提供一種基 于互聯(lián)網(wǎng)檢索關(guān)鍵詞識別視頻偏好的系統(tǒng)。
[0067]如圖2所示,一種基于互聯(lián)網(wǎng)檢索關(guān)鍵字識別視頻偏好的系統(tǒng),包括初始化模塊、 分詞模塊、反向語義分析評分模塊、基礎(chǔ)語義分析評分模塊、正向語義分析評分模塊、域名 評分模塊、綜合評分模塊和識別模塊,
[0068] 所述初始化模塊,其用于初始化詞典,其中詞典包括停止詞典、基礎(chǔ)詞典、正向詞 典、反向詞典和核心詞典;
[0069] 所述分詞模塊,其用于將視頻類關(guān)鍵詞在停止詞典的輔助作用下,通過與核心詞 典匹配進行切割,得到多個分詞;
[0070] 所述反向語義分析評分模塊,其用于將多個分詞分別通過反向詞典進行反向語義 分析檢索;并根據(jù)預(yù)設(shè)的反向語義分析檢索規(guī)則分別對多個分詞的反向語義分析檢索結(jié)果 進行評分;
[0071] 所述基礎(chǔ)語義分析評分模塊,其用于將多個分詞分別通過基礎(chǔ)詞典進行基礎(chǔ)語義 分析檢索,并根據(jù)預(yù)設(shè)的基礎(chǔ)語義分析檢索規(guī)則分別對多個分詞的基礎(chǔ)語義分析檢索結(jié)果 進tx評分;
[0072] 所述正向語義分析評分模塊,其用于將多個分詞分別通過正向詞典進行正向語義 分析檢索,并根據(jù)預(yù)設(shè)的正向語義分析檢索規(guī)則分別對多個分詞的正向語義分析檢索結(jié)果 進tx評分;
[0073] 所述域名評分模塊,其用于對檢索視頻類關(guān)鍵詞的互聯(lián)網(wǎng)的網(wǎng)站域名根據(jù)預(yù)設(shè)的 域名評分規(guī)則進行域名評分;
[0074] 所述綜合評分模塊,其用于對所述反向語義分析評分模塊、基礎(chǔ)語義分析評分模 塊、正向語義分析評分模塊和域名評分模塊中的評分結(jié)果進行組裝綜合,得到本次檢索行 為的最終評分;
[0075] 所述識別模塊,其用于根據(jù)最終評分識別視頻偏好。
[0076]本發(fā)明一種基于互聯(lián)網(wǎng)檢索關(guān)鍵字識別視頻偏好的系統(tǒng)通過分割關(guān)鍵詞,然后進 行反向檢索、基礎(chǔ)檢索和正向檢索,在反向檢索、基礎(chǔ)檢索和正向檢索的過程中分別進行語 義評分,接著進行域名評分,將語義評分和域名評分的結(jié)果進行綜合語義判斷,識別結(jié)果者 有了質(zhì)的飛躍,識別能力強,擁有視頻偏好環(huán)境下的語義識別能力。
[0077]以上所述僅為本發(fā)明的較佳實施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和 原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
【主權(quán)項】
1. 一種基于互聯(lián)網(wǎng)檢索關(guān)鍵詞識別視頻偏好的方法,其特征在于:包括以下步驟, Sl,初始化詞典,其中詞典包括停止詞典、基礎(chǔ)詞典、正向詞典、反向詞典和核心詞典; 52, 將視頻類關(guān)鍵詞在停止詞典的輔助作用下,通過與核心詞典匹配進行切割,得到多 個分詞; 53, 將多個分詞分別通過反向詞典進行反向語義分析檢索,并根據(jù)預(yù)設(shè)的反向語義分 析檢索規(guī)則分別對多個分詞的反向語義分析檢索結(jié)果進行評分; 54, 將多個分詞分別通過基礎(chǔ)詞典進行基礎(chǔ)語義分析檢索,并根據(jù)預(yù)設(shè)的基礎(chǔ)語義分 析檢索規(guī)則分別對多個分詞的基礎(chǔ)語義分析檢索結(jié)果進行評分; 55, 將多個分詞分別通過正向詞典進行正向語義分析檢索,并根據(jù)預(yù)設(shè)的正向語義分 析檢索規(guī)則分別對多個分詞的正向語義分析檢索結(jié)果進行評分; 56, 對檢索視頻類關(guān)鍵詞的互聯(lián)網(wǎng)的網(wǎng)站域名根據(jù)預(yù)設(shè)的域名評分規(guī)則進行域名評 分; 57, 對步驟S3、S4、S5和S6中的評分結(jié)果進行組裝綜合,得到本次檢索行為的最終評分; S8,根據(jù)最終評分識別視頻偏好。2. 根據(jù)權(quán)利要求1所述的一種基于互聯(lián)網(wǎng)檢索關(guān)鍵詞識別視頻偏好的方法,其特征在 于:所述停止詞典用于存放動詞和助詞。3. 根據(jù)權(quán)利要求2所述的一種基于互聯(lián)網(wǎng)檢索關(guān)鍵詞識別視頻偏好的方法,其特征在 于:所述基礎(chǔ)詞典用于存放視頻信息。4. 根據(jù)權(quán)利要求3所述的一種基于互聯(lián)網(wǎng)檢索關(guān)鍵詞識別視頻偏好的方法,其特征在 于:所述正向詞典用于存放視頻類語義正向輔助詞。5. 根據(jù)權(quán)利要求4所述的一種基于互聯(lián)網(wǎng)檢索關(guān)鍵詞識別視頻偏好的方法,其特征在 于:所述反向詞典用于存放視頻類語義反向輔助詞。6. 根據(jù)權(quán)利要求5所述的一種基于互聯(lián)網(wǎng)檢索關(guān)鍵詞識別視頻偏好的方法,其特征在 于:所述核心詞典用于通過添加基礎(chǔ)詞典、正向詞典和反向詞典中的詞來拆分關(guān)鍵詞。7. 根據(jù)權(quán)利要求1至6任一項所述的一種基于互聯(lián)網(wǎng)檢索關(guān)鍵詞識別視頻偏好的方法, 其特征在于:多個分詞通過調(diào)用匹配引擎分別在反向詞典、基礎(chǔ)詞典和正向詞典進行檢索。8. 根據(jù)權(quán)利要求7所述的一種基于互聯(lián)網(wǎng)檢索關(guān)鍵詞識別視頻偏好的方法,其特征在 于:所述匹配引擎以Lucene為應(yīng)用主體,結(jié)合詞典和文法分析算法的IKAnalyzer3的核心 API來實現(xiàn)匹配功能。9. 根據(jù)權(quán)利要求7所述的一種基于互聯(lián)網(wǎng)檢索關(guān)鍵詞識別視頻偏好的方法,其特征在 于:所述反向詞典和基礎(chǔ)詞典以內(nèi)存索引的方式供匹配引擎使用。10. -種基于互聯(lián)網(wǎng)檢索關(guān)鍵詞識別視頻偏好的系統(tǒng),其特征在于:包括初始化模塊、 分詞模塊、反向語義分析評分模塊、基礎(chǔ)語義分析評分模塊、正向語義分析評分模塊、域名 評分模塊、綜合評分模塊和識別模塊, 所述初始化模塊,其用于初始化詞典,其中詞典包括停止詞典、基礎(chǔ)詞典、正向詞典、反 向詞典和核心詞典; 所述分詞模塊,其用于將視頻類關(guān)鍵詞在停止詞典的輔助作用下,通過與核心詞典匹 配進行切割,得到多個分詞; 所述反向語義分析評分模塊,其用于將多個分詞分別通過反向詞典進行反向語義分析 檢索;并根據(jù)預(yù)設(shè)的反向語義分析檢索規(guī)則分別對多個分詞的反向語義分析檢索結(jié)果進行 評分; 所述基礎(chǔ)語義分析評分模塊,其用于將多個分詞分別通過基礎(chǔ)詞典進行基礎(chǔ)語義分析 檢索,并根據(jù)預(yù)設(shè)的基礎(chǔ)語義分析檢索規(guī)則分別對多個分詞的基礎(chǔ)語義分析檢索結(jié)果進行 評分; 所述正向語義分析評分模塊,其用于將多個分詞分別通過正向詞典進行正向語義分析 檢索,并根據(jù)預(yù)設(shè)的正向語義分析檢索規(guī)則分別對多個分詞的正向語義分析檢索結(jié)果進行 評分; 所述域名評分模塊,其用于對檢索視頻類關(guān)鍵詞的互聯(lián)網(wǎng)的網(wǎng)站域名根據(jù)預(yù)設(shè)的域名 評分規(guī)則進行域名評分; 所述綜合評分模塊,其用于對所述反向語義分析評分模塊、基礎(chǔ)語義分析評分模塊、正 向語義分析評分模塊和域名評分模塊中的評分結(jié)果進行組裝綜合,得到本次檢索行為的最 終評分; 所述識別模塊,其用于根據(jù)最終評分識別視頻偏好。
【文檔編號】G06F17/30GK105912676SQ201610228332
【公開日】2016年8月31日
【申請日】2016年4月13日
【發(fā)明人】蘇志凌
【申請人】北京思特奇信息技術(shù)股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
富锦市| 弥渡县| 建平县| 荣昌县| 衡水市| 噶尔县| 兖州市| 龙泉市| 平陆县| 珠海市| 江城| 奈曼旗| 义马市| 平原县| 保康县| 军事| 临湘市| 莆田市| 天峻县| 肇州县| 咸丰县| 宁德市| 温宿县| 翁牛特旗| 莱芜市| 安达市| 南平市| 山阴县| 霍林郭勒市| 石阡县| 开远市| 鲁甸县| 桂平市| 虞城县| 铜梁县| 紫阳县| 陈巴尔虎旗| 深水埗区| 略阳县| 精河县| 锡林郭勒盟|