欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于問(wèn)答平臺(tái)的數(shù)據(jù)處理方法和裝置的制造方法_4

文檔序號(hào):9287744閱讀:來(lái)源:國(guó)知局
的形式。而且,本發(fā)明實(shí)施例可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器、CD-ROM、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
[0104]本發(fā)明實(shí)施例是參照根據(jù)本發(fā)明實(shí)施例的方法、終端設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來(lái)描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過(guò)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。
[0105]這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
[0106]這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備上,使得在計(jì)算機(jī)或其他可編程終端設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程終端設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
[0107]盡管已描述了本發(fā)明實(shí)施例的優(yōu)選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對(duì)這些實(shí)施例做出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實(shí)施例以及落入本發(fā)明實(shí)施例范圍的所有變更和修改。
[0108]最后,還需要說(shuō)明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開(kāi)來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者終端設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、物品或者終端設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過(guò)程、方法、物品或者終端設(shè)備中還存在另外的相同要素。
[0109]以上對(duì)本發(fā)明所提供的一種基于問(wèn)答平臺(tái)的數(shù)據(jù)處理方法和一種基于問(wèn)答平臺(tái)的數(shù)據(jù)處理裝置,進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在【具體實(shí)施方式】及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書(shū)內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。
【主權(quán)項(xiàng)】
1.一種基于問(wèn)答平臺(tái)的數(shù)據(jù)處理方法,其特征在于,包括: 對(duì)從問(wèn)答平臺(tái)獲取的各答案數(shù)據(jù)分別進(jìn)行文本分析,確定各答案數(shù)據(jù)的相似度;根據(jù)所述問(wèn)答平臺(tái)記錄的各項(xiàng)問(wèn)題與答案數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系,按照所述相似度分別對(duì)各答案數(shù)據(jù)對(duì)應(yīng)的問(wèn)題進(jìn)行聚類,得到各問(wèn)題簇; 分別對(duì)每個(gè)問(wèn)題簇中的各項(xiàng)問(wèn)題進(jìn)行文本分析,提取所述問(wèn)題簇中由各問(wèn)題的關(guān)鍵詞所構(gòu)成的相關(guān)詞對(duì),其中,同一問(wèn)題簇內(nèi)的各關(guān)鍵詞具有相關(guān)性。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)從問(wèn)答平臺(tái)獲取的各答案數(shù)據(jù)分別進(jìn)行文本分析,確定各答案數(shù)據(jù)的相似度,包括: 對(duì)從問(wèn)答平臺(tái)獲取的屬于同一預(yù)設(shè)類別的各答案數(shù)據(jù)進(jìn)行文本特征提取,獲取答案數(shù)據(jù)的特征詞匯; 根據(jù)所述特征詞匯計(jì)算各答案數(shù)據(jù)之間的相似度。3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述根據(jù)所述問(wèn)答平臺(tái)記錄的各項(xiàng)問(wèn)題與答案數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系,按照所述相似度分別對(duì)各答案數(shù)據(jù)對(duì)應(yīng)的問(wèn)題進(jìn)行聚類,包括: 根據(jù)所述問(wèn)答平臺(tái)記錄的各項(xiàng)問(wèn)題與答案數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系,分別查找每個(gè)答案數(shù)據(jù)對(duì)應(yīng)的問(wèn)題; 按照所述各答案數(shù)據(jù)之間的相似度,對(duì)預(yù)設(shè)類別內(nèi)的各項(xiàng)問(wèn)題進(jìn)行聚類,獲取所述預(yù)設(shè)類別下聚類得到的各問(wèn)題簇。4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述分別對(duì)每個(gè)問(wèn)題簇中的各項(xiàng)問(wèn)題進(jìn)行文本分析,提取所述問(wèn)題簇中由各問(wèn)題的關(guān)鍵詞所構(gòu)成相關(guān)詞對(duì),包括: 按照預(yù)設(shè)的實(shí)體詞列表對(duì)同一問(wèn)題簇的各項(xiàng)問(wèn)題進(jìn)行文本匹配,提取與所述實(shí)體詞列表匹配的各關(guān)鍵詞構(gòu)成相關(guān)詞對(duì)。5.根據(jù)權(quán)利要求1或4所述的方法,其特征在于,所述提取所述問(wèn)題簇中由各問(wèn)題的關(guān)鍵詞所構(gòu)成的相關(guān)詞對(duì),還包括: 統(tǒng)計(jì)問(wèn)題簇中每個(gè)關(guān)鍵詞在問(wèn)題和/或答案數(shù)據(jù)中出現(xiàn)的頻次; 采用出現(xiàn)的頻次達(dá)到第一閾值的關(guān)鍵詞構(gòu)成相關(guān)詞集合; 記錄各相關(guān)詞集合,以及所述相關(guān)實(shí)體集合內(nèi)每個(gè)關(guān)鍵詞出現(xiàn)的頻次。6.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 從所述相關(guān)詞對(duì)中查找與當(dāng)前瀏覽頁(yè)面中提取的關(guān)鍵詞具有相關(guān)性的相關(guān)詞,并在所述當(dāng)前瀏覽頁(yè)面中推薦所述相關(guān)詞。7.根據(jù)權(quán)利要求6所述的方法,其特征在于,還包括: 提取當(dāng)前瀏覽頁(yè)面中的關(guān)鍵詞,以及所述關(guān)鍵詞在頁(yè)面中的位置權(quán)重; 在相關(guān)詞對(duì)中查找所述當(dāng)前瀏覽頁(yè)面中每個(gè)關(guān)鍵詞所在的相關(guān)詞集合; 將所述相關(guān)詞集合內(nèi)出現(xiàn)的頻次達(dá)到第二閾值的關(guān)鍵詞作為所述關(guān)鍵詞的相關(guān)詞;按照所述關(guān)鍵詞在頁(yè)面中的位置權(quán)重和所述相關(guān)詞出現(xiàn)的頻次對(duì)所述相關(guān)詞進(jìn)行排序,按照排序結(jié)果在所述當(dāng)前瀏覽頁(yè)面中推薦所述相關(guān)詞。8.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述對(duì)從問(wèn)答平臺(tái)獲取的各答案數(shù)據(jù)分別進(jìn)行文本分析之前,還包括: 從問(wèn)答平臺(tái)中獲取問(wèn)題以及問(wèn)題對(duì)應(yīng)的答案數(shù)據(jù); 對(duì)每個(gè)問(wèn)題和對(duì)應(yīng)的答案數(shù)據(jù)的文本進(jìn)行特征提?。? 依據(jù)提取得到的特征對(duì)所述問(wèn)題和答案數(shù)據(jù)進(jìn)行分類,將所述問(wèn)題和答案數(shù)據(jù)分別劃分到既定的預(yù)設(shè)類別中。9.一種基于問(wèn)答平臺(tái)的數(shù)據(jù)處理裝置,其特征在于,包括: 分析模塊,用于對(duì)從問(wèn)答平臺(tái)獲取的各答案數(shù)據(jù)分別進(jìn)行文本分析,確定各答案數(shù)據(jù)的相似度; 聚類模塊,用于根據(jù)所述問(wèn)答平臺(tái)記錄的各項(xiàng)問(wèn)題與答案數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系,按照所述相似度分別對(duì)各答案數(shù)據(jù)對(duì)應(yīng)的問(wèn)題進(jìn)行聚類,得到各問(wèn)題簇; 生成模塊,用于分別對(duì)每個(gè)問(wèn)題簇中的各項(xiàng)問(wèn)題進(jìn)行文本分析,提取所述問(wèn)題簇中由各問(wèn)題的關(guān)鍵詞所構(gòu)成的相關(guān)詞對(duì),其中同一問(wèn)題簇內(nèi)的各關(guān)鍵詞具有相關(guān)性。10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述分析模塊,包括: 特征提取子模塊,用于對(duì)從問(wèn)答平臺(tái)獲取的屬于同一預(yù)設(shè)類別的各答案數(shù)據(jù)進(jìn)行文本特征提取,獲取答案數(shù)據(jù)的特征詞匯; 相似度計(jì)算子模塊,用于根據(jù)所述特征詞匯計(jì)算各答案數(shù)據(jù)之間的相似度。11.根據(jù)權(quán)利要求9或10所述的裝置,其特征在于,所述聚類模塊,包括: 查找子模塊,用于根據(jù)所述問(wèn)答平臺(tái)記錄的各項(xiàng)問(wèn)題與答案數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系,分別查找每個(gè)答案數(shù)據(jù)對(duì)應(yīng)的問(wèn)題; 聚類子模塊,用于按照所述各答案數(shù)據(jù)之間的相似度,對(duì)預(yù)設(shè)類別內(nèi)的各項(xiàng)問(wèn)題進(jìn)行聚類,獲取所述預(yù)設(shè)類別下聚類得到的各問(wèn)題簇。12.根據(jù)權(quán)利要求9所述的裝置,其特征在于: 所述生成模塊,用于按照預(yù)設(shè)的實(shí)體詞列表對(duì)同一問(wèn)題簇的各項(xiàng)問(wèn)題的文本進(jìn)行匹配,提取與所述實(shí)體詞列表匹配的各關(guān)鍵詞構(gòu)成相關(guān)詞對(duì)。13.根據(jù)權(quán)利要求9或12所述的裝置,其特征在于: 所述生成模塊,還用于統(tǒng)計(jì)問(wèn)題簇中每個(gè)關(guān)鍵詞在問(wèn)題和/或答案數(shù)據(jù)中出現(xiàn)的頻次;采用出現(xiàn)的頻次達(dá)到第一閾值的關(guān)鍵詞構(gòu)成相關(guān)詞集合;記錄各相關(guān)詞集合,以及所述相關(guān)詞集合內(nèi)每個(gè)關(guān)鍵詞出現(xiàn)的頻次。14.根據(jù)權(quán)利要求9所述的裝置,其特征在于,還包括: 推薦模塊,用于從所述相關(guān)詞對(duì)中查找與當(dāng)前瀏覽頁(yè)面中提取的關(guān)鍵詞具有相關(guān)性的相關(guān)詞,并在所述當(dāng)前瀏覽頁(yè)面中推薦所述相關(guān)詞。15.根據(jù)權(quán)利要求14所述的裝置,其特征在于,還包括: 提取模塊,用于提取當(dāng)前瀏覽頁(yè)面中的實(shí)體詞,以及所述實(shí)體詞在頁(yè)面中的位置權(quán)重; 所述推薦模塊,用于在相關(guān)詞對(duì)中查找所述當(dāng)前瀏覽頁(yè)面中每個(gè)關(guān)鍵詞所在的相關(guān)詞集合;將所述相關(guān)詞集合內(nèi)出現(xiàn)的頻次達(dá)到第二閾值的關(guān)鍵詞作為所述關(guān)鍵詞的相關(guān)詞;按照所述關(guān)鍵詞在頁(yè)面中的位置權(quán)重和所述相關(guān)詞出現(xiàn)的頻次對(duì)所述相關(guān)詞進(jìn)行排序,按照排序結(jié)果在所述當(dāng)前瀏覽頁(yè)面中推薦所述相關(guān)詞。16.根據(jù)權(quán)利要求9或10所述的裝置,其特征在于,還包括: 預(yù)處理模塊,用于從問(wèn)答平臺(tái)中獲取問(wèn)題以及問(wèn)題對(duì)應(yīng)的答案數(shù)據(jù);對(duì)每個(gè)問(wèn)題和對(duì)應(yīng)的答案數(shù)據(jù)的文本進(jìn)行特征提??;依據(jù)提取得到的特征對(duì)所述問(wèn)題和答案數(shù)據(jù)進(jìn)行分類,將所述問(wèn)題和答案數(shù)據(jù)分別劃分到既定的預(yù)設(shè)類別中。
【專利摘要】本發(fā)明提供一種基于問(wèn)答平臺(tái)的數(shù)據(jù)處理方法和裝置,以解決數(shù)據(jù)挖掘的效率和精度較低的問(wèn)題。所述的方法包括:對(duì)從問(wèn)答平臺(tái)獲取的各答案數(shù)據(jù)分別進(jìn)行文本分析,確定各答案數(shù)據(jù)的相似度;根據(jù)所述問(wèn)答平臺(tái)記錄的各項(xiàng)問(wèn)題與答案數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系,按照所述相似度分別對(duì)各答案數(shù)據(jù)對(duì)應(yīng)的問(wèn)題進(jìn)行聚類,得到各問(wèn)題簇;分別對(duì)每個(gè)問(wèn)題簇中的各項(xiàng)問(wèn)題進(jìn)行文本分析,提取所述問(wèn)題簇中由各問(wèn)題的關(guān)鍵詞所構(gòu)成的相關(guān)詞對(duì),其中,同一問(wèn)題簇內(nèi)的各關(guān)鍵詞具有相關(guān)性。通過(guò)答案數(shù)據(jù)的相似度分析可以消除答案數(shù)據(jù)中的噪聲,同時(shí)減少了對(duì)答案數(shù)據(jù)中不相關(guān)數(shù)據(jù)的處理,有效地量化了問(wèn)題的相似性,既提高了數(shù)據(jù)的處理效率,又提高了數(shù)據(jù)處理的精度。
【IPC分類】G06F17/30
【公開(kāi)號(hào)】CN105005564
【申請(qǐng)?zhí)枴緾N201410156263
【發(fā)明人】劉華生, 張闊, 顧思宇
【申請(qǐng)人】北京搜狗科技發(fā)展有限公司
【公開(kāi)日】2015年10月28日
【申請(qǐng)日】2014年4月17日
當(dāng)前第4頁(yè)1 2 3 4 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
宁陕县| 安化县| 余庆县| 唐山市| 鄂尔多斯市| 洪江市| 庆安县| 景泰县| 琼海市| 探索| 崇仁县| 贺兰县| 额敏县| 拜城县| 平武县| 临武县| 甘南县| 永清县| 广宁县| 垦利县| 西藏| 大关县| 荣成市| 廊坊市| 丹阳市| 应用必备| 永年县| 乐昌市| 修文县| 商都县| 沁水县| 页游| 昌黎县| 察隅县| 房产| 资阳市| 沂南县| 得荣县| 阿荣旗| 珲春市| 纳雍县|