輸出對象的數(shù)據(jù)處理方法及裝置的制造方法
【專利說明】輸出對象的數(shù)據(jù)處理方法及裝置 【技術(shù)領域】
[0001] 本發(fā)明設及數(shù)據(jù)處理技術(shù),尤其設及一種輸出對象的數(shù)據(jù)處理方法及裝置。 【【背景技術(shù)】】
[0002] 隨著互聯(lián)網(wǎng)的不斷發(fā)展,不同行業(yè)的用戶所面臨的數(shù)據(jù)量越來越大,從該些海量 數(shù)據(jù)中找到他們所關(guān)屯、的內(nèi)容即輸出對象,并且可視化是一個很大的挑戰(zhàn)。例如,廣告商可 W通過選擇不同的推廣產(chǎn)品,來向公眾提供推廣服務,其需要知道推廣產(chǎn)品與其他推廣產(chǎn) 品之間的關(guān)系,或者推廣產(chǎn)品與媒體屬性、人口屬性和地域?qū)傩灾g的關(guān)系,等等,并且還 需要將該些多維度關(guān)系展現(xiàn)在一個如二維平面空間等較低維度空間上。在展現(xiàn)的過程中, 可W將兩兩輸出對象的特征屬性的交集與該兩兩輸出對象的特征屬性的并集的比值,作為 該兩兩輸出對象的相似度。
[0003] 然而,由于兩兩輸出對象的特征屬性的交集與該兩兩輸出對象的特征屬性的并集 的比值只能夠表示兩兩輸出對象之間的單向關(guān)系,使得所獲得的兩兩輸出對象的相似度并 不是兩兩輸出對象真正的相似度,從而導致了輸出對象可視化的可靠性的降低。 【
【發(fā)明內(nèi)容】
】
[0004] 本發(fā)明的多個方面提供一種輸出對象的數(shù)據(jù)處理方法及裝置,用W提高輸出對象 可視化的可靠性。
[0005] 本發(fā)明的一方面,提供一種輸出對象的數(shù)據(jù)處理方法,包括:
[0006] 獲取至少兩個輸出對象中每個輸出對象的特征屬性;
[0007] 根據(jù)所述每個輸出對象的特征屬性,獲得兩兩輸出對象的特征屬性的交集;
[000引根據(jù)所述每個輸出對象的特征屬性和所述兩兩輸出對象的特征屬性的交集,獲得 相似度矩陣;
[0009] 根據(jù)所述相似度矩陣,對所述每個輸出對象進行可視化輸出。
[0010] 如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述輸出對 象的特征屬性包括:
[0011] 輸出對象所屬捜索關(guān)鍵詞所對應的人數(shù)。
[0012] 如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述根據(jù)所 述每個輸出對象的特征屬性和所述兩兩輸出對象的特征屬性的交集,獲得相似度矩陣,包 括:
[0013] 根據(jù)兩兩輸出對象的特征屬性的交集的平方與該兩兩輸出對象的特征屬性的乘 積的比值,獲得該兩兩輸出對象的相似度;
[0014] 根據(jù)該兩兩輸出對象的相似度,獲得所述相似度矩陣。
[0015] 如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述根據(jù)所 述相似度矩陣,對所述每個輸出對象進行可視化輸出,包括:
[0016] 對所述相似度矩陣進行SVD處理,W獲得分解矩陣;
[0017] 根據(jù)所述分解矩陣,獲得所述每個輸出對象的輸出位置;
[0018] 根據(jù)所述每個輸出對象的輸出位置,輸出所述每個輸出對象。
[0019] 如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述根據(jù)所 述相似度矩陣,對所述每個輸出對象進行可視化輸出,包括:
[0020] 根據(jù)所述相似度矩陣,計算兩兩輸出對象的理論距離;
[002U 根據(jù)預先設置的至少一個特定種子,利用隨機函數(shù),獲得所述每個輸出對象的至 少一個隨機位置;
[0022] 分別W所述每個輸出對象的至少一個隨機位置中每個隨機位置為該輸出對象的 初始位置,根據(jù)所述兩兩輸出對象的理論距離,進行迭代處理,W獲得所述每個輸出對象的 迭代位置;
[0023] 根據(jù)所述每個輸出對象的迭代位置,獲得所述每個輸出對象的輸出位置;
[0024] 根據(jù)所述每個輸出對象的輸出位置,輸出所述每個輸出對象。
[0025] 如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述根據(jù)所 述相似度矩陣,計算兩兩輸出對象的距離,包括:
[0026] 將1與兩兩輸出對象的相似度的比值,作為該兩兩輸出對象的距離;或者
[0027] 若兩兩輸出對象的相似度不為0,將1與該兩兩輸出對象的相似度的比值的N次 方,作為該兩兩輸出對象的距離;若兩兩輸出對象的相似度為0,將1與最小的兩兩輸出對 象的相似度的比值的N次方,作為該兩兩輸出對象的距離;N為大于0且小于1的數(shù)。
[002引如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,N為0. 5。
[0029] 如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述根據(jù)所 述相似度矩陣,對所述每個輸出對象進行可視化輸出,包括:
[0030] 根據(jù)所述相似度矩陣,在二維平面空間或=維立體空間上,對所述每個輸出對象 進行可視化輸出。
[0031] 本發(fā)明的另一方面,提供一種輸出對象的數(shù)據(jù)處理裝置,包括:
[0032] 獲取單元,用于獲取至少兩個輸出對象中每個輸出對象的特征屬性;
[0033] 分析單元,用于根據(jù)所述每個輸出對象的特征屬性,獲得兩兩輸出對象的特征屬 性的交集;
[0034] 所述分析單元,還用于根據(jù)所述每個輸出對象的特征屬性和所述兩兩輸出對象的 特征屬性的交集,獲得相似度矩陣;
[0035] 輸出單元,用于根據(jù)所述相似度矩陣,對所述每個輸出對象進行可視化輸出。
[0036] 如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述輸出對 象的特征屬性包括:
[0037] 輸出對象所屬捜索關(guān)鍵詞所對應的人數(shù)。
[003引如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述分析單 元,具體用于
[0039] 根據(jù)兩兩輸出對象的特征屬性的交集的平方與該兩兩輸出對象的特征屬性的乘 積的比值,獲得該兩兩輸出對象的相似度;W及
[0040] 根據(jù)該兩兩輸出對象的相似度,獲得所述相似度矩陣。
[0041] 如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述輸出單 元,具體用于
[0042] 對所述相似度矩陣進行SVD處理,W獲得分解矩陣;
[0043] 根據(jù)所述分解矩陣,獲得所述每個輸出對象的輸出位置;W及
[0044] 根據(jù)所述每個輸出對象的輸出位置,輸出所述每個輸出對象。
[0045] 如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述輸出單 元,具體用于
[0046] 根據(jù)所述相似度矩陣,計算兩兩輸出對象的理論距離;
[0047] 根據(jù)預先設置的至少一個特定種子,利用隨機函數(shù),獲得所述每個輸出對象的至 少一個隨機位置;
[0048] 分別W所述每個輸出對象的至少一個隨機位置中每個隨機位置為該輸出對象的 初始位置,根據(jù)所述兩兩輸出對象的理論距離,進行迭代處理,W獲得所述每個輸出對象的 迭代位置;
[0049] 根據(jù)所述每個輸出對象的迭代位置,獲得所述每個輸出對象的輸出位置;W及
[0050] 根據(jù)所述每個輸出對象的輸出位置,輸出所述每個輸出對象。
[0化1] 如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述輸出單 元,具體用于
[005引將1與兩兩輸出對象的相似度的比值,作為該兩兩輸出對象的距離;或者 [0053] 若兩兩輸出對象的相似度不為0,將1與該兩兩輸出對象的相似度的比值的N次 方,作為該兩兩輸出對象的距離;若兩兩輸出對象的相似度為0,將1與最小的兩兩輸出對 象的相似度的比值的N次方,作為該兩兩輸出對象的距離;N為大于0且小于1的數(shù)。
[0化4] 如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,N為0. 5。
[0055] 如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述輸出單 元,具體用于
[0化6] 根據(jù)所述相似度矩陣,在二維平面空間或=維立體空間上,對所述每個輸出對象 進行可視化輸出。
[0057] 由上述技術(shù)方案可知,本發(fā)明實施例通過獲取至少兩個輸出對象中每個輸出對象 的特征屬性,進而根據(jù)所述每個輸出對象的特征屬性,獲得兩兩輸出對象的特征屬性的交 集,W及根據(jù)所述每個輸出對象的特征屬性和所述兩兩輸出對象的特征屬性的交集,獲得 相似度矩陣,使得能夠根據(jù)所述相似度矩陣,對所述每個輸出對象進行可視化輸出,由于根 據(jù)每個輸出對象的特征屬性和兩兩輸出對象的特征屬性的交集所獲得的相似度矩陣,能夠 表示兩兩輸出對象之間的雙向關(guān)系,使得