專利名稱:一種在購物搜索引擎中融入商品自定義信息的方法
技術領域:
本發(fā)明涉及到購物搜索的電子商務領域,特別是一種利用計算機互聯(lián)網(wǎng),將對搜索結果 評論相關的信息發(fā)布到搜索引擎中,并融入到搜索源中,以提高購物搜索準確度的方法。
背景技術:
隨著近幾年B2C/C2C網(wǎng)上商店、網(wǎng)上購物的快速發(fā)展,網(wǎng)上商品數(shù)量呈高速增長的趨勢, 購物搜索引擎也應運而生。除了網(wǎng)上商店(B2C)、拍賣平臺(如淘寶等C2C)平臺本身提供 的搜索功能外,也出現(xiàn)了大量比較購物的搜索網(wǎng)站。在目前的搜索功能中,人們可以得到基 本的搜索功能,但是所搜索出來的結果并不是很理想。對于目前互聯(lián)網(wǎng)上這些購物搜索,我 們認為至少沒有解決如下問題
首先,僅以關鍵字匹配為基礎,排序結果取決于商品入庫時間或關鍵字相關度。商品的 重要性問題沒有解決,搜索結果的準確度得不到用戶的信任。同時,我們通常相信朋友的推 薦或無利益相關人的推薦,然而這種推薦的模式還僅僅存在于現(xiàn)實生活中,沒有融入到購物 搜索引擎中。
其次,網(wǎng)上商家為了推廣自己的商品,通常會在商品名稱中加入商品屬性及廣告性的內 容,如"諾基亞N70全新原裝精品手機火爆熱賣",真正的商品關鍵詞"諾基亞N70"被淹沒 在廣告描述之中,使得以"諾基亞N70"為關鍵字搜索時的相關度值降低了。其相關度值甚 至不如"諾基亞手機"中的相關度,這就造成了真正需要的商品被排在了后面,搜索結果不 盡如人意。要是"諾基亞N70全新原裝精品手機火爆熱賣"能夠準確地作為"諾基亞N70" 參與搜索,那么其結果顯然是值得期待的。
最后,目前的購物搜索引擎通常僅僅采集網(wǎng)上商家的數(shù)據(jù),而沒有給予商家在搜索引擎 中推廣的機會,給予引擎使用者參與搜索源構建的機會。實際上, 一個互動的搜索引擎將提 高用戶的積極性,同時也可以滿足用戶推薦商品的樂趣。
發(fā)明目的
本發(fā)明的主要目的是希望通過這一方法,實現(xiàn)將"朋友或無利益相關人推薦購物"這一 現(xiàn)實生活中比較成功的購物模式融入到購物搜索引擎中。
其次是通過這一方法實現(xiàn)廣告性商品名稱與一般商品名稱的統(tǒng)一,實現(xiàn)B2C商家與C2C 商家統(tǒng)一平臺的購物搜索,并最終提高購物搜索的準確性,取得良好的用戶體驗。
本發(fā)明的再一目的是提高購物搜索引擎與用戶的良性互動,實現(xiàn)商家、用戶的雙贏效果。
技術方案
商品自定義主要包括定義名稱和注釋內容,其中注釋內容用于保存定義該名稱的理由或 心情故事。商品定義名稱和商品名稱一樣進入搜索源中,但是具體實現(xiàn)時,還應該解決如下 問題
首先,商品自定義不準確的問題。商品自定義為商家或用戶提供了推薦商品的途徑,但 同時,也存在由于利益或好奇定義了與商品亳無關聯(lián)的定義。毫無關聯(lián)的商品定義不會提高 商品搜索的準確性,反而起到噪音的作用。
其次,商品定義的共享問題。"諾基亞6630全新原裝精品手機火爆熱賣"和"諾基亞6630" 同樣都是"諾基亞6630"產(chǎn)品,但不同的商家有不同的寫法。商品自定義顯然不應該僅定義 在特定個體商品上,而應該定義在同種商品上,這樣才能起到真正的目的。
再次,商品自定義與商品名稱的關系問題。商品名稱來源商家數(shù)據(jù)采集是準確的,而商 品自定義來自于用戶自由書寫,其對購物搜索的影響可能是積極的也可能是消極的,需要一 種比較好的策略趨利避害。
本發(fā)明采用"投票、相關度、獎勵"相結合的機制盡可能地消除商品自定義不準確的問 題,采用商品重心詞自動劃分同種商品的方法實現(xiàn)商品定義共享的問題,采用商品定義相關 度調整參數(shù)及重復影響參數(shù)的機制實現(xiàn)商品自定義、商品名稱共同作為搜索源的統(tǒng)一搜索問 題。
本發(fā)明的實現(xiàn)主要包括以下步驟
1 、 在商品數(shù)據(jù)采集時,結合商品、品牌詞庫系統(tǒng)分析出商品重心詞,如果商品重心 詞為規(guī)格型號,則作為同種商品保存。商品名稱中表示商品主要特性的關鍵詞定
義為商品重心詞,如"諾基亞6630"中,"諾基亞6630"是商品重心詞。"諾基亞 6630全新原裝精品手機火爆熱賣"中,"諾基亞6630"是商品重心詞,且為規(guī)格 型號,因此,該2個商品都是"諾基亞6630"的同種商品。
2、 在用戶交互界面中,用戶可以對商品進行自定義,其核心內容是定義名稱和注釋
內容。如果該商品是同種商品,則商品定義作為同種商品的商品定義保存。同時, 商品自定義輸入到商品定義索引系統(tǒng)中。 一個用戶對一種商品僅可定義一次。在 一定支持數(shù)(即起點票)之前,允許自由修改,超過一 定支持數(shù)(即
起點票)后將不允許修改,以保護支持者的利益。
3、 在用戶交互界面、首頁、個人主頁中,商品定義被展示出來,注冊用戶可以不定
義自己的商品定義,而支持某種商品中其他人的定義(即商品定義提交后,商品 定義即進入投票階段)。
4、 關鍵字搜索時,首先啟動商品名稱搜索線程和商品自定義搜索線程,兩個線程同
步按相關度返回搜索結果。其中商品名稱搜索結果中的核心內容是商品ID號。商 品定義搜索結果中的核心內容是商品定義ID號。
5 、 商品定義ID號的返回不是商品自定義搜索的目的,在此,需要轉換為搜索所需的
商品ID號。如果是同種商品,則按一定策略返回有限個數(shù)代表性商品,這個策略 是可以是按商品采集時間或商品自定義關聯(lián)數(shù)多少或隨機選取等。
6、 由于商品自定義是用戶隨意填寫,可能或必然會出現(xiàn)多個同一商品自定義定義到
同一商品個體,因此,需消除重復商品定義,但同時保存重復定義數(shù),該重復定 義數(shù)有助于加強該商品的重要性及相關度。
7、 由于商品自定義存在定義的不準確性,為盡可能地降低這種影響,商品自定義的
相關度需進行調整。該參數(shù)我們設定為0.7 1,最低為0.7,并根據(jù)重復定義數(shù)的 分布情況逐步增加到1,重復商品合并時,取其中最大值代表商品的相關度。商 品自定義的調整參數(shù)是個經(jīng)驗值,在系統(tǒng)運行后,將根據(jù)效果進行調整。我們這 樣做的假設是商品定義存在噪音,可信度相對較低,但如果多個商品自定義都搜 索到這個商品,則定義的準確度是值得信賴的。
8、 商品自定義搜索結果和商品名稱搜索結果進行合并,合并時,沒有重復的商品保
留原有的相關度值,對于重復商品的相關度定義為 重復相關度-商品相關度+0.2X定義相關度
我們認為商品名稱中被搜索到,同時,在商品自定義中也被搜索到,則該商品 是用戶需要的商品的可能性比較高,因此,可提高其相關度(即重要性的權重)。 0.2是個經(jīng)驗值,在系統(tǒng)運行后將根據(jù)效果進行調整。
9、 結果顯示的內容包括商品名稱、商品圖片、商品自定義等。 一個商品可能存在很
多商品自定義,但結果顯示頁面中僅選取三項。這三項是當前搜索到的這個商品 定義、最佳定義、超過一定支持數(shù)的定義。當某商品自定義首次被采用為最佳定
義時,其定義人及支持者將得到不同額度的積分獎勵。最佳定義的形成在下面另 述。
1 0、在結果頁面、首頁、個人主頁中,用戶看到商品自定義可點擊購物,系統(tǒng)對購物
過程進行監(jiān)控,如果用戶成功進行了購物,則商品自定義者及支持者將獲得不同 程度的積分獎勵。
上述為商品自定義的定義、索引、搜索、展示的整個過程。根據(jù)這個過程,有必要進一 步解釋下為解決商品定義不準確性問題的"投票、相關度、獎勵"機制的設計原理及最 佳定義的形成算法。
"投票+相關度+獎勵"機制
為了使商品自定義更好地與實際的商品相對應,我們用多方面的措施使商品自定義盡可 能地回歸商品的語義。
首先是投菓機制,用戶可以自定義商品,同時,也可以支持別人的自定義。這樣最符合 商品屬性的定義會在這種機制下突現(xiàn)出來。 一個用戶對于一種商品僅可支持或定義一次,因 此,這增加了用戶支持或定義的謹慎性。當支持數(shù)比較小時(沒有達到顯示的基本數(shù)),在商 品顯示頁面中不顯示,也不進入最佳定義的候選集。
其次是相關度選擇機制,商品自定義關鍵字搜索時,相關度要乘以商品自定義調整參數(shù), 并同時受到重復定義數(shù)的影響,其中這里的重復定義指定義及支持數(shù)。商品自定義調整參數(shù)
范圍為0.7 1,在商品自定義的結果集中,按重復定義數(shù)的分布取得特定的商品自定義調整 參數(shù)。如當前結果集中最大重復數(shù)為10,當前商品的重復數(shù)為6,則商品定義調整參數(shù)為0. 87。 商品定義調整參數(shù)在結果集中,按重復定義數(shù)線性安排,重復定義數(shù)越多,商品自定義調整 參數(shù)越高,體現(xiàn)了商品自定義準確性的信任程度。
商品自定義搜索結果與商品名稱搜索結果可能存在同一商品,當搜索結果重復時,商品 名稱相關度與商品定義相關度要進行合并,合并公式為-重復相關度=商品相關度+0. 2X定義相關度
商品名稱中被搜索到,同時,在商品定義中也被搜索到,則該商品是用戶需要的商品的 可能性比較高,因此,可提高其相關度,體現(xiàn)了商品自定義準確性對搜索結果的影響。
最后,采用積分獎勵機制鼓勵用戶準確定義商品。在兩種情況下,定義者和支持者可以 得到積分獎勵。 一種是當商品顯示時,如果該定義首次被選取為最佳定義時。另一種是當用 戶通過該商品自定義產(chǎn)生購買行為時。顯然只有準確的商品自定義才有大的可能性出現(xiàn)在這 兩種情況下,因此,積分獎勵機制可在一定程度上避免無效定義的產(chǎn)生。投票機制、相關度選取機制、積分獎勵機制共同作用以達到提高商品定義準確性的目的, 提高商品自定義的可信度,將利益于相關人推薦模式有機地融入搜索引擎中。
最佳定義算法
在上述論述中,已經(jīng)多次提到"首次被選取為最佳定義"、"最佳定義候選集",由此,可 以想像最佳定義并不是一個靜態(tài)概念。最佳定義是在關鍵字搜索結果顯示時的一個動態(tài)概念, 隨著關鍵字不同而有可能不同。最佳定義的算法如下-
1、 根據(jù)商品找到同種商品信息。
2、 根據(jù)計算機系統(tǒng)設定的參數(shù)(該參數(shù)即是基本數(shù)),選出支持數(shù)超過該參數(shù)的最 佳定義候選集,即超過基本數(shù)并得票最高前幾位的,那么這幾位將成為最佳定義候 選集。
3、 如果最佳定義候選集只有1個,則該自定義即為最佳定義。
4 、 如果最佳定義候選集超過N個,則取支持數(shù)排前N個為最佳定義候選集。這里要
說明的是N是個經(jīng)驗值數(shù)值,是可以根據(jù)系統(tǒng)的需要進行調整。
5 、 最佳定義候選集按商品自定義名稱構建內存索引。
6 、按搜索關鍵字進行相關度搜索。
7 、用戶在搜索商品的時候,在最佳定義候選集里選取最大相關度的商品自定義為最
佳定義,否則取支持數(shù)最多的作為最佳定義。
從算法中可知,最佳定義出現(xiàn)在關鍵字搜索結果顯示時,是與關鍵字動態(tài)有關,隨其變 化而變化的,只要支持數(shù)超過系統(tǒng)設定的基本數(shù)時就有可能被選取為最佳定義。同時,最佳 定義與關鍵字變化的結果,使最佳定義符合用戶的搜索場景,以期取得良好的用戶體驗。
系統(tǒng)設定參數(shù)(即基本數(shù))、候選集前N,這兩個參數(shù)都是設定值,是根據(jù)系統(tǒng)運行情況 可能要進行調整。
所述的購物搜索引擎是一個泛指概念,它不僅是指專門搜索商品購物信息的搜索系統(tǒng), 如像一些比較購物搜索系統(tǒng),類似www.shopping.纖:它也包括給商家提供網(wǎng)上交易平臺系 統(tǒng),如C2C (消費者對消費者的電子商務模式),類似www.taobao,com:當然它還包括自己架 設銷售商品的網(wǎng)上商店、網(wǎng)上商城,如B2C (企業(yè)對消費者的電子商務模式),類似 www.dangdang.com。它是指任何以輸入關鍵字或語句,提交后獲得搜索商品信息結果的方式 進行購物行為的計算機網(wǎng)絡系統(tǒng)。
本發(fā)明方法所使用的系統(tǒng)組成如下:商品采集系統(tǒng)、信息存儲系統(tǒng)、用戶交互系統(tǒng)、檢索
系統(tǒng)、排序系統(tǒng)和結果頁面生成系統(tǒng)。這六個系統(tǒng)是按照功能設置的軟件系統(tǒng),可以分別由 六臺服務器通過互聯(lián)網(wǎng)或內部網(wǎng)相連。這些服務器可以是各種品牌和配置的服務器,如采用 IBM、 HP、聯(lián)想、方正等品牌的服務器。相應的操作系統(tǒng)可以是多種選擇,如Windows、 Linux、 Solaris等。各子系統(tǒng)的具體功能如下
*商品采集系統(tǒng)由系統(tǒng)自動抓取或商家提供的接口將商品數(shù)據(jù)采集到數(shù)據(jù)庫。
*信息存儲系統(tǒng)由數(shù)據(jù)庫組成,存放商品信息以及其他信息。
*用戶交互系統(tǒng)將商品展示給用戶,用戶根據(jù)自己的需要點擊、定義相關的商品信息。
商品自定義信息保存到數(shù)據(jù)庫中。
*檢索系統(tǒng)接受搜索用戶提交的關鍵字,并根據(jù)關鍵字給出相應的搜索結果的核心內 容。
*排序系統(tǒng)根據(jù)系統(tǒng)設定的各種規(guī)則對搜索結果進行排序。
*結果頁面生成系統(tǒng)根據(jù)預先設置的網(wǎng)頁格式模板,將搜索結果按照排序系統(tǒng)給出的 順序整合起來,生成最終的結果頁面。
本圖是商品自定義系統(tǒng)流程圖
具體實施例方式
下面結合各個子系統(tǒng),說明本發(fā)明在各個系統(tǒng)中的實施方式。 商品采集系統(tǒng)
商品采集系統(tǒng)通過Http協(xié)議或Webservice技術或其他通訊協(xié)議采集或接收商家的商品 信息,并將商品信息、商家信息保存到數(shù)據(jù)庫中。在取得到商品信息并保存到數(shù)據(jù)庫的過程 中,同時形成同種商品信息。如"諾基亞N70全新原裝精品手機火爆熱賣"的商品重心詞是 "諾基亞N70",是一規(guī)格型號,因此保存為"諾基亞N70"種商品。
信息存儲系統(tǒng)
信息存儲系統(tǒng)由一個后臺數(shù)據(jù)庫組成。這里所述的數(shù)據(jù)庫是一個泛指概念,代表各種格 式的關系型數(shù)據(jù)庫,而不局限于某種特定格式的數(shù)據(jù)庫,可以選用商業(yè)數(shù)據(jù)庫如DB2, Oracle, SQL Server等,也可以選擇免費的數(shù)據(jù)庫如MySQL等。
用戶交互系統(tǒng)
用戶通過交互系統(tǒng),可以對系統(tǒng)所展示的商品進行相關的操作。在用戶交互系統(tǒng)中,用 戶可以自定義商品、閱讀商品自定義.其中進入閱讀商品自定義頁面后,可以對自己認可的 商品自定義進行投票支持。
商品自定義流程如下-
1 、 登錄并搜索相關商品
2 、 在商品信息欄里直接進入商品自定義界面
3 、 填寫定義名稱、注釋內容及其他信息
4、 提交信息,由系統(tǒng)保存商品自定義及相關的其他信息 閱讀商品自定義的流程如下
1 、 系統(tǒng)根據(jù)當前搜索的關鍵字形成最佳定義
2 、 存在最佳定義時,顯示最佳定義;如果沒有最佳定義那么界面總共只會顯示閱讀
全部定義按鈕
3、 可進入全部定義界面,全部自定義界面按最佳定義、其他定義順序顯示
4、 在全部定義界面,要是用戶沒有定義或支持過這種商品的話,可以支持某一定義 注如果在自定義閱讀界面,用戶發(fā)生購買行為的話,出現(xiàn)在商品顯示欄的商品定義人 及支持者將獲得一定的積分獎勵。
檢索系統(tǒng)
檢索系統(tǒng)可以響應搜索用戶的關鍵字搜索請求,系統(tǒng)接受關鍵字后進行檢索。其實現(xiàn)的
方式可以很多,如基于JDBC或ODBC和JSP、 ASP等語言的方式,或其他開發(fā)的軟件來實現(xiàn)。 如基于Lucene的全文索引系統(tǒng)。
檢索系統(tǒng)主要按關鍵字搜索后,將商品定義ID進一步轉換為商品ID作為核心內容返回, 同時,統(tǒng)計商品定義重復情況,根據(jù)重復情況給出相應商品定義相關度調整系數(shù),返回以調 整后的相關度及商品ID為核心的檢索結果。
商品名稱關鍵字搜索結果與商品自定義關鍵字搜索結果合并后,返回最終的檢索結果。
排序系統(tǒng)-
排序系統(tǒng)進一步地取得商品價格、熱門度等核心信息,根據(jù)用戶偏好、關鍵字分析等選 用不同的排序策略,返回最終的排序結果信息。 結果頁面生成系統(tǒng)
該系統(tǒng)是一個自動的網(wǎng)頁生成程序,它根據(jù)預先設置的網(wǎng)頁格式模板,將搜索結果內容 按排序系統(tǒng)所給出的瓶序整合起來,生成最終的結果頁面。
權利要求
1. 一種在購物搜索引擎中,通過用戶自定義商品信息并將此信息融入到購物搜索源中,并使該定義信息作為一個搜索因素的方法,該方法通過計算機互聯(lián)網(wǎng),利用設置在服務器上的軟件系統(tǒng)而實現(xiàn)。同時該方法還通過“投票、相關度、獎勵”機制讓用戶選擇出最佳定義,從而做到將“朋友或無利益相關人推薦購物”模式融入到購物搜索引擎中,同時也提高了該搜索引擎的搜索商品的準確率和互動性。其主要要點如下1)商品自定義的核心內容包括定義名稱、注釋內容等,且定義對象是同種商品。2)商品自定義信息輸入并保存于購物搜索引擎數(shù)據(jù)源中,檢索系統(tǒng)根據(jù)關鍵字匹配算法在定義名稱中搜索出相關度較高的商品定義集,然后根據(jù)商品定義取得同種商品的代表商品集,并根據(jù)定義重復數(shù)分布情況給出商品定義相關度調整系數(shù),形成商品定義相關度;之后,商品定義搜索結果與商品名稱搜索結果進行合并,合并時商品自定義相關度按一定比例融合到綜合相關度中,再結合價格、熱門度給出最終排序結果,并由結果頁面生成系統(tǒng)生成界面。3)采用“投票+相關度+獎勵”機制產(chǎn)生“最佳定義候選集”的方法。商品自定義完成后,自定義內容將進入投票支持階段。在一定支持數(shù)之前(低于起點票)其定義內容允許修改;否則僅可補充注釋,不能修改定義內容。同時,當商品自定義達到系統(tǒng)設置好的支持基本數(shù)時,那么系統(tǒng)將取自定義前N個自定義內容為最佳定義候選集;如果最佳候選集只有一個商品自定義時,那么該自定義內容就是最佳定義。這里要說明的是N是個經(jīng)驗值數(shù)值,是可以根據(jù)系統(tǒng)的需要進行調整。4)最佳定義是具有動態(tài)特性的。其根據(jù)用戶提交的關鍵字不同而可能不同。最佳定義首先必須是“最佳定義候選集”中的一個定義,然后通過用戶提交的關鍵字,該關鍵字將在“最佳定義候選集”中選擇與其相關度最大的某一自定義作為該搜索時的最佳定義,并顯示在商品搜索頁的商品信息里。5)商品自定義將會自動改變用戶在搜索過程中商品的相關度。采用根據(jù)商品自定義重復數(shù)分布情況給出的相關度調整系數(shù),形成商品自定義相關度,并將該相關度系數(shù)值按一定比例合并到綜合相關度中,從而調整了商品的搜索情況。
2、 按照權利要求1所述的方法,其特征在于,購物搜索引擎是指任何以輸入關鍵字或 語句,提交后獲得商品信息結果的并以此進行購物行為的計算機網(wǎng)絡系統(tǒng),包括比較購物搜 索系統(tǒng)、消費者對消費者的電子購物系統(tǒng)(C2C)、企業(yè)對消費者的電子購物系統(tǒng)(B2C)。
3、 按照權利要求1所述的方法,其特征在于,搜索引擎選擇的商品信息的范圍是互聯(lián) 網(wǎng)上能夠實現(xiàn)商品購物的所有電子商務網(wǎng)站的商品信息,包括B2C (商家對消費者模式,自 己設立專門的網(wǎng)站作為銷售平臺的)和C2C (消費者對消費者模式,利用其他網(wǎng)站提供的平臺來銷售自己的商品的)的這2種商業(yè)類型。
4、 按照權利要求l所述方法,其特征在于,商品自定義的書寫者是指使用互聯(lián)網(wǎng)的所有人,不限于所有消費者,也包括所有網(wǎng)店的店主。
5、 按照權利要求l所述方法,其特征在于,最佳定義產(chǎn)生的機制是通過社會大眾的力量和智慧選擇(即用戶參與方式)來實現(xiàn),而非人工主動編輯。
6、 按照權利要求1所述方法,其特征在于,商品名稱相關度與商品定義相關度要進行合并,合并公式為重復相關度=商品相關度+0.2X定義相關度,其中0.2是個經(jīng)驗值,在系統(tǒng)運行后將根據(jù)效果是可以調整的。
7、 按照權利要求l所述方法,其特征在于,商品自定義重復數(shù)分布情況給出的相關度調整系數(shù),其中重復數(shù)是指重復定義數(shù)及支持數(shù)的情況分析數(shù)目,而商品自定義調整參數(shù)是系統(tǒng)設定的某一參數(shù)范圍,不是某一特定具體數(shù),且其是一個經(jīng)驗值,是可以根據(jù)系統(tǒng)需要進行調整的。
全文摘要
本發(fā)明是一種在購物搜索引擎中,通過用戶自定義商品信息并將該定義信息融入到購物搜索源中,從而影響購物搜索結果排序的方法,該方法通過計算機互聯(lián)網(wǎng),利用設置在服務器上的軟件系統(tǒng)而實現(xiàn)。它是按照用戶對自己感興趣的商品進行自定義,并將信息融入到購物搜索源中,通過對商品自定義采取“投票+相關度+獎勵”機制,讓大眾篩選有用信息(使無用信息得到規(guī)避),使之提高有用商品自定義的相關度,從而提高搜索商品結果的人性化效果,使“朋友或無利益相關人推薦購物”的模式巧妙地融入到購物搜索中,同時在購物搜索引擎中也為用戶提供了良好互動,增強商品搜索結果的準確性和可信度。
文檔編號G06Q30/00GK101206744SQ20061015536
公開日2008年6月25日 申請日期2006年12月21日 優(yōu)先權日2006年12月21日
發(fā)明者克 葉, 柴日發(fā) 申請人:葉 克;柴日發(fā)