1.一種信息處理方法,其特征在于,包括:
基于預(yù)先設(shè)置的爬取規(guī)則,從互聯(lián)網(wǎng)爬取指定產(chǎn)品的用戶評(píng)述信息;
根據(jù)預(yù)先獲得的信息判斷模型,分別針對(duì)爬取到的各用戶評(píng)述信息,獲取用戶評(píng)述信息對(duì)應(yīng)的評(píng)價(jià)等級(jí)并對(duì)用戶評(píng)論信息標(biāo)注獲取到的評(píng)價(jià)等級(jí);
在信息系統(tǒng)中存儲(chǔ)所述指定產(chǎn)品及其標(biāo)注評(píng)價(jià)等級(jí)的用戶評(píng)價(jià)信息。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括獲取所述爬取規(guī)則的操作;
所述爬取規(guī)則具體為基于用戶對(duì)互聯(lián)網(wǎng)上指定產(chǎn)品的用戶評(píng)述信息進(jìn)行分析后設(shè)定的關(guān)鍵詞設(shè)置的爬取標(biāo)準(zhǔn);所述關(guān)鍵詞包括指定產(chǎn)品的指標(biāo)參數(shù)。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述從互聯(lián)網(wǎng)爬取指定產(chǎn)品的用戶評(píng)述信息包括:
利用網(wǎng)絡(luò)爬蟲(chóng),對(duì)第三方平臺(tái)網(wǎng)站的口碑專欄里的任意一個(gè)或多個(gè)版塊進(jìn)行定向爬取,獲得用戶評(píng)述信息;所述口碑專欄里的版塊包括:車型、空間、動(dòng)力、操控性、舒適度、外觀、內(nèi)飾、性價(jià)比、配置、油耗。
4.根據(jù)權(quán)利要求1至3任意一項(xiàng)所述的方法,其特征在于,還包括:
響應(yīng)于檢測(cè)到新建語(yǔ)料包,對(duì)新建語(yǔ)料包進(jìn)行學(xué)習(xí),形成所述信息判斷模型;所述語(yǔ)料包基于對(duì)各種評(píng)價(jià)等級(jí)的特征的總結(jié)形成,所述特征包括關(guān)鍵詞和/或關(guān)鍵句型;或者
響應(yīng)于檢測(cè)到語(yǔ)料包被更新,對(duì)更新后的語(yǔ)料包進(jìn)行學(xué)習(xí),并對(duì)所述信息判斷模型進(jìn)行更新。
5.根據(jù)權(quán)利要求1至4任意一項(xiàng)所述的方法,其特征在于,所述獲取用戶評(píng)述信息對(duì)應(yīng)的評(píng)價(jià)等級(jí)并對(duì)用戶評(píng)論信息標(biāo)注獲取到的評(píng)價(jià)等級(jí)包括:
獲取用戶評(píng)述信息中各特征對(duì)應(yīng)的評(píng)價(jià)等級(jí),所述特征包括關(guān)鍵詞和/或關(guān)鍵句型;
響應(yīng)于所述用戶評(píng)述信息中包含同時(shí)對(duì)應(yīng)多個(gè)不同評(píng)價(jià)等級(jí)的無(wú)效特征,去除同時(shí)對(duì)應(yīng)多個(gè)不同評(píng)價(jià)等級(jí)的無(wú)效特征;
對(duì)所述用戶評(píng)述信息中特征去除無(wú)效特征后得到的各有效特征分別標(biāo)注相應(yīng)的評(píng)價(jià)等級(jí)。
6.根據(jù)權(quán)利要求1至5任意一項(xiàng)所述的方法,其特征在于,所述將標(biāo)注評(píng)價(jià)等級(jí)的用戶評(píng)價(jià)信息存儲(chǔ)到信息系統(tǒng)中之前,還包括:
根據(jù)分類要素對(duì)用戶評(píng)述信息進(jìn)行分類,獲得用戶評(píng)述信息的類別;所述指定產(chǎn)品為汽車時(shí),所述分類要素包括車型、空間、動(dòng)力、操控性、舒適度、外觀、內(nèi)飾、性價(jià)比、配置與油耗中的任意一種或多種;
所述在信息系統(tǒng)中存儲(chǔ)所述指定產(chǎn)品及其標(biāo)注評(píng)價(jià)等級(jí)的用戶評(píng)價(jià)信息包括:根據(jù)用戶評(píng)述信息的類別,在信息系統(tǒng)中的相應(yīng)位置存儲(chǔ)所述指定產(chǎn)品及其標(biāo)注評(píng)價(jià)等級(jí)的用戶評(píng)價(jià)信息。
7.根據(jù)權(quán)利要求1至6任意一項(xiàng)所述的方法,其特征在于,所述獲取用戶評(píng)述信息對(duì)應(yīng)的評(píng)價(jià)等級(jí)之后,還包括:
判斷是否獲取到用戶評(píng)述信息對(duì)應(yīng)的評(píng)價(jià)等級(jí);
響應(yīng)于獲取到用戶評(píng)述信息對(duì)應(yīng)的評(píng)價(jià)等級(jí),執(zhí)行所述對(duì)用戶評(píng)論信息標(biāo)注獲取到的評(píng)價(jià)等級(jí)的操作;
否則,響應(yīng)于未獲取到用戶評(píng)述信息對(duì)應(yīng)的評(píng)價(jià)等級(jí),輸出未獲取到評(píng)價(jià)等級(jí)的用戶評(píng)述信息,并接收用戶針對(duì)未獲取到評(píng)價(jià)等級(jí)的用戶評(píng)述信息反饋的評(píng)價(jià)等級(jí);對(duì)未獲取到評(píng)價(jià)等級(jí)的用戶評(píng)述信息標(biāo)注用戶反饋的評(píng)價(jià)等級(jí)。
8.根據(jù)權(quán)利要求1至7任意一項(xiàng)所述的方法,其特征在于,基于預(yù)先設(shè)置的爬取周期或用戶輸入的爬取指令,執(zhí)行所述基于預(yù)先設(shè)置的爬取規(guī)則,從互聯(lián)網(wǎng)爬取指定產(chǎn)品的用戶評(píng)述信息的操作。
9.一種信息處理裝置,其特征在于,包括:
獲取單元,用于基于預(yù)先設(shè)置的爬取規(guī)則,從互聯(lián)網(wǎng)爬取指定產(chǎn)品的用 戶評(píng)述信息;
標(biāo)注單元,用于根據(jù)預(yù)先獲得的信息判斷模型,分別針對(duì)爬取到的各用戶評(píng)述信息,獲取用戶評(píng)述信息對(duì)應(yīng)的評(píng)價(jià)等級(jí)并對(duì)用戶評(píng)論信息標(biāo)注獲取到的評(píng)價(jià)等級(jí);
存儲(chǔ)處理單元,用于在信息系統(tǒng)中存儲(chǔ)所述指定產(chǎn)品及其標(biāo)注評(píng)價(jià)等級(jí)的用戶評(píng)價(jià)信息。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,還包括:
第一存儲(chǔ)單元,用于存儲(chǔ)所述爬取規(guī)則;所述爬取規(guī)則具體為基于用戶對(duì)互聯(lián)網(wǎng)上指定產(chǎn)品的用戶評(píng)述信息進(jìn)行分析后設(shè)定的關(guān)鍵詞設(shè)置的爬取標(biāo)準(zhǔn);所述關(guān)鍵詞包括指定產(chǎn)品的指標(biāo)參數(shù)。