檢測(cè)網(wǎng)站上注冊(cè)的姓名合理性的方法和裝置的制造方法
【專利摘要】本申請(qǐng)?zhí)岢鲆环N檢測(cè)網(wǎng)站上注冊(cè)的姓名合理性的方法和裝置,該檢測(cè)網(wǎng)站上注冊(cè)的姓名合理性的方法包括接收待檢測(cè)的姓名;根據(jù)預(yù)先建立的姓名庫中字符的概率信息,獲取所述待檢測(cè)的姓名對(duì)應(yīng)的參數(shù)值;根據(jù)所述參數(shù)值,確定所述待檢測(cè)的姓名的合理性。該方法能夠確定出網(wǎng)絡(luò)上注冊(cè)的姓名合理性,從而降低惡意注冊(cè)。
【專利說明】
檢測(cè)網(wǎng)站上注冊(cè)的姓名合理性的方法和裝置
技術(shù)領(lǐng)域
[0001] 本申請(qǐng)?jiān)O(shè)及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其設(shè)及一種檢測(cè)網(wǎng)站上注冊(cè)的姓名合理性的方 法和裝置。
【背景技術(shù)】
[0002] 用戶在網(wǎng)站注冊(cè)時(shí)需要提交真實(shí)姓名,一些惡意用戶往往使用鍵盤上隨機(jī)輸入的 字符串作為注冊(cè)用的姓或者名,例如使用"fajfkajdf"作為注冊(cè)用的姓或者名,很明顯運(yùn)一 串字符串不符合任何一種語言的姓或者名的規(guī)則。
[0003] 為了避免用戶惡意注冊(cè),需要檢測(cè)網(wǎng)站注冊(cè)的姓名的合理性。
【發(fā)明內(nèi)容】
[0004] 本申請(qǐng)旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。 陽〇化]為此,本申請(qǐng)的一個(gè)目的在于提出一種檢測(cè)網(wǎng)站上注冊(cè)的姓名合理性的方法,該 方法可W確定出網(wǎng)絡(luò)上注冊(cè)的姓名合理性,從而降低惡意注冊(cè)。
[0006] 本申請(qǐng)的另一個(gè)目的在于提出一種檢測(cè)網(wǎng)站上注冊(cè)的姓名合理性的裝置。
[0007] 為達(dá)到上述目的,本申請(qǐng)第一方面實(shí)施例提出的檢測(cè)網(wǎng)站上注冊(cè)的姓名合理性的 方法,包括:接收待檢測(cè)的姓名;根據(jù)預(yù)先建立的姓名庫中字符的概率信息,獲取所述待檢 測(cè)的姓名對(duì)應(yīng)的參數(shù)值;根據(jù)所述參數(shù)值,確定所述待檢測(cè)的姓名的合理性。
[0008] 本申請(qǐng)第一方面實(shí)施例提出的檢測(cè)網(wǎng)站上注冊(cè)的姓名合理性的方法,通過根據(jù)姓 名庫中字符的概率信息,獲取待檢測(cè)的姓名的參數(shù)值,根據(jù)參數(shù)值確定待檢測(cè)的姓名的合 理性,可W確定出網(wǎng)絡(luò)上注冊(cè)的姓名合理性,從而降低惡意注冊(cè)。
[0009] 為達(dá)到上述目的,本申請(qǐng)第二方面實(shí)施例提出的檢測(cè)網(wǎng)站上注冊(cè)的姓名合理性的 裝置,包括:接收模塊,用于接收待檢測(cè)的姓名;獲取模塊,用于根據(jù)預(yù)先建立的姓名庫中 字符的概率信息,獲取所述待檢測(cè)的姓名對(duì)應(yīng)的參數(shù)值;確定模塊,用于根據(jù)所述參數(shù)值, 確定所述待檢測(cè)的姓名的合理性。
[0010] 本申請(qǐng)第二方面實(shí)施例提出的檢測(cè)網(wǎng)站上注冊(cè)的姓名合理性的裝置,通過根據(jù)姓 名庫中字符的概率信息,獲取待檢測(cè)的姓名的參數(shù)值,根據(jù)參數(shù)值確定待檢測(cè)的姓名的合 理性,可W確定出網(wǎng)絡(luò)上注冊(cè)的姓名合理性,從而降低惡意注冊(cè)。
[0011] 本申請(qǐng)附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本申請(qǐng)的實(shí)踐了解到。
【附圖說明】
[0012] 本申請(qǐng)上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對(duì)實(shí)施例的描述中將變 得明顯和容易理解,其中:
[0013] 圖1是本申請(qǐng)一實(shí)施例提出的檢測(cè)網(wǎng)站上注冊(cè)的姓名合理性的方法的流程示意 圖;
[0014] 圖2是本申請(qǐng)另一實(shí)施例提出的檢測(cè)網(wǎng)站上注冊(cè)的姓名合理性的方法的流程示 意圖;
[0015] 圖3是本申請(qǐng)另一實(shí)施例提出的檢測(cè)網(wǎng)站上注冊(cè)的姓名合理性的裝置的結(jié)構(gòu)示 意圖;
[0016] 圖4是本申請(qǐng)另一實(shí)施例提出的檢測(cè)網(wǎng)站上注冊(cè)的姓名合理性的裝置的結(jié)構(gòu)示 意圖。
【具體實(shí)施方式】
[0017] 下面詳細(xì)描述本申請(qǐng)的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終 相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考 附圖描述的實(shí)施例是示例性的,僅用于解釋本申請(qǐng),而不能理解為對(duì)本申請(qǐng)的限制。相反, 本申請(qǐng)的實(shí)施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同 物。
[0018] 圖1是本申請(qǐng)一實(shí)施例提出的檢測(cè)網(wǎng)站上注冊(cè)的姓名合理性的方法的流程示意 圖,該方法包括:
[0019] S11 :接收待檢測(cè)的姓名;
[0020] 例如,接收用戶通過鍵盤或者觸摸屏輸入的待檢測(cè)的姓名。
[0021] 待檢測(cè)的姓名可W包括一個(gè)或多個(gè)字符串。 陽0巧待檢測(cè)的姓名例如為"as壯化1化"。
[002引S12 :根據(jù)預(yù)先建立的姓名庫中字符的概率信息,獲取所述待檢測(cè)的姓名對(duì)應(yīng)的參 數(shù)值。
[0024] 其中,可W預(yù)先建立姓名庫,姓名庫可W是包括多種語種的姓名庫,例如,包括中 文,英文等語種的混合姓名庫?;蛘撸部蒞對(duì)應(yīng)每個(gè)待檢測(cè)的姓名,獲取與待檢測(cè)的姓名 具有相同語種的姓名庫,例如,待檢測(cè)的姓名是英文的,則可W獲取英文的姓名庫。具體的, 可W根據(jù)待檢測(cè)的姓名中字符是英文或者中文等確定相應(yīng)的語種。
[0025] 可選的,所述參數(shù)值是歸一化后的值,所述根據(jù)預(yù)先建立的姓名庫中字符的概率 信息,獲取所述待檢測(cè)的姓名對(duì)應(yīng)的參數(shù)值,包括:
[00%] 根據(jù)所述概率信息,計(jì)算所述待檢測(cè)的姓名被所述姓名庫生成所需的次數(shù)值;
[0027] 根據(jù)所述概率信息,計(jì)算所述待檢測(cè)的姓名被所述姓名庫生成對(duì)應(yīng)的總的數(shù)學(xué)期 望和總的標(biāo)準(zhǔn)差;
[0028] 根據(jù)所述次數(shù)值,所述總的數(shù)學(xué)期望和所述總的標(biāo)準(zhǔn)差,計(jì)算所述參數(shù)值。
[0029] 其中,所述概率信息包括:所述姓名庫中每個(gè)首字符對(duì)應(yīng)的首字符生成概率,W 及,所述姓名庫中姓名的相鄰的兩個(gè)字符間的轉(zhuǎn)移概率。
[0030] 例如,姓名庫中的所有首字符生成概率可W組成一個(gè)行向量,W英文字符為例,行 向量包括a對(duì)應(yīng)的首字符生成概率,b對(duì)應(yīng)的首字符生成概率,C對(duì)應(yīng)的首字符生成概率等。
[0031] 姓名庫中的所有轉(zhuǎn)移概率可W組成一個(gè)26x26的矩陣,其中,每行和每列分別對(duì) 應(yīng)一個(gè)字符,第i行第j列的元素表示從第i行的字符轉(zhuǎn)移到第j的字符的轉(zhuǎn)移概率,例如, 第1行第1列的元素表示從a轉(zhuǎn)移到a的轉(zhuǎn)移概率,第1行第2列的元素表示從a轉(zhuǎn)移到 b的轉(zhuǎn)移概率,第1行第3列的元素表示從a轉(zhuǎn)移到C的轉(zhuǎn)移概率,第2行第1列的元素表 示從b轉(zhuǎn)移到a的轉(zhuǎn)移概率等。
[0032] 在得到首字符生成概率組成的行向量,W及,轉(zhuǎn)移概率組成的轉(zhuǎn)移概率矩陣后,可 W按照從大到小的順序?qū)γ總€(gè)概率進(jìn)行排序。例如,按照從大到小的順序?qū)κ鬃址筛?率進(jìn)行排序,W及,對(duì)應(yīng)轉(zhuǎn)移概率矩陣的每一行,對(duì)該每行中的轉(zhuǎn)移概率按照從大到小的順 序排序。
[0033] 在排序后,可W確定待檢測(cè)的姓名中的首字符生成概率的排序位數(shù),W及,待檢測(cè) 的姓名中兩兩相鄰字符的轉(zhuǎn)移概率的排序位數(shù),對(duì)每個(gè)排序位數(shù)進(jìn)行相加可W得到次數(shù) 值。
[0034] 另外,對(duì)應(yīng)首字符生成概率組成的行向量,W及轉(zhuǎn)移概率矩陣的每一行的行向量 可W得到數(shù)學(xué)期望和標(biāo)準(zhǔn)差,對(duì)每個(gè)數(shù)學(xué)期望和標(biāo)準(zhǔn)差分別相加,得到總的數(shù)學(xué)期望和標(biāo) 準(zhǔn)差。
[0035] 在得到次數(shù)值,總的數(shù)學(xué)期望和總的標(biāo)準(zhǔn)差后,進(jìn)行歸一化后,得到參數(shù)值。
[0036] 具體的計(jì)算流程可W參見后續(xù)實(shí)施例。
[0037] S13 :根據(jù)所述參數(shù)值,確定所述待檢測(cè)的姓名的合理性。
[0038] 例如,當(dāng)該參數(shù)值小于預(yù)設(shè)值時(shí),確定待檢測(cè)的姓名是合理的,否則不合理。
[0039] 本實(shí)施例中,通過根據(jù)姓名庫中字符的概率信息,獲取待檢測(cè)的姓名的參數(shù)值,根 據(jù)參數(shù)值確定待檢測(cè)的姓名的合理性,可W確定出網(wǎng)絡(luò)上注冊(cè)的姓名合理性,從而降低惡 意注冊(cè)。
[0040] 圖2是本申請(qǐng)另一實(shí)施例提出的檢測(cè)網(wǎng)站上注冊(cè)的姓名合理性的方法的流程示 意圖,本實(shí)施例W英文姓名庫為例,該方法包括:
[0041] S21 :生成姓名庫中每個(gè)首字符對(duì)應(yīng)的首字符生成概率,W及,所述姓名庫中姓名 的相鄰的兩個(gè)字符間的轉(zhuǎn)移概率。
[0042] 其中,可W將已有的姓名作為學(xué)習(xí)樣本,生成首字符生成概率W及轉(zhuǎn)移概率。
[0043] 首字符生成概率是26個(gè)字符分別作為姓名庫字符串首字符的概率,轉(zhuǎn)移概率就 是運(yùn)些姓名字符串中從前一個(gè)字符(26個(gè)字符中的一個(gè))轉(zhuǎn)移到下一個(gè)字符(26個(gè)字符中 的一個(gè))的概率。
[0044] 例如,英文姓名庫中有化hnson,White, Black……,則字符"j"作為首字符出現(xiàn)了 1次,"W"作為首字符出現(xiàn)了 1次,"b"作為首字符出現(xiàn)了 1次,依此類推,可W得到每個(gè)字 符作為首字符的出現(xiàn)次數(shù),再用該次數(shù)除W姓名的總數(shù),得到該字符的首字符生成概率,例 如,"r在姓名庫中作為首字符出現(xiàn)了 m詞,姓名庫中的姓名的總數(shù)是n,則"r對(duì)應(yīng)的首字 符生成概率是m/n。 W45] 又例如,字符"j"到"ο"轉(zhuǎn)移了 1次,"ο"到"h"轉(zhuǎn)移了 1次,"h"到"η"轉(zhuǎn)移了 1次,依此類推,可W得到每個(gè)字符轉(zhuǎn)移到下一個(gè)的次數(shù),再用該次數(shù)除W姓名的總數(shù),得到 該兩個(gè)字符之間的轉(zhuǎn)移概率,例如,字符"j"至?Γο"轉(zhuǎn)移了 X次,姓名庫中的姓名的總數(shù)是 η,則字符"j "到" 0"的轉(zhuǎn)移概率是χ/η。
[0046] 首字符生成概率可W組成一個(gè)1x26的行向量,分別表示"a"~"Ζ"中的每一個(gè)字 符對(duì)應(yīng)的首字符生成概率。
[0047] 轉(zhuǎn)移概率矩陣是26x26的矩陣,每一行代表"a"~"Z"中的一個(gè)字符,每一列代表 "a"~"Z"中的一個(gè)字符,每一列代表前一個(gè)字符是此行對(duì)應(yīng)的字符,下一個(gè)字符是此列對(duì) 應(yīng)的字符的概率。
[0048] S22 :從所述概率信息中,獲取第一首字符生成概率,W及第一轉(zhuǎn)移概率,確定所 述第一首字符生成概率在所述姓名庫中所有的首字符生成概率中的排序位數(shù),W及,所述 第一轉(zhuǎn)移概率在所述轉(zhuǎn)移概率矩陣中對(duì)應(yīng)行的所有的轉(zhuǎn)移概率中的排序位數(shù),并根據(jù)所述 排序位數(shù)計(jì)算所述次數(shù)值,所述第一首字符生成概率是所述待檢測(cè)的姓名中首字符對(duì)應(yīng)的 首字符生成概率,所述第一轉(zhuǎn)移概率包括所述待檢測(cè)的姓名中相鄰的兩個(gè)字符間的轉(zhuǎn)移概 率。
[0049] 例如,待檢測(cè)的姓名是"as壯jkl化",次數(shù)值可W采用如下規(guī)則生成:
[0050] 對(duì)上一步得到的所有的首字符生成概率按照從大到小的順序進(jìn)行排序,并找到 "as壯化Idk"中首字符"a"的首字符生成概率在排序后的位數(shù),例如"a"的首字符生成概率 從大到小排序排在第5位,則第一個(gè)數(shù)值取5。
[0051] 對(duì)上一步中獲得的轉(zhuǎn)移概率矩陣的每一行的元素按照從大到小排序,找到首字符 "曰"到下一個(gè)字符"S"的轉(zhuǎn)移概率在排序后的位置,例如是第23化則第二個(gè)數(shù)值為23。重 復(fù)此計(jì)算,得出"S"到"d","d"到"f"……分別對(duì)應(yīng)的排序位數(shù),例如分別是22,21,25, 19,20,24,22。
[0052] 再將運(yùn)些值求和,得到181。
[0053] S23:對(duì)所述姓名庫中所有的首字符生成概率進(jìn)行排序,根據(jù)每個(gè)首字符生成概率 W及對(duì)應(yīng)的排序位數(shù),計(jì)算得到第一數(shù)學(xué)期望和第一標(biāo)準(zhǔn)差。
[0054] 第一數(shù)學(xué)期望和第一標(biāo)準(zhǔn)差可W采用如下規(guī)則生成: 陽化5] 對(duì)首字符生成概率按照從大到小的順序排序,第一數(shù)學(xué)期望是每一個(gè)首字符生成 概率與此概率在排序后的位數(shù)的乘積的和,例如首字符生成概率按照從大到小的順序排序 為: 陽化6] 'V':0.07
[0057] "t" :0.06
[0058] 'V':0.04
[0059] ......
[0060] 'V':0.002
[0061] 則第一數(shù)學(xué)期望是 0. 07*1+0. 06*化0. 04*3+···+0. 002巧6 = 11. 37 ;
[0062] 第一標(biāo)準(zhǔn)差是:
[0063]
[0064] S24:對(duì)所述第一轉(zhuǎn)移概率在所述轉(zhuǎn)移概率矩陣的對(duì)應(yīng)行的所有的轉(zhuǎn)移概率進(jìn)行 排序,根據(jù)所述第一轉(zhuǎn)移概率的對(duì)應(yīng)行的每個(gè)轉(zhuǎn)移概率W及對(duì)應(yīng)的排序位數(shù),計(jì)算得到第 二數(shù)學(xué)期望和第二標(biāo)準(zhǔn)差。
[0065] 可選的,可W計(jì)算轉(zhuǎn)移概率矩陣中每一行向量對(duì)應(yīng)的數(shù)學(xué)期望和標(biāo)準(zhǔn)差,再從中 獲取待檢測(cè)的姓名的字符間轉(zhuǎn)移對(duì)應(yīng)的數(shù)學(xué)期望和標(biāo)準(zhǔn)差,作為第二數(shù)學(xué)期望和第二標(biāo)準(zhǔn) 差,或者,只計(jì)算待檢測(cè)的姓名的字符間轉(zhuǎn)移對(duì)應(yīng)的數(shù)學(xué)期望和標(biāo)準(zhǔn)差。
[0066] 例如,在轉(zhuǎn)移概率矩陣中,對(duì)應(yīng)第一行,可W得到字符"a"轉(zhuǎn)移出去的數(shù)學(xué)期望和 標(biāo)準(zhǔn)差,對(duì)應(yīng)第二行,可W得到字符"b"轉(zhuǎn)移出去的數(shù)學(xué)期望和標(biāo)準(zhǔn)差,對(duì)應(yīng)第立行,可W得 到字符"C"轉(zhuǎn)移出去的數(shù)學(xué)期望和標(biāo)準(zhǔn)差,依次類推,可W得到26個(gè)字符轉(zhuǎn)移出去的數(shù)學(xué) 期望和標(biāo)準(zhǔn)差,其中,每一行向量計(jì)算數(shù)學(xué)期望和標(biāo)準(zhǔn)差的方式可W如計(jì)算第一數(shù)學(xué)期望 和第一標(biāo)準(zhǔn)差的方式。
[0067] 再從中找到"a"轉(zhuǎn)移出去的數(shù)學(xué)期望和標(biāo)準(zhǔn)差,"S"轉(zhuǎn)移出去的數(shù)學(xué)期望和標(biāo)準(zhǔn) 差,依次類推,還可W找到"d","f","j","k","1","d"轉(zhuǎn)移出去的數(shù)學(xué)期望和標(biāo)準(zhǔn)差, 從而得到8個(gè)第二數(shù)學(xué)期望和第二標(biāo)準(zhǔn)差。
[0068] S25:將所述第一數(shù)學(xué)期望和所述第二數(shù)學(xué)期望之后確定為總的數(shù)學(xué)期望,將所述 第一標(biāo)準(zhǔn)差和所述第二標(biāo)準(zhǔn)差之和確定為總的標(biāo)準(zhǔn)差。 W例其中,可從隱1+8 = 9個(gè)數(shù)學(xué)期望的和作為總的數(shù)學(xué)期望,將9個(gè)標(biāo)準(zhǔn)差的和作為 總的標(biāo)準(zhǔn)差。
[0070] S26:計(jì)算所述次數(shù)值與所述總的數(shù)學(xué)期望的差值,將所述差值與所述總的標(biāo)準(zhǔn)差 的比值,確定為所述參數(shù)值。
[0071] 例如,參數(shù)值的計(jì)算公式為:
[0072]
[007引其中,181是上述步驟計(jì)算得到的次數(shù)值,E是總的數(shù)學(xué)期望,σ是總的標(biāo)準(zhǔn)差。 [0074] S27:當(dāng)所述參數(shù)值小于預(yù)設(shè)值時(shí),確定所述待檢測(cè)的姓名是合理的,否則不合理。
[00巧]其中,預(yù)設(shè)值可W根據(jù)實(shí)際情況設(shè)置。
[0076] 例如,預(yù)設(shè)值是3,則當(dāng)小于3時(shí),根據(jù)切比雪夫不等式(大數(shù)定律),待檢測(cè)的姓 名被該姓名庫生成的概率大于或等于1/9,則該待檢測(cè)的姓名是合理的,反之,如果該參數(shù) 值大于或等于3,表明待檢測(cè)的姓名被該姓名庫生成的概率小于1/9,則該待檢測(cè)的姓名是 不合理的。
[0077] 當(dāng)識(shí)別出不合理后,可W禁止用戶注冊(cè)該姓名等。
[007引本實(shí)施例中,通過根據(jù)姓名庫中字符的概率信息,獲取待檢測(cè)的姓名的參數(shù)值,根 據(jù)參數(shù)值確定待檢測(cè)的姓名的合理性,可W確定出網(wǎng)絡(luò)上注冊(cè)的姓名合理性,從而降低惡 意注冊(cè)。本實(shí)施例通過上述計(jì)算流程可W確定待檢測(cè)的姓名被姓名庫生成的概率。
[0079] 圖3是本申請(qǐng)另一實(shí)施例提出的檢測(cè)網(wǎng)站上注冊(cè)的姓名合理性的裝置的結(jié)構(gòu)示 意圖,該裝置30包括接收模塊31,獲取模塊32和確定模塊33。
[0080] 接收模塊31,用于接收待檢測(cè)的姓名;
[0081] 例如,接收用戶通過鍵盤或者觸摸屏輸入的待檢測(cè)的姓名。
[0082] 待檢測(cè)的姓名可W包括一個(gè)或多個(gè)字符串。
[0083] 待檢測(cè)的姓名例如為"as壯jkWk"。
[0084] 獲取模塊32,用于根據(jù)預(yù)先建立的姓名庫中字符的概率信息,獲取所述待檢測(cè)的 姓名對(duì)應(yīng)的參數(shù)值;
[0085] 可選的,所述姓名庫是與所述待檢測(cè)的姓名具有相同語種的姓名庫,或者,所述姓 名庫是多種語種的姓名庫,所述多種語種包括所述待檢測(cè)的姓名的具有的語種。
[0086] 例如,包括中文,英文等語種的混合姓名庫。或者,也可W對(duì)應(yīng)每個(gè)待檢測(cè)的姓名, 獲取與待檢測(cè)的姓名具有相同語種的姓名庫,例如,待檢測(cè)的姓名是英文的,則可W獲取英 文的姓名庫。具體的,可w根據(jù)待檢測(cè)的姓名中字符是英文或者中文等確定相應(yīng)的語種。
[0087] 可選的,參見圖4,所述參數(shù)值是歸一化后的值,所述獲取模塊32包括:
[0088] 第一單元321,用于根據(jù)所述概率信息,計(jì)算所述待檢測(cè)的姓名被所述姓名庫生成 所需的次數(shù)值;
[0089] 可選的,所述概率信息包括:所述姓名庫中每個(gè)首字符對(duì)應(yīng)的首字符生成概率,W 及,所述姓名庫中姓名的相鄰的兩個(gè)字符間的轉(zhuǎn)移概率,所述轉(zhuǎn)移概率組成轉(zhuǎn)移概率矩陣, 所述第一單元321具體用于:
[0090] 從所述概率信息中,獲取第一首字符生成概率,W及第一轉(zhuǎn)移概率,所述第一首字 符生成概率是所述待檢測(cè)的姓名中首字符對(duì)應(yīng)的首字符生成概率,所述第一轉(zhuǎn)移概率包括 所述待檢測(cè)的姓名中相鄰的兩個(gè)字符間的轉(zhuǎn)移概率;
[0091] 確定所述第一首字符生成概率在所述姓名庫中所有的首字符生成概率中的排序 位數(shù),W及,所述第一轉(zhuǎn)移概率在所述轉(zhuǎn)移概率矩陣中對(duì)應(yīng)行的所有的轉(zhuǎn)移概率中的排序 位數(shù),并根據(jù)所述排序位數(shù)計(jì)算所述次數(shù)值。
[0092] 例如,姓名庫中的所有首字符生成概率可W組成一個(gè)行向量,W英文字符為例,行 向量包括a對(duì)應(yīng)的首字符生成概率,b對(duì)應(yīng)的首字符生成概率,C對(duì)應(yīng)的首字符生成概率等。
[0093] 姓名庫中的所有轉(zhuǎn)移概率可W組成一個(gè)26x26的矩陣,其中,每行和每列分別對(duì) 應(yīng)一個(gè)字符,第i行第j列的元素表示從第i行的字符轉(zhuǎn)移到第j的字符的轉(zhuǎn)移概率,例如, 第1行第1列的元素表示從a轉(zhuǎn)移到a的轉(zhuǎn)移概率,第1行第2列的元素表示從a轉(zhuǎn)移到 b的轉(zhuǎn)移概率,第1行第3列的元素表示從a轉(zhuǎn)移到C的轉(zhuǎn)移概率,第2行第1列的元素表 示從b轉(zhuǎn)移到a的轉(zhuǎn)移概率等。
[0094] 在得到首字符生成概率組成的行向量,W及,轉(zhuǎn)移概率組成的轉(zhuǎn)移概率矩陣后,可 W按照從大到小的順序?qū)γ總€(gè)概率進(jìn)行排序。例如,按照從大到小的順序?qū)κ鬃址筛?率進(jìn)行排序,W及,對(duì)應(yīng)轉(zhuǎn)移概率矩陣的每一行,對(duì)該每行中的轉(zhuǎn)移概率按照從大到小的順 序排序。
[0095] 在排序后,可W確定待檢測(cè)的姓名中的首字符生成概率的排序位數(shù),W及,待檢測(cè) 的姓名中兩兩相鄰字符的轉(zhuǎn)移概率的排序位數(shù),對(duì)每個(gè)排序位數(shù)進(jìn)行相加可W得到次數(shù) 值。
[0096] 例如,英文姓名庫中有化hnson,White, Black……,則字符"j"作為首字符出現(xiàn)了 1次,"W"作為首字符出現(xiàn)了 1次,"b"作為首字符出現(xiàn)了 1次,依此類推,可W得到每個(gè)字 符作為首字符的出現(xiàn)次數(shù),再用該次數(shù)除W姓名的總數(shù),得到該字符的首字符生成概率,例 如,"r在姓名庫中作為首字符出現(xiàn)了 m詞,姓名庫中的姓名的總數(shù)是n,則"r對(duì)應(yīng)的首字 符生成概率是m/n。
[0097] 又例如,字符"j"到"ο"轉(zhuǎn)移了 1次,"ο"到"h"轉(zhuǎn)移了 1次,"h"到"η"轉(zhuǎn)移了 1次,依此類推,可W得到每個(gè)字符轉(zhuǎn)移到下一個(gè)的次數(shù),再用該次數(shù)除W姓名的總數(shù),得到 該兩個(gè)字符之間的轉(zhuǎn)移概率,例如,字符"j"至ij"〇"轉(zhuǎn)移了 X次,姓名庫中的姓名的總數(shù)是 n,則字符"j "到" 0"的轉(zhuǎn)移概率是χ/η。
[0098] 首字符生成概率可W組成一個(gè)1x26的行向量,分別表示"a"~"Ζ"中的每一個(gè)字 符對(duì)應(yīng)的首字符生成概率。
[0099] 轉(zhuǎn)移概率矩陣是26x26的矩陣,每一行代表"a"~"Z"中的一個(gè)字符,每一列代表 "a"~"z"中的一個(gè)字符,每一列代表前一個(gè)字符是此行對(duì)應(yīng)的字符,下一個(gè)字符是此列對(duì) 應(yīng)的字符的概率。 陽100] 例如,待檢測(cè)的姓名是"as壯jkl化",次數(shù)值可W采用如下規(guī)則生成: 陽101] 對(duì)上一步得到的所有的首字符生成概率按照從大到小的順序進(jìn)行排序,并找到 "as壯化Idk"中首字符"a"的首字符生成概率在排序后的位數(shù),例如"a"的首字符生成概率 從大到小排序排在第5位,則第一個(gè)數(shù)值取5。 陽102] 對(duì)上一步中獲得的轉(zhuǎn)移概率矩陣的每一行的元素按照從大到小排序,找到首字符 "曰巧I巧一個(gè)字符"S"的轉(zhuǎn)移概率在排序后的位置,例如是第23化則第二個(gè)數(shù)值為23。重 復(fù)此計(jì)算,得出"S"到"d","d"到"f"……分別對(duì)應(yīng)的排序位數(shù),例如分別是22,21,25, 19,20,24,22。
[0103] 再將運(yùn)些值求和,得到181。 陽104] 第二單元322,用于根據(jù)所述概率信息,計(jì)算所述待檢測(cè)的姓名被所述姓名庫生成 對(duì)應(yīng)的總的數(shù)學(xué)期望和總的標(biāo)準(zhǔn)差;
[01化]可選的,所述第二單元322具體用于:
[0106] 對(duì)所述姓名庫中所有的首字符生成概率進(jìn)行排序,根據(jù)每個(gè)首字符生成概率W及 對(duì)應(yīng)的排序位數(shù),計(jì)算得到第一數(shù)學(xué)期望和第一標(biāo)準(zhǔn)差;
[0107] 對(duì)所述第一轉(zhuǎn)移概率在所述轉(zhuǎn)移概率矩陣的對(duì)應(yīng)行的所有的轉(zhuǎn)移概率進(jìn)行排序, 根據(jù)所述第一轉(zhuǎn)移概率的對(duì)應(yīng)行的每個(gè)轉(zhuǎn)移概率W及對(duì)應(yīng)的排序位數(shù),計(jì)算得到第二數(shù)學(xué) 期望和第二標(biāo)準(zhǔn)差;
[0108] 將所述第一數(shù)學(xué)期望和所述第二數(shù)學(xué)期望之和確定為總的數(shù)學(xué)期望,將所述第一 標(biāo)準(zhǔn)差和所述第二標(biāo)準(zhǔn)差之和確定為總的標(biāo)準(zhǔn)差。
[0109] 所述排序是按照從大到小的順序進(jìn)行排序,所述次數(shù)值為:所述第一首字符生成 概率在所述姓名庫中所有的首字符生成概率中的排序位數(shù)W及所述第一轉(zhuǎn)移概率在所述 姓名庫中相應(yīng)行的所有的轉(zhuǎn)移概率中的排序位數(shù)之和。
[0110] 第一數(shù)學(xué)期望和第一標(biāo)準(zhǔn)差可W采用如下規(guī)則生成: 陽111] 對(duì)首字符生成概率按照從大到小的順序排序,第一數(shù)學(xué)期望是每一個(gè)首字符生成 概率與此概率在排序后的位數(shù)的乘積的和,例如首字符生成概率按照從大到小的順序排序 為: 陽…]"S" :0.07 陽 11引"t" :0.06 陽 114] "C" :0.04 陽115] ...... 陽116] 'V':0.002
[0117] 則第一數(shù)學(xué)期望是 0. 07*1+0. 06*化0. 04*3+···+0. 002巧6 = 11. 37 ;
[0118] 第一標(biāo)準(zhǔn)差是: 陽119]
[0120] 可選的,可W計(jì)算轉(zhuǎn)移概率矩陣中每一行向量對(duì)應(yīng)的數(shù)學(xué)期望和標(biāo)準(zhǔn)差,再從中 獲取待檢測(cè)的姓名的字符間轉(zhuǎn)移對(duì)應(yīng)的數(shù)學(xué)期望和標(biāo)準(zhǔn)差,作為第二數(shù)學(xué)期望和第二標(biāo)準(zhǔn) 差,或者,只計(jì)算待檢測(cè)的姓名的字符間轉(zhuǎn)移對(duì)應(yīng)的數(shù)學(xué)期望和標(biāo)準(zhǔn)差。 陽12U 例如,在轉(zhuǎn)移概率矩陣中,對(duì)應(yīng)第一行,可W得到字符"a"轉(zhuǎn)移出去的數(shù)學(xué)期望和 標(biāo)準(zhǔn)差,對(duì)應(yīng)第二行,可W得到字符"b"轉(zhuǎn)移出去的數(shù)學(xué)期望和標(biāo)準(zhǔn)差,對(duì)應(yīng)第立行,可W得 到字符"C"轉(zhuǎn)移出去的數(shù)學(xué)期望和標(biāo)準(zhǔn)差,依次類推,可W得到26個(gè)字符轉(zhuǎn)移出去的數(shù)學(xué) 期望和標(biāo)準(zhǔn)差,其中,每一行向量計(jì)算數(shù)學(xué)期望和標(biāo)準(zhǔn)差的方式可W如計(jì)算第一數(shù)學(xué)期望 和第一標(biāo)準(zhǔn)差的方式。 陽12引再從中找到"a"轉(zhuǎn)移出去的數(shù)學(xué)期望和標(biāo)準(zhǔn)差,"S"轉(zhuǎn)移出去的數(shù)學(xué)期望和標(biāo)準(zhǔn) 差,依次類推,還可W找到"d","f","j","k","1","d"轉(zhuǎn)移出去的數(shù)學(xué)期望和標(biāo)準(zhǔn)差, 從而得到8個(gè)第二數(shù)學(xué)期望和第二標(biāo)準(zhǔn)差。
[0123] 其中,可W將1+8 = 9個(gè)數(shù)學(xué)期望的和作為總的數(shù)學(xué)期望,將9個(gè)標(biāo)準(zhǔn)差的和作為 總的標(biāo)準(zhǔn)差。
[0124] 第Ξ單元323,用于根據(jù)所述次數(shù)值,所述總的數(shù)學(xué)期望和所述總的標(biāo)準(zhǔn)差,計(jì)算 所述參數(shù)值。 陽1巧]可選的,所述第Ξ單元323具體用于: 陽126] 計(jì)算所述次數(shù)值與所述總的數(shù)學(xué)期望的差值;
[0127] 將所述差值與所述總的標(biāo)準(zhǔn)差的比值,確定為所述參數(shù)值。 陽12引例如,參數(shù)值的計(jì)算公式為: 陽 129]
[0130] 其中,181是上述步驟計(jì)算得到的次數(shù)值,E是總的數(shù)學(xué)期望,σ是總的標(biāo)準(zhǔn)差。 陽131] 確定模塊33,用于根據(jù)所述參數(shù)值,確定所述待檢測(cè)的姓名的合理性。
[0132] 可選的,所述確定模塊33具體用于: 陽133] 當(dāng)所述參數(shù)值小于預(yù)設(shè)值時(shí),確定所述待檢測(cè)的姓名是合理的,否則不合理。
[0134] 其中,預(yù)設(shè)值可W根據(jù)實(shí)際情況設(shè)置。
[0135] 例如,預(yù)設(shè)值是3,則當(dāng)小于3時(shí),根據(jù)切比雪夫不等式(大數(shù)定律),待檢測(cè)的姓 名被該姓名庫生成的概率大于或等于1/9,則該待檢測(cè)的姓名是合理的,反之,如果該參數(shù) 值大于或等于3,表明待檢測(cè)的姓名被該姓名庫生成的概率小于1/9,則該待檢測(cè)的姓名是 不合理的。 陽136] 當(dāng)識(shí)別出不合理后,可W禁止用戶注冊(cè)該姓名等。
[0137] 本實(shí)施例中,通過根據(jù)姓名庫中字符的概率信息,獲取待檢測(cè)的姓名的參數(shù)值,根 據(jù)參數(shù)值確定待檢測(cè)的姓名的合理性,可W確定出網(wǎng)絡(luò)上注冊(cè)的姓名合理性,從而降低惡 意注冊(cè)。
[0138] 需要說明的是,在本申請(qǐng)的描述中,術(shù)語"第一"、"第二"等僅用于描述目的,而不 能理解為指示或暗示相對(duì)重要性。此外,在本申請(qǐng)的描述中,除非另有說明,"多個(gè)"的含義 是兩個(gè)或兩個(gè)W上。
[0139] 流程圖中或在此W其他方式描述的任何過程或方法描述可W被理解為,表示包括 一個(gè)或更多個(gè)用于實(shí)現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部 分,并且本申請(qǐng)的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可W不按所示出或討論的順 序,包括根據(jù)所設(shè)及的功能按基本同時(shí)的方式或按相反的順序,來執(zhí)行功能,運(yùn)應(yīng)被本申請(qǐng) 的實(shí)施例所屬技術(shù)領(lǐng)域的技術(shù)人員所理解。
[0140] 應(yīng)當(dāng)理解,本申請(qǐng)的各部分可W用硬件、軟件、固件或它們的組合來實(shí)現(xiàn)。在上述 實(shí)施方式中,多個(gè)步驟或方法可W用存儲(chǔ)在存儲(chǔ)器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件 或固件來實(shí)現(xiàn)。例如,如果用硬件來實(shí)現(xiàn),和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下 列技術(shù)中的任一項(xiàng)或他們的組合來實(shí)現(xiàn):具有用于對(duì)數(shù)據(jù)信號(hào)實(shí)現(xiàn)邏輯功能的邏輯口電路 的離散邏輯電路,具有合適的組合邏輯口電路的專用集成電路,可編程口陣列(PGA),現(xiàn)場(chǎng) 可編程口陣列(FPGA)等。 陽141] 本技術(shù)領(lǐng)域的普通技術(shù)人員可W理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步 驟是可W通過程序來指令相關(guān)的硬件完成,所述的程序可W存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介 質(zhì)中,該程序在執(zhí)行時(shí),包括方法實(shí)施例的步驟之一或其組合。
[0142] 此外,在本申請(qǐng)各個(gè)實(shí)施例中的各功能單元可W集成在一個(gè)處理模塊中,也可W 是各個(gè)單元單獨(dú)物理存在,也可W兩個(gè)或兩個(gè)W上單元集成在一個(gè)模塊中。上述集成的模 塊既可W采用硬件的形式實(shí)現(xiàn),也可W采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如 果W軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),也可W存儲(chǔ)在一個(gè)計(jì)算機(jī) 可讀取存儲(chǔ)介質(zhì)中。 陽143] 上述提到的存儲(chǔ)介質(zhì)可W是只讀存儲(chǔ)器,磁盤或光盤等。
[0144] 在本說明書的描述中,參考術(shù)語"一個(gè)實(shí)施例"、"一些實(shí)施例"、"示例"、"具體示 例"、或"一些示例"等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特 點(diǎn)包含于本申請(qǐng)的至少一個(gè)實(shí)施例或示例中。在本說明書中,對(duì)上述術(shù)語的示意性表述不 一定指的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可W在任何 的一個(gè)或多個(gè)實(shí)施例或示例中W合適的方式結(jié)合。
[0145] 盡管上面已經(jīng)示出和描述了本申請(qǐng)的實(shí)施例,可W理解的是,上述實(shí)施例是示例 性的,不能理解為對(duì)本申請(qǐng)的限制,本領(lǐng)域的普通技術(shù)人員在本申請(qǐng)的范圍內(nèi)可W對(duì)上述 實(shí)施例進(jìn)行變化、修改、替換和變型。
【主權(quán)項(xiàng)】
1. 一種檢測(cè)網(wǎng)站上注冊(cè)的姓名合理性的方法,其特征在于,包括: 接收待檢測(cè)的姓名; 根據(jù)預(yù)先建立的姓名庫中字符的概率信息,獲取所述待檢測(cè)的姓名對(duì)應(yīng)的參數(shù)值; 根據(jù)所述參數(shù)值,確定所述待檢測(cè)的姓名的合理性。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述參數(shù)值是歸一化后的值,所述根據(jù)預(yù) 先建立的姓名庫中字符的概率信息,獲取所述待檢測(cè)的姓名對(duì)應(yīng)的參數(shù)值,包括: 根據(jù)所述概率信息,計(jì)算所述待檢測(cè)的姓名被所述姓名庫生成所需的次數(shù)值; 根據(jù)所述概率信息,計(jì)算所述待檢測(cè)的姓名被所述姓名庫生成對(duì)應(yīng)的總的數(shù)學(xué)期望和 總的標(biāo)準(zhǔn)差; 根據(jù)所述次數(shù)值,所述總的數(shù)學(xué)期望和所述總的標(biāo)準(zhǔn)差,計(jì)算所述參數(shù)值。3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述概率信息包括:所述姓名庫中每個(gè)首 字符對(duì)應(yīng)的首字符生成概率,以及,所述姓名庫中姓名的相鄰的兩個(gè)字符間的轉(zhuǎn)移概率,所 述轉(zhuǎn)移概率組成轉(zhuǎn)移概率矩陣,所述根據(jù)預(yù)先建立的姓名庫中字符的概率信息,獲取所述 待檢測(cè)的姓名對(duì)應(yīng)的參數(shù)值包括:根據(jù)所述概率信息,計(jì)算所述待檢測(cè)的姓名被所述姓名 庫生成所需的次數(shù)值,所述根據(jù)所述概率信息,計(jì)算所述待檢測(cè)的姓名被所述姓名庫生成 所需的次數(shù)值,包括: 從所述概率信息中,獲取第一首字符生成概率,以及第一轉(zhuǎn)移概率,所述第一首字符生 成概率是所述待檢測(cè)的姓名中首字符對(duì)應(yīng)的首字符生成概率,所述第一轉(zhuǎn)移概率包括所述 待檢測(cè)的姓名中相鄰的兩個(gè)字符間的轉(zhuǎn)移概率; 確定所述第一首字符生成概率在所述姓名庫中所有的首字符生成概率中的排序位數(shù), 以及,所述第一轉(zhuǎn)移概率在所述轉(zhuǎn)移概率矩陣中對(duì)應(yīng)行的所有的轉(zhuǎn)移概率中的排序位數(shù), 并根據(jù)所述排序位數(shù)計(jì)算所述次數(shù)值。4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述概率信息,計(jì)算所述待檢測(cè) 的姓名被所述姓名庫生成對(duì)應(yīng)的總的數(shù)學(xué)期望和總的標(biāo)準(zhǔn)差,包括: 對(duì)所述姓名庫中所有的首字符生成概率進(jìn)行排序,根據(jù)每個(gè)首字符生成概率以及對(duì)應(yīng) 的排序位數(shù),計(jì)算得到第一數(shù)學(xué)期望和第一標(biāo)準(zhǔn)差; 對(duì)所述第一轉(zhuǎn)移概率在所述轉(zhuǎn)移概率矩陣的對(duì)應(yīng)行的所有的轉(zhuǎn)移概率進(jìn)行排序,根據(jù) 所述第一轉(zhuǎn)移概率的對(duì)應(yīng)行的每個(gè)轉(zhuǎn)移概率以及對(duì)應(yīng)的排序位數(shù),計(jì)算得到第二數(shù)學(xué)期望 和第二標(biāo)準(zhǔn)差; 將所述第一數(shù)學(xué)期望和所述第二數(shù)學(xué)期望之和確定為總的數(shù)學(xué)期望,將所述第一標(biāo)準(zhǔn) 差和所述第二標(biāo)準(zhǔn)差之和確定為總的標(biāo)準(zhǔn)差。5. 根據(jù)權(quán)利要求3或4所述的方法,其特征在于,所述排序是按照從大到小的順序進(jìn)行 排序,所述次數(shù)值為:所述第一首字符生成概率在所述姓名庫中所有的首字符生成概率中 的排序位數(shù)以及所述第一轉(zhuǎn)移概率在所述姓名庫中相應(yīng)行的所有的轉(zhuǎn)移概率中的排序位 數(shù)之和。6. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述次數(shù)值,所述總的數(shù)學(xué)期望 和所述總的標(biāo)準(zhǔn)差,計(jì)算所述參數(shù)值,包括: 計(jì)算所述次數(shù)值與所述總的數(shù)學(xué)期望的差值; 將所述差值與所述總的標(biāo)準(zhǔn)差的比值,確定為所述參數(shù)值。7. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述參數(shù)值,確定所述待檢測(cè)的 姓名的合理性,包括: 當(dāng)所述參數(shù)值小于預(yù)設(shè)值時(shí),確定所述待檢測(cè)的姓名是合理的,否則不合理。8. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述姓名庫是與所述待檢測(cè)的姓名具有 相同語種的姓名庫,或者,所述姓名庫是多種語種的姓名庫,所述多種語種包括所述待檢測(cè) 的姓名的具有的語種。9. 一種檢測(cè)網(wǎng)站上注冊(cè)的姓名合理性的裝置,其特征在于,包括: 接收模塊,用于接收待檢測(cè)的姓名; 獲取模塊,用于根據(jù)預(yù)先建立的姓名庫中字符的概率信息,獲取所述待檢測(cè)的姓名對(duì) 應(yīng)的參數(shù)值; 確定模塊,用于根據(jù)所述參數(shù)值,確定所述待檢測(cè)的姓名的合理性。10. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述參數(shù)值是歸一化后的值,所述獲取 豐吳塊包括: 第一單元,用于根據(jù)所述概率信息,計(jì)算所述待檢測(cè)的姓名被所述姓名庫生成所需的 次數(shù)值; 第二單元,用于根據(jù)所述概率信息,計(jì)算所述待檢測(cè)的姓名被所述姓名庫生成對(duì)應(yīng)的 總的數(shù)學(xué)期望和總的標(biāo)準(zhǔn)差; 第三單元,用于根據(jù)所述次數(shù)值,所述總的數(shù)學(xué)期望和所述總的標(biāo)準(zhǔn)差,計(jì)算所述參數(shù) 值。
【文檔編號(hào)】G06F17/27GK105988993SQ201510101458
【公開日】2016年10月5日
【申請(qǐng)日】2015年3月6日
【發(fā)明人】顧思源
【申請(qǐng)人】阿里巴巴集團(tuán)控股有限公司