欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種針對(duì)含特殊字符的url編碼后的自動(dòng)解碼方法

文檔序號(hào):6385921閱讀:487來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):一種針對(duì)含特殊字符的url編碼后的自動(dòng)解碼方法
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域,具體涉及ー種針對(duì)含特殊字符的URL編碼后的自動(dòng)解碼方法。
背景技術(shù)
統(tǒng)一資源定位符(URL,Uniform Universal Resource Locator)也被稱(chēng)為網(wǎng)頁(yè)地址,是因特網(wǎng)上標(biāo)準(zhǔn)的資源地址。在一些互聯(lián)網(wǎng)應(yīng)用中,為消除歧義,需要對(duì)URL進(jìn)行編碼。例如,含有中文、空格等特殊字符的URL通常會(huì)編碼成含有“ %”和“ E6”等的字符長(zhǎng)串。很多新聞?wù)军c(diǎn)的URL中會(huì)包含該條新聞的標(biāo)題相關(guān)信息,恢復(fù)URL的原有形式在互聯(lián)網(wǎng)信息采集領(lǐng)域有著非常重要的意義??赏ㄟ^(guò)分析編碼后的URL中特殊字符值的分布來(lái)判斷編碼方式,進(jìn)而解碼出原URL。但不同的編碼方式存在交叉,有的字符值會(huì)在不同的編碼方式中出現(xiàn)。

發(fā)明內(nèi)容
本發(fā)明涉及一種針對(duì)含特殊字符的URL編碼后的自動(dòng)解碼方法,所述方法包括:步驟SI,輸入需要解碼的編碼后的URL字符串;步驟S2,按照不同的編碼方式對(duì)所述編碼后的URL字符串進(jìn)行解碼,得到不同的URL字符串;步驟S3,對(duì)所述得到的不同的URL字符串按照其對(duì)應(yīng)的解碼方式進(jìn)行編碼,得到不同的編碼后的URL字符串;步驟S4,將所述得到的不同的編碼后的URL字符串與輸入的所述需要解碼的編碼后的URL字符串進(jìn)行對(duì)比,如果所述得到的不同的編碼后的URL字符串中有ー個(gè)與所述需要解碼的編碼后的URL字符串相同,取所述編碼后的URL字符串對(duì)應(yīng)的編碼方式下步驟S2中得到的URL字符串為所述需要解碼的編碼后的URL字符串自動(dòng)解碼得到的URL字符串。本發(fā)明提供的第一優(yōu)選實(shí)施例中:所述步驟S2中按照不同的編碼方式對(duì)所述編碼后的URL字符串進(jìn)行解碼是根據(jù)常用的編碼字符集進(jìn)行解碼的;在中文環(huán)境下,按照GBK、Big5和UTF-8不同的編碼方式進(jìn)行解碼。本發(fā)明提供的第二優(yōu)選實(shí)施例中:如果所述步驟S2中按照所述常用的編碼字符集進(jìn)行不同方式的解碼后,所述步驟S4中對(duì)比沒(méi)有得到與所述需要解碼的編碼后的URL字符串相同的編碼后的URL字符串,采用與所述步驟S2中不同的編碼方式進(jìn)行步驟S2-S4的操作。本發(fā)明提供的一種針對(duì)含特殊字符的URL編碼后的自動(dòng)解碼方法的有益效果包括:本發(fā)明提供的一種針對(duì)含特殊字符的URL編碼后的自動(dòng)解碼方法,針對(duì)含特殊字符的編碼后的URL字符串,在URL字符串編碼方式不明確并且不同的編碼方式存在交叉不容易判斷編碼方式的情況下,比較精確的得到編碼方式進(jìn)行解碼。


如圖1所示為本發(fā)明提供的一種針對(duì)含特殊字符的URL編碼后的自動(dòng)解碼方法的實(shí)施例的流程圖。
具體實(shí)施例方式本發(fā)明提供一種針對(duì)含特殊字符的URL編碼后的自動(dòng)解碼方法,該方法包括:步驟SI,輸入需要解碼的編碼后的URL字符串。步驟S2,按照不同的編碼方式對(duì)該編碼后的URL字符串進(jìn)行解碼,得到不同的URL
字符串。步驟S3,對(duì)步驟S2中得到的不同的URL字符串按照其對(duì)應(yīng)的解碼方式進(jìn)行編碼,得到不同的編碼后的URL字符串。步驟S4,將得到的不同的編碼后的URL字符串與輸入的需要解碼的編碼后的URL字符串進(jìn)行對(duì)比,如果得到的不同的編碼后的URL字符串中有ー個(gè)與需要解碼的編碼后的URL字符串相同,取該編碼后的URL字符串對(duì)應(yīng)的編碼方式下步驟S2中得到的URL字符串為需要解碼的編碼后的URL字符串自動(dòng)解碼得到的URL字符串。步驟S2中按照不同的編碼方式對(duì)編碼后的URL字符串進(jìn)行解碼是根據(jù)常用的編碼字符集進(jìn)行解碼的,比如在中文環(huán)境下:按照GBK、Big5和UTF-8等不同的編碼方式進(jìn)行解碼。如果按照常用的編碼字符集進(jìn)行不同方式的解碼后,步驟S4中對(duì)比沒(méi)有得到與需要解碼的編碼后的URL字符串相同的`編碼后的URL字符串,那么可以采用其他不常用的編碼方式進(jìn)行步驟S2-S4的操作。如圖1所示為本發(fā)明提供的一種針對(duì)含特殊字符的URL編碼后的自動(dòng)解碼方法的實(shí)施例的流程圖,需要解碼的編碼后的URL字符串為:“..%ACF%AAv…”,假設(shè)GBK、Big5和Utf-8等不同的編碼方式后進(jìn)行相應(yīng)的解碼,得到不同的URL字符串,在按照其對(duì)應(yīng)的解碼方式進(jìn)行編碼得到不同的URL字符串,將得到的不同的URL字符串與“..%ACF%AAv…”進(jìn)行對(duì)比,得到Big5編碼方式下得到的URL字符串與“..%ACF%AAv…”相同,則取Big5編碼方式下解碼得到的“..政治…”為本實(shí)施例中需要解碼的編碼后的URL字符串經(jīng)過(guò)自動(dòng)解碼得到的URL字符串。GBK編碼與Big5編碼的字符集有交叉,導(dǎo)致根據(jù)編碼值的分布范圍求原字符的編碼方式在有些情況下行不通;URL中的特殊字符一般不止ー個(gè),實(shí)際中所有的特殊字符在兩種字符集中的編碼值都相同的概率非常小,該情況下,只能通過(guò)肉眼并結(jié)合已有經(jīng)驗(yàn)判斷原URL值,保證了本方法的有效性。最后應(yīng)當(dāng)說(shuō)明的是:以上實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案而非對(duì)其限制,盡管參照上述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,所屬領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:依然可以對(duì)本發(fā)明的具體實(shí)施方式
進(jìn)行修改或者等同替換,而未脫離本發(fā)明精神和范圍的任何修改或者等同替換,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍當(dāng)中。
權(quán)利要求
1.一種針對(duì)含特殊字符的URL編碼后的自動(dòng)解碼方法,其特征在于,所述方法包括: 步驟SI,輸入需要解碼的編碼后的URL字符串; 步驟S2,按照不同的編碼方式對(duì)所述編碼后的URL字符串進(jìn)行解碼,得到不同的URL字符串; 步驟S3,對(duì)所述得到的不同的URL字符串按照其對(duì)應(yīng)的解碼方式進(jìn)行編碼,得到不同的編碼后的URL字符串; 步驟S4,將所述得到的不同的編碼后的URL字符串與輸入的所述需要解碼的編碼后的URL字符串進(jìn)行對(duì)比,如果所述得到的不同的編碼后的URL字符串中有ー個(gè)與所述需要解碼的編碼后的URL字符串相同,取所述編碼后的URL字符串對(duì)應(yīng)的編碼方式下步驟S2中得到的URL字符串為所述需要解碼的編碼后的URL字符串自動(dòng)解碼得到的URL字符串。
2.按權(quán)利要求1所述的方法,其特征在于,所述步驟S2中按照不同的編碼方式對(duì)所述編碼后的URL字符串進(jìn)行解碼是根據(jù)常用的編碼字符集進(jìn)行解碼的; 在中文環(huán)境下,按照GBK、Big5和UTF-8不同的編碼方式進(jìn)行解碼。
3.按權(quán)利要求2所述的方法,其特征在于,如果所述步驟S2中按照所述常用的編碼字符集進(jìn)行不同方式的解碼后,所述步驟S4中對(duì)比沒(méi)有得到與所述需要解碼的編碼后的URL字符串相同的編碼后的URL字符串,采用與所述步驟S2中不同的編碼方式進(jìn)行步驟S2-S4的操作。
全文摘要
本發(fā)明提供一種針對(duì)含特殊字符的URL編碼后的自動(dòng)解碼方法,包括步驟S1.輸入需要解碼的編碼后的URL字符串;步驟S2.按照不同的編碼方式對(duì)編碼后的URL字符串進(jìn)行解碼,得到不同的URL字符串;步驟S3.對(duì)得到的不同的URL字符串按照其對(duì)應(yīng)的解碼方式進(jìn)行編碼,得到不同的編碼后的URL字符串;步驟S4.將得到的不同的編碼后的URL字符串與輸入的需要解碼的編碼后的URL字符串進(jìn)行對(duì)比,如果得到的不同的編碼后的URL字符串中有一個(gè)與需要解碼的編碼后的URL字符串相同,取編碼后的URL字符串對(duì)應(yīng)的編碼方式下步驟S2中得到的URL字符串為需要解碼的編碼后的URL字符串自動(dòng)解碼得到的URL字符串,精確得到需要解碼的編碼后的URL字符串的編碼方式進(jìn)行解碼。
文檔編號(hào)G06F17/30GK103092922SQ20121058539
公開(kāi)日2013年5月8日 申請(qǐng)日期2012年12月28日 優(yōu)先權(quán)日2012年12月28日
發(fā)明者劉欣然, 李焱, 趙麗 申請(qǐng)人:國(guó)家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
武宁县| 家居| 镇江市| 东明县| 通化市| 仁怀市| 柳江县| 灵璧县| 桃江县| 左权县| 祁门县| 东平县| 北海市| 华池县| 淳安县| 抚州市| 左云县| 延吉市| 武汉市| 鄂伦春自治旗| 沂南县| 和平县| 闽侯县| 会泽县| 宣恩县| 呼和浩特市| 和平区| 义乌市| 达孜县| 乌什县| 土默特右旗| 綦江县| 桃江县| 昌图县| 阳春市| 花莲县| 巨野县| 原阳县| 黎平县| 策勒县| 江门市|