欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

獲取多音字拼音、基于拼音檢索的方法及其相應(yīng)裝置與流程

文檔序號:12041698閱讀:310來源:國知局
獲取多音字拼音、基于拼音檢索的方法及其相應(yīng)裝置與流程
本申請涉及信息檢索技術(shù)領(lǐng)域,特別涉及一種獲取多音字拼音的方法及裝置、基于文字拼音的檢索方法及裝置。

背景技術(shù):
隨著信息技術(shù)的發(fā)展,涌現(xiàn)出越來越多的基于文字拼音的信息檢索系統(tǒng)。這些信息檢索系統(tǒng)通過直接接收文字拼音或?qū)⒔邮盏奈淖职凑漳J方式轉(zhuǎn)換為相應(yīng)拼音后,以拼音為索引查找預(yù)置拼音數(shù)據(jù)庫,獲得與該拼音對應(yīng)的一個或多個關(guān)鍵詞,然后根據(jù)關(guān)鍵詞進行海量信息檢索獲得檢索結(jié)果。比如,百度搜索引擎可基于輸入的漢語拼音給出提示詞條,用戶選擇相應(yīng)詞條后,即以相應(yīng)詞條進行搜索獲得相應(yīng)信息;車載導(dǎo)航儀在接收漢字拼音首字母后可快速檢索出海量地理信息。這些檢索系統(tǒng)完成檢索依賴于拼音數(shù)據(jù)庫。拼音數(shù)據(jù)庫以拼音為索引組織數(shù)據(jù),一個拼音可標識具有該相同拼音的多個詞組、短語或者句子。以中文拼音數(shù)據(jù)庫為例,一種基于文字拼音的數(shù)據(jù)組織過程是:將漢字對應(yīng)的漢語拼音建立一一對應(yīng)的哈希表,漢字有多個讀音時選擇一個常規(guī)音作為默認音,將具有相同拼音的漢字或詞組放置于相同區(qū)域構(gòu)建成數(shù)據(jù)庫,以便在接收到拼音時從該數(shù)據(jù)庫中查找漢字檢索詞。與該方式類似的還有根據(jù)漢字在GBK(漢字國際擴展碼)編碼表內(nèi)的分布情況獲取拼音(參見圖1(a)、圖1(b)),或者將上述兩種方式結(jié)合起來用于獲取拼音,進而基于文字拼音的數(shù)據(jù)組織。但是,這些獲取文字拼音的方式由于對多音字采取默認音,因此,大多數(shù)情況下無法獲取多音字在不同語境下的正確拼音。此外,上述獲取的多音字拼音僅有默認音,減少了以相同拼音組織數(shù)據(jù)的數(shù)據(jù)庫的信息容量、增加了數(shù)據(jù)庫內(nèi)的數(shù)據(jù)的錯誤率,進而導(dǎo)致依據(jù)拼音對應(yīng)的關(guān)鍵詞進行檢索后獲得的檢索結(jié)果準確率降低。

技術(shù)實現(xiàn)要素:
為解決上述技術(shù)問題,本申請實施例的目的在于提供一種獲取多音字拼音的方法與裝置,以及基于文字拼音的檢索方法與裝置,以獲取多音字在不同語境下的正確讀音以及提高基于文字拼音進行檢索的檢索準確率。本申請實施例提供的獲取多音字拼音的方法包括:獲取文字串;對所述文字串進行分詞處理,以獲得至少一個分詞;將所述分詞與預(yù)設(shè)的多音字表進行匹配,以判斷分詞是否包含多音字,若包含多音字,則將該分詞與預(yù)設(shè)多音字詞語表進行匹配,以獲得多音字在該分詞中的拼音,所述多音字詞語表為包含多音字的詞語與多音字在該詞語中的拼音之間的對應(yīng)關(guān)系表。優(yōu)選地,若所述包含多音字的分詞中進一步包含非多音字,則所述方法還包括:獲取所述分詞中每個非多音字的拼音;將所述分詞中非多音字的拼音和多音字的拼音組合為所述分詞的拼音;以所述分詞的拼音或拼音的首字母為索引,將所述分詞添加到拼音數(shù)據(jù)庫中。優(yōu)選地,獲取所述分詞中每個非多音字的拼音,具體包括:通過查找GBK編碼表,獲得所述分詞中每個非多音字的拼音。優(yōu)選地,將分詞與預(yù)設(shè)的多音字表進行匹配以判斷分詞是否包含多音字,具體包括:將所述分詞中的每個漢字分別與所述預(yù)設(shè)的多音字表進行匹配,若所述分詞包含所述預(yù)設(shè)多音字表中的漢字,則確定所述分詞包含多音字。優(yōu)選地,所述預(yù)設(shè)多音字表中包含各多音字對應(yīng)的默認音,若從預(yù)設(shè)多音字詞語表中未獲得所述分詞中的多音字的拼音,則所述方法還包括:從所述預(yù)設(shè)多音字表中,獲取所述分詞中多音字對應(yīng)的默認音,將所述默認音作為所述分詞中的多音字的拼音。優(yōu)選地,將所述分詞與預(yù)設(shè)多音字詞語表進行匹配以獲得該分詞中的多音字的拼音,包括:確定所述分詞中的多音字在該分詞中的位置;從所述多音字詞語表中確定出至少一個預(yù)選分詞,所述預(yù)選分詞包含所述分詞中的多音字,且該多音字在所述預(yù)選分詞中的位置與該多音字在所述分詞中的位置相同;將所述分詞與確定出的預(yù)選分詞進行匹配,若匹配成功,則從所述多音字詞語表中,獲取與所述分詞匹配的預(yù)選分詞中的多音字的拼音,將所述預(yù)選分詞的多音字的拼音,確定為所述分詞中的相應(yīng)多音字的拼音。本申請實施例提供的獲取多音字拼音裝置包括:第一獲取單元、切分單元、第一匹配單元和第二匹配單元,其中:所述第一獲取單元,用于獲取文字串;所述切分單元,用于對所述文字串進行分詞處理,以獲得至少一個分詞;所述第一匹配單元,用于將分詞與預(yù)設(shè)多音字表進行匹配,以判斷分詞是否包含多音字,若包含多音字,則觸發(fā)第二匹配單元;所述第二匹配單元,用于將該分詞與預(yù)設(shè)多音字詞語表進行匹配,以獲得多音字在該分詞中的拼音,所述多音字詞語表為包含多音字的詞語與多音字在該詞語中的拼音之間的對應(yīng)關(guān)系表。優(yōu)選地,所述裝置還包括第二獲取單元和添加單元,其中:所述第二獲取單元,用于在所述多音字的分詞中包含非多音字時,獲取所述分詞中每個非多音字的拼音,將所述分詞中的非多音字的拼音和多音字的拼音組合為所述分詞對應(yīng)的拼音;所述添加單元,用于以所述分詞的拼音或拼音的首字母為索引,將所述分詞添加到拼音數(shù)據(jù)庫中。優(yōu)選地,所述第二獲取單元獲取所述分詞中每個非多音字的拼音,具體用于:通過查找GBK編碼表,獲得所述分詞中的每個非多音字的拼音。優(yōu)選地,第一匹配單元將分詞與預(yù)設(shè)多音字表進行匹配以判斷分詞是否包含多音字,具體包括:將所述分詞中的每個漢字分別與所述預(yù)設(shè)多音字表進行匹配,若所述分詞中包含所述預(yù)設(shè)多音字表中的漢字,則確定所述分詞包含多音字。優(yōu)選地,所述預(yù)設(shè)多音字表包含多音字的默認音,所述第二匹配單元進一步用于,若從預(yù)設(shè)多音字詞語表中未獲得所述分詞中的多音字的拼音,從所述預(yù)設(shè)多音字表中,獲取所述分詞中多音字對應(yīng)的默認音,將所述默認音作為所述分詞中的多音字的拼音。優(yōu)選地,所述第二匹配單元包括:第一確定子單元,第二確定子單元、匹配子單元和第三確定子單元,其中:所述第一確定子單元,用于確定所述分詞中的多音字在該分詞中的位置;所述第二確定子單元,用于從所述多音字詞語表中確定出至少一個預(yù)選分詞,所述預(yù)選分詞包含所述分詞中的多音字,且該多音字在所述預(yù)選分詞中的位置與該多音字在所述分詞中的位置相同;所述匹配子單元,用于將所述分詞與確定出的預(yù)選分詞進行匹配,若匹配成功,則觸發(fā)第三確定子單元;所述第三確定子單元,用于從所述多音字詞語表中,獲取與所述分詞匹配的預(yù)選分詞中的多音字的拼音,將所述預(yù)選分詞的多音字的拼音,確定為所述分詞中的相應(yīng)多音字的拼音。本申請實施例提供的基于文字拼音的檢索方法包括:獲取拼音或拼音首字母;以所述拼音或拼音首字母為索引查找拼音數(shù)據(jù)庫;所述拼音數(shù)據(jù)庫是以分詞的拼音或拼音首字母為索引,將具有相同拼音或拼音首字母的分詞作為一個索引單位進行數(shù)據(jù)組織,且當所述分詞為包含多音字的分詞時,該分詞中的多音字在該分詞中的拼音是通過與預(yù)設(shè)的多音字詞語表進行匹配得到,所述多音字詞語表為包含多音字的詞語與多音字在該詞語中的拼音之間的對應(yīng)關(guān)系表;將查找到的具有相同拼音或拼音首字母的分詞作為關(guān)鍵詞進行檢索,獲得檢索結(jié)果。優(yōu)選地,所述獲取拼音或拼音首字母包括:接收用戶輸入的拼音或拼音首字母;或者,接收用戶輸入的文字串,并對所述文字串進行分詞處理,以獲得至少一個分詞;將所述分詞與預(yù)設(shè)多音字表進行匹配以判斷分詞是否包含多音字,若包含多音字,則將該分詞與預(yù)設(shè)多音字詞語表進行匹配,以獲得多音字在該分詞中的拼音,所述多音字詞語表為包含多音字的詞語與多音字在該詞語中的拼音之間的對應(yīng)關(guān)系表;獲得分詞的拼音后,提取分詞的拼音或拼音首字母。優(yōu)選地,在查找到的具有相同拼音或拼音首字母的分詞包含多個時,提示用戶進行選擇,將用戶選擇的分詞作為關(guān)鍵詞進行檢索,獲取檢索結(jié)果。本申請實施例提供的基于文字拼音的檢索裝置包括:第三獲取單元、查找單元和檢索單元,其中:所述第三獲取單元,用于獲取拼音或拼音首字母;所述查找單元,用于以所述第三獲取單元獲得的拼音或拼音首字母為索引查找拼音數(shù)據(jù)庫,所述拼音數(shù)據(jù)庫是以分詞的拼音或拼音首字母為索引,將具有相同拼音或拼音首字母的分詞作為一個索引單位進行數(shù)據(jù)組織,且當所述分詞為包含多音字的分詞時,該分詞中的多音字在該分詞中的拼音是通過與預(yù)設(shè)的多音字詞語表進行匹配得到,所述多音字詞語表為包含多音字的詞語與多音字在該詞語中的拼音之間的對應(yīng)關(guān)系表;所述檢索單元,用于將所述查找單元查找到的具有相同拼音或拼音首字母的分詞作為關(guān)鍵詞進行檢索,獲得檢索結(jié)果。優(yōu)選地,所述第三獲取單元接收用戶輸入的拼音或拼音首字母;或者,所述第三獲取單元包括:接收子單元、切分子單元、第一匹配子單元、第二匹配子單元和提取子單元,其中:所述接收子單元,用于接收用戶輸入的文字串;所述切分子單元,用于對所述文字串進行分詞處理,以獲得至少一個分詞;所述第一匹配子單元,用于將分詞與預(yù)設(shè)多音字表進行匹配以判斷分詞是否包含多音字,若包含多音字,則觸發(fā)第二匹配子單元;所述第二匹配子單元,用于將該分詞與預(yù)設(shè)多音字詞語表進行匹配,以獲得多音字在該分詞中的拼音,所述多音字詞語表為包含多音字的詞語與多音字在該詞語中的讀音之間的對應(yīng)關(guān)系表;所述提取子單元,用于在獲取分詞的拼音后,提取分詞的拼音或拼音首字母。優(yōu)選地,所述裝置還包括提示單元,用于在所述查找單元查找到的具有相同拼音或拼音首字母的分詞包含多個時,提示用戶進行選擇;則:所述檢索單元將用戶選擇的分詞作為關(guān)鍵詞進行檢索,獲取檢索結(jié)果。本申請實施例給出了獲取多音字拼音的方法與裝置以及基于文字拼音的檢索方法與裝置。獲取多音字拼音方法與裝置的實施例,對文字串進行分詞處理所得到的分詞進行多音字判斷,將包含多音字的分詞與預(yù)設(shè)多音字詞語表進行匹配,從而確定多音字在不同語境下的準確拼音。與現(xiàn)有技術(shù)相比,本申請實施例由于根據(jù)每個多音字的語境確定其各自的拼音,從而提高了獲取多音字正確拼音的概率。此外,通過本申請實施例可獲得多音字具有的多個拼音,而不再是一個默認拼音,將其用于組織拼音數(shù)據(jù)庫時,增加了具有相同拼音的詞組、短語或句子的數(shù)量,擴展了拼音數(shù)據(jù)庫的信息容量,避免了包含多音字的分詞由于拼音錯誤放入錯誤的拼音索引之下,從而也增加了拼音數(shù)據(jù)庫內(nèi)數(shù)據(jù)的正確率?;谖淖制匆舻臋z索方法與裝置的實施例以獲取的拼音為拼音首字母為索引查找拼音數(shù)據(jù)庫,將查找到的具有相同拼音或拼音首字母的分詞作為關(guān)鍵詞進行檢索獲得檢索結(jié)果。與現(xiàn)有技術(shù)相比,由于本申請實施例的拼音數(shù)據(jù)庫考慮了文字的多音字現(xiàn)象以及多音字在不同語境下的不同拼音問題,使拼音數(shù)據(jù)庫的信息容量和其內(nèi)部數(shù)據(jù)正確率得到提高,從而使得依據(jù)分詞的準確拼音所對應(yīng)的關(guān)鍵詞,在拼音數(shù)據(jù)庫中進行檢索后所獲取的檢索結(jié)果準確率更高。附圖說明為了更清楚地說明本申請實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請中記載的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1(a)、圖1(b)為現(xiàn)有技術(shù)中GBK編碼表的示意圖;圖2為本申請的獲取多音字拼音的方法實施例的流程圖;圖3(a)為圖2所述實施例中的預(yù)設(shè)多音字表的一種示意圖;圖3(b)為圖2所述實施例中的預(yù)設(shè)多音字詞語表的一種示意圖;圖4為圖2所述實施例的一個實例的流程圖;圖5為本申請基于文字拼音的檢索方法實施例的流程圖;圖6為圖5所述實施例中的獲取拼音或拼音首字母步驟的流程圖;圖7為本申請獲取多音字拼音的裝置實施例的結(jié)構(gòu)框圖;圖8為本申請基于文字拼音的檢索裝置實施例的結(jié)構(gòu)框圖。具體實施方式為了使本技術(shù)領(lǐng)域的人員更好地理解本申請中的技術(shù)方案,下面將結(jié)合本申請實施例中的附圖,對本申請實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本申請一部分實施例,而不是全部的實施例?;诒旧暾堉械膶嵤├绢I(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都應(yīng)當屬于本申請保護的范圍。為使本申請的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合附圖和具體實施方式對本申請作進一步詳細的說明。參見圖2,該圖示出了本申請獲取多音字拼音的方法實施例的流程。該實施例包括:步驟S201:獲取文字串;文字串是文字的集合,獲取文字串即是獲取多個文字,這些文字可以表現(xiàn)為詞組、短語,甚至一個句子。這里的“文字”可以是適應(yīng)本申請主題的任何一種文字,即該文字具有拼音,可通過拼音方式進行數(shù)據(jù)組織。常見的如中文,每個漢字均對應(yīng)至少一個拼音,還比如日文,每個日語詞均對應(yīng)至少一個平假名或片假名,平假名或片假名即是日語詞匯的拼音。對于獲取文字串的方式,具體可以表現(xiàn)為多種,比如直接接收用戶輸入的方式獲取,也可以通過網(wǎng)絡(luò)進行抓取,還可以從預(yù)先收集好的文字數(shù)據(jù)集中讀取等方式獲得文字串。步驟S202:對所述文字串進行分詞處理,以獲得至少一個分詞;獲取文字串后對文字串進行分詞處理,其目的是獲得一個或多個相對獨立且具有自身含義的詞語或短語,如果一個文字串過長也可以切分為一個或多個相對獨立且具有自身含義的句子。這里對文字串做分詞處理的具體方法,根據(jù)實際情況的不同,可選擇不同的切分方式。分詞技術(shù)在現(xiàn)有技術(shù)中已有較多的描述,這里為節(jié)約篇幅,僅簡要介紹一種常用的正向/逆向最大匹配詞典分詞法。該方法在已構(gòu)建的包含豐富、全面的中文詞語(短語)詞典的基礎(chǔ)之上,按照一定的字符串匹配與詞頻統(tǒng)計策略,將文字串與詞典內(nèi)詞條進行逐一、快速的匹配并進行詞頻統(tǒng)計,由此從該文字串內(nèi)分析出若干個相對獨立且具有自身含義的詞語(或短語)。比如將“蚌埠市人民政府”的文字串切分為“蚌埠市”、“人民”、“政府”三個分詞。步驟S203:將所述分詞與預(yù)設(shè)多音字表進行匹配,以判斷分詞是否包含多音字,若包含多音字,則將該分詞與預(yù)設(shè)多音字詞語表進行匹配,以獲得多音字在該分詞中的拼音,所述多音字詞語表為包含多音字的詞語與多音字在該詞語中的拼音之間的對應(yīng)關(guān)系表;獲得分詞后,以每個分詞為處理對象,分兩步進行處理:一是判斷該分詞是否包含多音字;二是給出分詞的正確拼音。分詞內(nèi)是否包含多音字影響到給出分詞內(nèi)漢字的正確拼音。判斷分詞是否包含多音字的文字,可通過將分詞內(nèi)的每個文字分別與預(yù)設(shè)的多音字表進行匹配的方式進行判斷。以中文為例:漢語體系存在著多音字現(xiàn)象,但多音字的數(shù)量有限,據(jù)初略統(tǒng)計,《新華字典》所列多音字有六百多個,如:朝、行、殼、給、會、曾、長等。通過對這些漢字拼音進行統(tǒng)計可構(gòu)建一個預(yù)設(shè)多音字表,該多音字表列出了漢語中所有的多音字。參見圖3(a),該圖示出了一種預(yù)設(shè)多音字表,該多音字表以拼音為序羅列出了漢語中的全部多音字,該表的第二列為多音字的預(yù)設(shè)默認拼音。通過匹配方式確定了分詞是否包含多音字后,進行給出多音字的正確拼音的步驟:如果通過匹配,確認分詞包含多音字,則將包含多音字的分詞與預(yù)設(shè)多音字詞語表進行匹配,預(yù)設(shè)多音字詞語表以多音字為索引,列出了包含該多音字的詞語以及多音字在該詞語中的拼音(參見圖3(b)),在該預(yù)設(shè)多音字詞語表中查找到相應(yīng)的多音字,然后比較分詞與包含多音字的詞語,若匹配上,則將多音字詞語表登記的包含該多音字的詞語對應(yīng)的拼音作為多音字的拼音;如果通過匹配,確認分詞內(nèi)的字沒有多音字,則可通過現(xiàn)有的方式給出拼音,比如通過查找哈希表或GBK編碼表方式獲得分詞文字的拼音。上述實施例給出的獲取多音字拼音的方法對文字串切分的分詞進行多音字判斷,將多音字與預(yù)設(shè)多音字詞語表進行匹配,從而確定多音字在不同語境下的拼音。與現(xiàn)有技術(shù)相比,根據(jù)每個多音字所在的語境來確定該多音字的拼音,從而提高了獲取多音字正確拼音的概率。上述實施例中若包含多音字的分詞中進一步包含非多音字,還可以將分詞的拼音用于組織拼音數(shù)據(jù)庫。具體包括:獲取所述分詞中每個非多音字的拼音,具體方式可通過查找GBK編碼表獲得;將所述分詞中非多音字的拼音和多音字的拼音組合為所述分詞的拼音;以所述分詞的拼音或拼音的首字母為索引,將所述分詞添加到拼音數(shù)據(jù)庫中。這里獲得分詞的拼音后,可以分詞的拼音為索引,將具有相同拼音的分詞作為一個索引單位添加進拼音數(shù)據(jù)庫,也可以分詞的拼音首字母為索引,將具有相同拼音首字母的分詞作為一個索引單位添加到拼音數(shù)據(jù)庫。添加進入拼音數(shù)據(jù)庫的工作可以在獲得一個包含多音字的分詞的拼音后即進行,也可在從文字串中切分出來的包含多音字的全部分詞的拼音均獲得后進行,為避免在不同操作之間多次轉(zhuǎn)換影響效率,本申請優(yōu)選后者。按照上述方式組織的拼音數(shù)據(jù)庫的一個拼音之下,對應(yīng)多個分詞,這多個分詞可以預(yù)先分別對應(yīng)相應(yīng)的關(guān)聯(lián)信息,以供用戶檢索數(shù)據(jù)庫時直接獲得這些關(guān)聯(lián)信息。也可僅將分詞作為關(guān)鍵詞,在用戶需要檢索時利用這些關(guān)鍵詞通過搜索引擎進行關(guān)聯(lián)信息的檢索。在獲得包含多音字的分詞的拼音后,將該分詞添加到拼音數(shù)據(jù)庫相應(yīng)拼音或拼音首字母索引下,與現(xiàn)有技術(shù)相比,通過本申請實施例可獲得多音字具有的多個拼音,而不再是一個默認拼音,將其用于組織拼音數(shù)據(jù)庫時,增加了具有相同拼音的詞組、短語或句子的數(shù)量,擴展了拼音數(shù)據(jù)庫的信息容量,避免了包含多音字的分詞由于拼音錯誤放入錯誤的拼音或拼音首字母索引之下,從而也增加了拼音數(shù)據(jù)庫內(nèi)數(shù)據(jù)的正確率。上述實施例中提到多音字的默認音,多音字的默認音也是多音字的常規(guī)音,在實際的語言應(yīng)用過程中,使用頻率較高。在多音字詞語表中可以包含多音字的所有拼音對應(yīng)的全部短語、詞語,但是,這并不是最恰當?shù)姆绞?,因為,通常情況下,多音字常規(guī)音對應(yīng)的詞語較其他音的詞語數(shù)量更多,如果讓多音字詞語表包含多音字所有拼音對應(yīng)的全部短語,勢必增加了多音字詞語表的容量,容量增加將影響到匹配效率。為此,本申請優(yōu)選在多音字表中列出多音字的常規(guī)音(默認音),而在多音字詞語表中不列出包含常規(guī)音的多音字詞語,這樣雖然對多音字表的容量有所增加,但不影響多音字表的匹配效率,且相對于多音字詞語表的容量而言,將大為減少多音字詞語表的容量,從而有利于提高匹配效率。通過上述處理后,若從預(yù)設(shè)多音字詞語表中未獲得所述分詞中的多音字的拼音,則從所述預(yù)設(shè)多音字表中,獲取所述分詞中多音字對應(yīng)的默認音,將所述默認音作為所述分詞中的多音字的拼音。上述實施例中,在將分詞與預(yù)設(shè)多音字詞語表進行匹配以獲得分詞中多音字拼音時,可以采用先從多音字詞語表中查找出包含該多音字的詞語,然后將分詞與查找出的詞語逐個匹配以獲得多音字拼音。除這種方式外,本申請優(yōu)選采用如下方式進行匹配過程:確定所述分詞中的多音字在該分詞中的位置;從所述多音字詞語表中確定出至少一個預(yù)選分詞,所述預(yù)選分詞包含所述分詞中的多音字,且該多音字在所述預(yù)選分詞中的位置與該多音字在所述分詞中的位置相同;將所述分詞與確定出的預(yù)選分詞進行匹配,若匹配成功,則從所述多音字詞語表中,獲取與所述分詞匹配的預(yù)選分詞中的多音字的拼音,將所述預(yù)選分詞的多音字的拼音,確定為所述分詞中的相應(yīng)多音字的拼音。通過這種方式,可減少匹配的工作量,提高匹配效率。為了便于進一步理解本申請的多音字拼音獲取方法以及基于包含多音字的分詞拼音構(gòu)建拼音數(shù)據(jù)庫的過程,下面以一個具體的實例進行闡釋。該實例中的文字串從預(yù)先收集好的中文數(shù)據(jù)集中讀取。參見附圖4,該圖示出了該實例的流程。該流程包括:步驟S401:初始化參數(shù)i、j、k、r、s,即令i=1,j=1,k=1,r=1,s=1,其中:i表示中文數(shù)據(jù)集Sdb中的一條中文字串的序號,j表示中文字串分詞后的一個分詞的序號,k表示分詞中的一個漢字的序號,r表示包含多音字的詞語序列中的一個詞語的序號,s表示包含多音字詞語中的一個漢字的序號;步驟S402:判斷i是否達到n(n為中文數(shù)據(jù)集Sdb包含的總中文字串數(shù)),若i<=n,則執(zhí)行步驟S403;若i>n,則執(zhí)行步驟S419;步驟S403:從中文數(shù)據(jù)集Sdb中取出第i條中文字串利用中文分詞技術(shù)對進行分詞處理,以得到組成該中文字串的各分詞,即比如:中文字串“蚌埠市人民政府”經(jīng)過分詞后,共包括3個分詞:“蚌埠市”、“人民”、“政府”;步驟S404:判斷j是否達到m(m為中文字串包含的總分詞數(shù)),若j<=m,則執(zhí)行步驟S405;若j>m,則令i=i+1,返回步驟S402;步驟S405:從中文字串的分詞序列中取出第j個分詞,該分詞包含C個漢字,即比如,“蚌埠市”分詞,由3個漢字組成;步驟S406:判斷k是否達到C,若k<=C,則執(zhí)行步驟S407;若k>C,則令j=j(luò)+1,返回步驟S404;步驟S407:從上述分詞的C個漢字中取出第k個漢字將與預(yù)設(shè)多音字表BasicTablePolyChar進行匹配,比如,將漢字“蚌”進行匹配;步驟S408:判斷是否能夠相互匹配,如果是,則說明該漢字為多音字,執(zhí)行步驟S409;如果否,則說明該漢字不是多音字,執(zhí)行步驟S410;步驟S409:從預(yù)設(shè)多音字表BasicTablePolyChar中取出信息其中Spell′為多音字的默認拼音,記錄該多音字的默認拼音以及包含該多音字的分詞,進入步驟S411;步驟S410:通過GBK編碼獲得的默認拼音Spellnormal,記錄該默認拼音,令k=k+1,返回步驟S406;比如,漢字“市”默認拼音為“shi”,通過GBK編碼即可獲得該默認拼音;步驟S411:以多音字為關(guān)鍵詞查找預(yù)設(shè)多音字詞語表WorldTablePolySpell,找出該多音字Chark對應(yīng)的包含該多音字的詞語序列:其中1≤r≤L;比如如下的多音字詞語序列:{行;[洗車行,hang,3],[鞋行,hang,2],[銀行,hang,2],[行走,xing,1]};步驟S412:判斷r是否達到L,若r≤L,則執(zhí)行步驟S413;若r>L,則進入步驟S418;步驟S413:從多音字詞語序列中取出第r個詞語:該詞語包含P個漢字;步驟S414:判斷s是否達到P,若s≤P,則執(zhí)行步驟S415;若s>P,則執(zhí)行步驟S417;步驟S415:取出記錄的包含多音字的分詞與第r個詞語的第s個漢字;步驟S416:比較兩個漢字是否相同,如果相同,則令s=s+1,返回步驟S414;如果不同,則令r=r+1,返回步驟S412;步驟S417:將第r個詞語中的多音字拼音記錄為Chark的拼音,令k=k+1,返回步驟S406;步驟S418:將步驟S409記錄的多音字的默認拼音作為Chark的拼音,k=k+1,返回步驟S406;步驟S419:獲得中文數(shù)據(jù)集Sdb中全部的中文字串拼音后,以拼音或拼音首字母為索引,將具有相同拼音或拼音首字母的分詞作為一個索引單位進行拼音數(shù)據(jù)庫的組織。下面再以中文字串“美國銀行”為例,進一步說明從文字串中獲取文字串中的多音字的拼音過程。(1)對中文字串“美國銀行”進行分詞處理,得到兩個分詞“美國”和“銀行”。(2)對上述兩個分詞中的第一個分詞“美國”進行拼音轉(zhuǎn)換:先讀取其第一個漢字“美”,將“美”字與《多音字表》進行匹配,即在《多音字表》中查找是否包含“美”字;經(jīng)查找,查找結(jié)果為:漢字“美”不是多音字。(3)通過查找《GBK編碼表》獲取“美”的默認拼音。非多音字漢字“美”的GBK編碼為“0xC3C0”,在《GBK編碼表》中找到與之相關(guān)的信息[mei,0xC3B5,0xC3C4],由此可知:漢字“美”的GBK編碼在范圍[0xC3B5,0xC3C4]內(nèi),因此,漢字“美”的拼音為“mei”。(4)獲取第一個分詞“美國”的第二個漢字“國”的拼音;分詞“美國”的第二個漢字“國”的處理過程與“美”類似:漢字“國”也不是多音字,在《GBK編碼表》內(nèi)找到其相關(guān)信息為[guo,0xB9F8,0XB9FD],因此漢字“國”的拼音為“guo”。(5)對前述兩個分詞中的第二個分詞“銀行”進行拼音轉(zhuǎn)換:先讀取其第一個漢字“銀”,將“銀”字與《多音字表》進行匹配,即在《多音字表》中查找是否包含“銀”字;經(jīng)查找,查找結(jié)果為:漢字“銀”不是多音字。(6)通過查找《GBK編碼表》獲取“銀”的默認拼音;非多音字漢字“銀”的GBK編碼為“0xD2F8”,在《GBK編碼表》內(nèi)找到與之相關(guān)的信息[yin,0xD2F0,0xD3A1],由此可知:漢字“銀”的GBK編碼在范圍[0xD2F0,0xD3A1]內(nèi),因此,漢字“銀”(0xD2F8)的拼音為“yin”。(7)獲取第二個分詞“銀行”的第二個漢字“行”的拼音,具體包括以下步驟:①將讀取的“行”字與《多音字表》進行匹配,即在《多音字表》內(nèi)查找是否包含“行”字;經(jīng)查找,找到與之相匹配的信息[行,xing];②將漢字“行”與《多音字詞語表》進行匹配,即在《多音字詞語表》內(nèi)進行查找處理;經(jīng)查找,得到如下關(guān)于“行”的詞語串信息:{行;[洗車行,hang,3],[鞋行,hang,2],[銀行,hang,2],[行走,xing,1]};③從“行”的詞語串中取出第一條詞語信息[洗車行,hang,3],由于漢字“行”為詞語“銀行”的第二個漢字,因此該漢字的字位z=2;計算Posstart=z-3=2-3=-1,由于Posstart<0,因此,該第一條詞語信息不是需要的目的詞語信息;④從“行”的詞語串中取出第二條詞語信息[鞋行,hang,2],計算Posstart=z-2=2-2=0,令x=1;比較詞語“銀行”中第x個漢字(即“銀”)與“鞋行”中第Posstart+x個漢字(即“鞋”),發(fā)現(xiàn)兩個漢字不同,因此,該第二條詞語信息不是需要的目的詞語信息;⑤從“行”的詞語串中取出第三條詞語信息[銀行,hang,2],計算Posstart=z-2=2-2=0,令x=1;比較詞語“銀行”中第x個漢字(即“銀”)與“銀行”中第Posstart+x個漢字(即“銀”),發(fā)現(xiàn)兩個漢字相同,令x=x+1;比較分詞“銀行”中第x個漢字(即“行”)與“銀行”中第Posstart+x個漢字(即“行”),發(fā)現(xiàn)兩個漢字也相同;⑥由于x=2,因此進行到該步驟⑤,即可得出漢字“行”在整條中文字串“美國銀行”中的拼音為“hang”。通過上述實施例所述的方法,可以實現(xiàn)以拼音為索引的拼音數(shù)據(jù)庫的組織,以這種形式完成拼音數(shù)據(jù)庫可用于基于文字拼音的檢索。為此,本申請還提供了一種基于文字拼音的檢索方法實施例。參見附圖5,該圖示出了本申請基于文字拼音的檢索方法實施例的流程。該實施例包括:步驟S501:獲取拼音或拼音首字母;在搜索引擎中,通常設(shè)置一個輸入框,該輸入框用來接收用戶的輸入,為了采用本申請的方式進行檢索,用戶可以在搜索引擎輸入框中直接輸入拼音或拼音首字母,搜索引擎從而獲取拼音或拼音首字母,用戶也可以在搜索引擎輸入框中輸入文字串,通過對該文字串的轉(zhuǎn)換來獲取拼音或拼音首字母。參見附圖6,該圖示出了后一種獲取拼音或拼音首字母的流程,包括:步驟S5011:接收用戶輸入的文字串;步驟S5012:對所述文字串進行分詞處理,以獲得至少一個分詞;步驟S5013:將所述分詞與預(yù)設(shè)多音字表進行匹配以判斷分詞是否包含多音字,若包含多音字,則將該分詞與預(yù)設(shè)多音字詞語表進行匹配,以獲得多音字在該分詞中的拼音,所述預(yù)設(shè)多音字詞語表為包含多音字的詞語與多音字在該詞語中的讀音之間的對應(yīng)關(guān)系表;該步驟S5013如果在分詞與預(yù)設(shè)多音字表匹配后判斷出分詞的文字不是多音字時,則可通過查找哈希表或GBK編碼表方式獲得分詞文字的拼音。步驟S5014:獲得分詞的拼音后,提取分詞的拼音或拼音首字母。通過上述的任何一種方式獲取拼音或拼音首字母后,進入后續(xù)步驟。步驟S502:以所述拼音或拼音首字母為索引查找拼音數(shù)據(jù)庫,所述拼音數(shù)據(jù)庫是以分詞的拼音或拼音首字母為索引,將具有相同拼音或拼音首字母的分詞作為一個索引單位進行數(shù)據(jù)組織,且當所述分詞為包含多音字的分詞時,該分詞中的多音字在該分詞中的拼音是通過與預(yù)設(shè)的多音字詞語表進行匹配得到,所述多音字詞語表為包含多音字的詞語與多音字在該詞語中的拼音之間的對應(yīng)關(guān)系表;搜索引擎接收到拼音或拼音首字母后,以該拼音或拼音首字母為索引查找拼音數(shù)據(jù)庫,這里的拼音數(shù)據(jù)庫為按照前述基于文字拼音的數(shù)據(jù)組織方法組織的數(shù)據(jù)庫。步驟S503:將查找到的具有相同拼音或拼音首字母的分詞作為關(guān)鍵詞進行檢索獲得檢索結(jié)果。本申請基于文字拼音的檢索方法與裝置的實施例以獲取的拼音為拼音首字母為索引查找拼音數(shù)據(jù)庫,將查找到的具有相同拼音或拼音首字母的分詞作為關(guān)鍵詞進行檢索獲得檢索結(jié)果。與現(xiàn)有技術(shù)相比,由于拼音數(shù)據(jù)庫的組織考慮了文字的多音字現(xiàn)象以及多音字在不同語境下的不同拼音問題,從而使得依據(jù)拼音對應(yīng)的關(guān)鍵詞進行檢索后獲取的檢索結(jié)果準確率更高。上述檢索實施例中步驟S503如果查找到具有相同拼音或拼音首字母的分詞包含多個時,為了減少檢索工作量和增加檢索結(jié)果與用戶需求的一致性,本申請優(yōu)選在這種情況下,提示用戶進行選擇,將用戶選擇的分詞作為關(guān)鍵詞進行檢索獲取檢索結(jié)果。提示用戶進行選擇可彈出對話框,列出檢索到的具有相同拼音或拼音首字母的分詞的編號,通過選擇編號確認分詞,然后利用該分詞進行檢索獲取檢索結(jié)果。上述敘述內(nèi)容均是對本申請方法實施例的描述,相應(yīng)地,本申請實施例還提供了一種獲取多音字拼音的裝置和基于文字拼音的檢索裝置。參見附圖7,該圖示出了本申請獲取多音字拼音的裝置結(jié)構(gòu)。該裝置實施例700包括:第一獲取單元701、切分單元702、第一匹配單元703和第二匹配單元704,其中:所述第一獲取單元701,用于獲取文字串;所述切分單元702,用于對所述文字串進行分詞處理,以獲得至少一個分詞;所述第一匹配單元703,用于將分詞與預(yù)設(shè)多音字表進行匹配,以判斷分詞是否包含多音字,若包含多音字,則觸發(fā)第二匹配單元704;所述第二匹配單元704,用于將該分詞與預(yù)設(shè)多音字詞語表進行匹配,以獲得多音字在該分詞中的拼音,所述預(yù)設(shè)多音字詞語表為包含多音字的詞語與多音字在該詞語中的拼音之間的對應(yīng)關(guān)系表;本裝置實施例700的工作過程是:第一獲取單元701獲取文字串后,通過切分單元702對所述文字串進行分詞處理,以獲得至少一個分詞;第一匹配單元703將分詞與預(yù)設(shè)多音字表進行匹配以判斷分詞是否包含多音字,若是,則觸發(fā)第二匹配單元704,由第二匹配單元704將該分詞與預(yù)設(shè)多音字詞語表進行匹配以獲得多音字的拼音,所述預(yù)設(shè)多音字詞語表為包含多音字的詞語與多音字在該詞語中的拼音之間的對應(yīng)關(guān)系表。本申請獲取多音字拼音的裝置實施例對文字串切分的分詞進行多音字判斷,將多音字與預(yù)設(shè)多音字詞語表進行匹配,從而確定多音字在不同語境下的正確拼音。與現(xiàn)有技術(shù)相比,本裝置實施例由于根據(jù)每個多音字所在的語境確定其準確的拼音,從而提高了獲取多音字正確拼音的概率。上述裝置實施例700中還可以包括第二獲取單元705和添加單元706,其中:第二獲取單元705,用于在所述多音字的分詞中包含非多音字時,獲取所述分詞中每個非多音字的拼音,將所述分詞中的非多音字的拼音和多音字的拼音組合為所述分詞對應(yīng)的拼音;添加單元706,用于以所述分詞的拼音或拼音的首字母為索引,將所述分詞添加到拼音數(shù)據(jù)庫中。通過增加上述兩個單元后,由于獲得的多音字具有多個拼音,不再是一個默認拼音,從而增加了具有相同拼音的詞組、短語或句子的數(shù)量,擴展了基于文字拼音進行數(shù)據(jù)組織的數(shù)據(jù)庫的信息容量,避免了包含多音字的分詞由于拼音錯誤放入錯誤的拼音索引之下,從而也增加了數(shù)據(jù)庫內(nèi)數(shù)據(jù)的正確率。上述裝置實施例700的第一匹配單元703將分詞與預(yù)設(shè)多音字表進行匹配以判斷分詞是否包含多音字,具體包括:將所述分詞中的每個漢字分別與所述預(yù)設(shè)多音字表進行匹配,若所述分詞中包含所述預(yù)設(shè)多音字表中的漢字,則確定所述分詞包含多音字。上述裝置實施例700的第二獲取單元705,具體用于:通過查找GBK編碼表,獲得所述分詞中的每個非多音字的拼音。上述裝置實施例700中的預(yù)設(shè)多音字表可以包含多音字的默認音,這種情況下,第二匹配單元704進一步用于,若從預(yù)設(shè)多音字詞語表中未獲得所述分詞中的多音字的拼音,從所述預(yù)設(shè)多音字表中獲取所述分詞中多音字對應(yīng)的默認音,將所述默認音作為所述分詞中的多音字的拼音。通過該方式可以減少多音字詞語表的容量,從而加快匹配速率,從整體上提高獲取多音字拼音的效率。第二匹配單元704還可以包括:第一確定子單元,第二確定子單元、匹配子單元和第三確定子單元,其中:所述第一確定子單元,用于確定所述分詞中的多音字在該分詞中的位置;所述第二確定子單元,用于從所述多音字詞語表中確定出至少一個預(yù)選分詞,所述預(yù)選分詞包含所述分詞中的多音字,且該多音字在所述預(yù)選分詞中的位置與該多音字在所述分詞中的位置相同;所述匹配子單元,用于將所述分詞與確定出的預(yù)選分詞進行匹配,若匹配成功,則觸發(fā)第三確定子單元;所述第三確定子單元,用于從所述多音字詞語表中,獲取與所述分詞匹配的預(yù)選分詞中的多音字的拼音,將所述預(yù)選分詞的多音字的拼音,確定為所述分詞中的相應(yīng)多音字的拼音。通過這種結(jié)構(gòu)的第二匹配單元,可進一步減少匹配的工作量,提高匹配效率。參見附圖8,該示出了本申請的基于文字拼音的檢索裝置實施例的結(jié)構(gòu)。該檢索裝置實施例800包括:第三獲取單元801、查找單元802和檢索單元803,其中:所述第三獲取單元801,用于獲取拼音或拼音首字母;所述查找單元802,用于以所述第三獲取單元801獲得的拼音或拼音首字母為索引查找拼音數(shù)據(jù)庫,所述拼音數(shù)據(jù)庫是以分詞的拼音或拼音首字母為索引,將具有相同拼音或拼音首字母的分詞作為一個索引單位進行數(shù)據(jù)組織,且當所述分詞為包含多音字的分詞時,該分詞中的多音字在該分詞中的拼音是通過與預(yù)設(shè)的多音字詞語表進行匹配得到,所述多音字詞語表為包含多音字的詞語與多音字在該詞語中的拼音之間的對應(yīng)關(guān)系表;所述檢索單元803,用于將所述查找單元802查找到的具有相同拼音或拼音首字母的分詞作為關(guān)鍵詞進行檢索,獲得檢索結(jié)果。本檢索裝置實施例800的工作過程是:第三獲取單元801獲取拼音或拼音首字母后,由查找單元802以所述拼音或拼音首字母為索引查找拼音數(shù)據(jù)庫;檢索單元803將查找到的具有相同拼音或拼音首字母的分詞作為關(guān)鍵詞進行檢索獲得檢索結(jié)果。本申請基于文字拼音的檢索裝置的實施例以獲取的拼音為拼音首字母為索引查找拼音數(shù)據(jù)庫,將查找到的具有相同拼音或拼音首字母的分詞作為關(guān)鍵詞進行檢索獲得檢索結(jié)果。與現(xiàn)有技術(shù)相比,由于拼音數(shù)據(jù)庫的組織考慮了文字的多音字現(xiàn)象以及多音字在不同語境下的不同拼音問題,從而使得依據(jù)拼音對應(yīng)的關(guān)鍵詞進行檢索后獲取的檢索結(jié)果準確率更高。上述檢索裝置實施例的第三獲取單元801可直接接收用戶輸入的拼音或拼音首字母,也可將用戶輸入的文字轉(zhuǎn)換為拼音或拼音首字母。在后一種情況下,第三獲取單元801可以包括:接收子單元8011、切分子單元8012、第一匹配子單元8013、第二匹配子單元8014和提取子單元8015,其中:接收子單元8011,用于接收用戶輸入的文字串;切分子單元8012,用于對所述文字串進行分詞處理,以獲得至少一個分詞;第一匹配子單元8013,用于將分詞與預(yù)設(shè)多音字表進行匹配以判斷分詞是否包含多音字,如果包含多音字,則觸發(fā)第二匹配子單元8014;第二匹配子單元8014,用于將該分詞與預(yù)設(shè)多音字詞語表進行匹配,以獲得多音字在該分詞中的拼音,所述多音字詞語表為包含多音字的詞語與多音字在該詞語中的讀音之間的對應(yīng)關(guān)系表;提取子單元8015,用于在獲取分詞的拼音后,提取分詞的拼音或拼音首字母。該檢索裝置實施例的第一匹配子單元8013在分詞與預(yù)設(shè)多音字表匹配后判斷出分詞不包含多音字時,可以通過查找哈希表或GBK編碼表方式獲得分詞文字的拼音。上述檢索裝置實施例800還可以包括提示單元804,用于在查找到的具有相同拼音或拼音首字母的分詞包含多個時,提示用戶進行選擇。這種情況下,檢索單元803將用戶選擇的分詞作為關(guān)鍵詞進行檢索獲取檢索結(jié)果。通過該方式減少了檢索工作量和增加了檢索結(jié)果與用戶需求的一致性,從而改善了基于文字拼音的檢索裝置的性能。為了描述的方便,描述以上裝置時以功能分為各種單元分別描述。當然,在實施本申請時可以把各單元的功能在同一個或多個軟件和/或硬件中實現(xiàn)。通過以上的實施方式的描述可知,本領(lǐng)域的技術(shù)人員可以清楚地了解到本申請可借助軟件加必需的通用硬件平臺的方式來實現(xiàn)。基于這樣的理解,本申請的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品可以存儲在存儲介質(zhì)中,如ROM/RAM、磁碟、光盤等,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本申請各個實施例或者實施例的某些部分所述的方法。本說明書中的各個實施例均采用遞進的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對于系統(tǒng)實施例而言,由于其基本相似于方法實施例,所以描述得比較簡單,相關(guān)之處參見方法實施例的部分說明即可。以上所描述的系統(tǒng)實施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上。可以根據(jù)實際的需要選擇其中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動的情況下,即可以理解并實施。本申請可用于眾多通用或?qū)S玫挠嬎阆到y(tǒng)環(huán)境或配置中。例如:個人計算機、服務(wù)器計算機、手持設(shè)備或便攜式設(shè)備、平板型設(shè)備、多處理器系統(tǒng)、基于微處理器的系統(tǒng)、置頂盒、可編程的消費電子設(shè)備、網(wǎng)絡(luò)PC、小型計算機、大型計算機、包括以上任何系統(tǒng)或設(shè)備的分布式計算環(huán)境等等。本申請可以在由計算機執(zhí)行的計算機可執(zhí)行指令的一般上下文中描述,例如程序模塊。一般地,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等等。也可以在分布式計算環(huán)境中實踐本申請,在這些分布式計算環(huán)境中,由通過通信網(wǎng)絡(luò)而被連接的遠程處理設(shè)備來執(zhí)行任務(wù)。在分布式計算環(huán)境中,程序模塊可以位于包括存儲設(shè)備在內(nèi)的本地和遠程計算機存儲介質(zhì)中。以上所述僅是本申請的具體實施方式,應(yīng)當指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本申請原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應(yīng)視為本申請的保護范圍。
當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
贡嘎县| 潜山县| 本溪| 柳林县| 尤溪县| 凤阳县| 婺源县| 自贡市| 吴忠市| 阳谷县| 吉安县| 内乡县| 收藏| 宜兴市| 息烽县| 兴文县| 莒南县| 乌鲁木齐市| 吉首市| 洛阳市| 岐山县| 临沧市| 迁西县| 浑源县| 玛多县| 双柏县| 内黄县| 邯郸县| 神木县| 通海县| 营口市| 乃东县| 阿拉尔市| 金塔县| 沧源| 宁城县| 阳城县| 同仁县| 乳源| 股票| 宿松县|