欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

結(jié)構(gòu)化數(shù)據(jù)生成方法及裝置與流程

文檔序號(hào):11276410閱讀:439來源:國知局
結(jié)構(gòu)化數(shù)據(jù)生成方法及裝置與流程

本申請(qǐng)涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種結(jié)構(gòu)化數(shù)據(jù)生成方法及裝置。



背景技術(shù):

隨著信息化的發(fā)展,電子文檔的類型和數(shù)量越來越多,目前常用的電子文檔的類型有doc、pdf、超文本標(biāo)記語言(hypertextmark-uplanguage,html)等等,由于電子文檔的類型非常豐富,用戶可以根據(jù)各自的喜好選擇電子文檔的類型來生成電子文檔,例如,在有大量服裝加工廠的驗(yàn)廠報(bào)告中,不同的驗(yàn)廠機(jī)構(gòu)會(huì)采用不同類型的電子文檔來描述被驗(yàn)工廠的信息。

有時(shí),用戶需要將海量的電子文檔進(jìn)行對(duì)比,提取出符合設(shè)定匹配規(guī)則的結(jié)構(gòu)化數(shù)據(jù),例如,從大量服裝加工廠的驗(yàn)廠報(bào)告中提取出符合設(shè)定匹配規(guī)則的結(jié)構(gòu)化數(shù)據(jù),以便從中快速篩選出符合條件的工廠,雖然海量的驗(yàn)廠報(bào)告均描述服裝加工廠的情況,但由于驗(yàn)廠報(bào)告的類型不同,目前只能依靠人工來瀏覽每個(gè)驗(yàn)廠報(bào)告,從中獲取符合設(shè)定匹配規(guī)則的數(shù)據(jù),再錄入表格中生成結(jié)構(gòu)化數(shù)據(jù)。

上述通過人工生成結(jié)構(gòu)化數(shù)據(jù)的方式,生成效率低下,且容易出現(xiàn)人為錯(cuò)誤,準(zhǔn)確性較差。



技術(shù)實(shí)現(xiàn)要素:

本申請(qǐng)實(shí)施例提供一種結(jié)構(gòu)化數(shù)據(jù)生成方法及裝置,用以解決相關(guān)結(jié)構(gòu)化數(shù)據(jù)生成方式中存在的生成效率低下,且容易出現(xiàn)人為錯(cuò)誤,準(zhǔn)確性較差的問題。

根據(jù)本申請(qǐng)實(shí)施例,提供一種結(jié)構(gòu)化數(shù)據(jù)生成方法,包括:

獲取待解析電子文檔的文本模式;

從所述待解析電子文檔的文本模式中提取符合設(shè)定匹配規(guī)則的數(shù)據(jù);

將提取的數(shù)據(jù)生成結(jié)構(gòu)化數(shù)據(jù)。

可選的,還包括:

接收用戶提供的統(tǒng)一資源定位符url地址;

獲取所述url地址對(duì)應(yīng)的原始電子文檔;

從所述原始電子文檔中選取待解析電子文檔。

具體的,從所述原始電子文檔中選取待解析電子文檔,具體包括:

確定與所述原始電子文檔的后綴文件名對(duì)應(yīng)的驗(yàn)證工具,得到所述原始電子文檔的驗(yàn)證工具;

使用所述原始電子文檔的驗(yàn)證工具驗(yàn)證所述原始電子文檔;

獲取通過驗(yàn)證的原始電子文檔,得到待解析電子文檔。

可選的,還包括:

在所述待解析電子文檔中添加第一設(shè)定標(biāo)識(shí)。

具體的,獲取待解析電子文檔的文本模式,具體包括:

確定與所述待解析電子文檔的后綴文件名對(duì)應(yīng)的提取工具,得到所述待解析電子文檔的提取工具;

使用所述待解析電子文檔的提取工具提取所述待解析電子文檔中的文字部分;

獲取所述待解析電子文檔中的文字部分,得到所述待解析電子文檔的文本模式。

具體的,從所述待解析電子文檔的文本模式中提取符合設(shè)定匹配規(guī)則的數(shù)據(jù),具體包括:

將所述待解析電子文檔的文本模式逐詞匹配所述設(shè)定匹配規(guī)則;

獲取所述待解析電子文檔的文本模式中與所述設(shè)定匹配規(guī)則匹配的詞,得到符合所述設(shè)定匹配規(guī)則的數(shù)據(jù)。

可選的,還包括:

在完成與所述設(shè)定匹配規(guī)則匹配的待解析電子文檔中添加第二設(shè)定標(biāo)識(shí)。

具體的,將提取的數(shù)據(jù)生成結(jié)構(gòu)化數(shù)據(jù),具體包括:

以表格的形式在頁面中展示提取的數(shù)據(jù)。

根據(jù)本申請(qǐng)實(shí)施例,還提供一種結(jié)構(gòu)化數(shù)據(jù)生成裝置,包括:

第一獲取模塊,用于獲取待解析電子文檔的文本模式;

提取模塊,用于從所述待解析電子文檔的文本模式中提取符合設(shè)定匹配規(guī)則的數(shù)據(jù);

生成模塊,用于將提取的數(shù)據(jù)生成結(jié)構(gòu)化數(shù)據(jù)。

可選的,還包括:

接收模塊,用于接收用戶提供的統(tǒng)一資源定位符url地址;

第二獲取模塊,用于獲取所述url地址對(duì)應(yīng)的原始電子文檔;

選取模塊,用于從所述原始電子文檔中選取待解析電子文檔。

具體的,所述選取模塊,用于從所述原始電子文檔中選取待解析電子文檔,具體用于:

確定與所述原始電子文檔的后綴文件名對(duì)應(yīng)的驗(yàn)證工具,得到所述原始電子文檔的驗(yàn)證工具;

使用所述原始電子文檔的驗(yàn)證工具驗(yàn)證所述原始電子文檔;

獲取通過驗(yàn)證的原始電子文檔,得到待解析電子文檔。

可選的,還包括:

第一添加模塊,用于在所述待解析電子文檔中添加第一設(shè)定標(biāo)識(shí)。

具體的,所述第一獲取模塊,用于獲取待解析電子文檔的文本模式,具體用于:

確定與所述待解析電子文檔的后綴文件名對(duì)應(yīng)的提取工具,得到所述待解析電子文檔的提取工具;

使用所述待解析電子文檔的提取工具提取所述待解析電子文檔中的文字部分;

獲取所述待解析電子文檔中的文字部分,得到所述待解析電子文檔的文本模式。

具體的,所述提取模塊,用于從所述待解析電子文檔的文本模式中提取符合設(shè)定匹配規(guī)則的數(shù)據(jù),具體用于:

將所述待解析電子文檔的文本模式逐詞匹配所述設(shè)定匹配規(guī)則;

獲取所述待解析電子文檔的文本模式中與所述設(shè)定匹配規(guī)則匹配的詞,得到符合所述設(shè)定匹配規(guī)則的數(shù)據(jù)。

可選的,還包括:

第二添加模塊,用于在完成與所述設(shè)定匹配規(guī)則匹配的待解析電子文檔中添加第二設(shè)定標(biāo)識(shí)。

具體的,所述生成模塊,用于將提取的數(shù)據(jù)生成結(jié)構(gòu)化數(shù)據(jù),具體用于:

以表格的形式在頁面中展示提取的數(shù)據(jù)。

本申請(qǐng)實(shí)施例提供一種結(jié)構(gòu)化數(shù)據(jù)生成方法及裝置,獲取待解析電子文檔的文本模式;從所述待解析電子文檔的文本模式中提取符合設(shè)定匹配規(guī)則的數(shù)據(jù);將提取的數(shù)據(jù)生成結(jié) 構(gòu)化數(shù)據(jù)。該方案中,通過獲取待解析電子文檔的文本模式,從待解析電子文檔的文本模式中提取符合設(shè)定匹配規(guī)則的數(shù)據(jù),然后將提取的數(shù)據(jù)生成結(jié)構(gòu)化數(shù)據(jù),從而實(shí)現(xiàn)自動(dòng)生成結(jié)構(gòu)化數(shù)據(jù),相對(duì)于相關(guān)技術(shù)中采用人工生成結(jié)構(gòu)化數(shù)據(jù)的方式,生成效率很高,能夠有效避免人為錯(cuò)誤,準(zhǔn)確性較好,即使待解析電子文檔是海量的不同格式的電子文檔,也能快速、準(zhǔn)確地生成結(jié)構(gòu)化數(shù)據(jù)。

附圖說明

此處所說明的附圖用來提供對(duì)本申請(qǐng)的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本申請(qǐng)的示意性實(shí)施例及其說明用于解釋本申請(qǐng),并不構(gòu)成對(duì)本申請(qǐng)的不當(dāng)限定。在附圖中:

圖1為本申請(qǐng)實(shí)施例中一種結(jié)構(gòu)化數(shù)據(jù)生成方法的流程圖;

圖2為本申請(qǐng)實(shí)施例中另一種結(jié)構(gòu)化數(shù)據(jù)生成方法的流程圖;

圖3為本申請(qǐng)實(shí)施例中結(jié)構(gòu)化數(shù)據(jù)的展示結(jié)果示意圖;

圖4為本申請(qǐng)實(shí)施例中一種結(jié)構(gòu)化數(shù)據(jù)生成裝置的結(jié)構(gòu)示意圖。

具體實(shí)施方式

為了使本申請(qǐng)所要解決的技術(shù)問題、技術(shù)方案及有益效果更加清楚、明白,以下結(jié)合附圖和實(shí)施例,對(duì)本申請(qǐng)進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本申請(qǐng),并不用于限定本申請(qǐng)。

為了解決相關(guān)結(jié)構(gòu)化數(shù)據(jù)生成方式中存在的生成效率低下,且容易出現(xiàn)人為錯(cuò)誤,準(zhǔn)確性較差的問題,本申請(qǐng)實(shí)施例提供一種結(jié)構(gòu)化數(shù)據(jù)生成方法,該方法可以但不限于應(yīng)用在服務(wù)中,該方法的流程如圖1所示,包括如下步驟:

s11:獲取待解析電子文檔的文本模式。

通常,一個(gè)待解析電子文檔中會(huì)包括文字、圖片、表格等等多種類型的數(shù)據(jù),在生成結(jié)構(gòu)化數(shù)據(jù)時(shí),需要的是待解析電子文檔的文字部分,因此,需要獲取待解析電子文檔的文本模式。待解析電子文檔的數(shù)量可以是少量的,也可以是海量的。

s12:從待解析電子文檔的文本模式中提取符合設(shè)定匹配規(guī)則的數(shù)據(jù)。

在生成結(jié)構(gòu)化數(shù)據(jù)時(shí),通常會(huì)預(yù)先設(shè)置設(shè)定匹配規(guī)則,相關(guān)技術(shù)中是采用人工方式從待解析電子文檔中提取與設(shè)定匹配規(guī)則匹配的數(shù)據(jù),而在本申請(qǐng)實(shí)施例中,可以自動(dòng)實(shí)現(xiàn)從待解析電子文檔的文本模式中提取符合設(shè)定匹配規(guī)則的數(shù)據(jù)。

s13:將提取的數(shù)據(jù)生成結(jié)構(gòu)化數(shù)據(jù)。

s12中提取的數(shù)據(jù)是生成結(jié)構(gòu)化數(shù)據(jù)所需要的數(shù)據(jù),因此,直接將s12中提取的數(shù)據(jù)生成結(jié)構(gòu)化數(shù)據(jù)即可。

一種可選的方式,s11-s13中的結(jié)構(gòu)化數(shù)據(jù)生成方法可以采用java編程技術(shù)編寫程序,利用跨平臺(tái)的java虛擬機(jī),通過在java虛擬機(jī)上運(yùn)行該程序,批量獲取不同格式、不同內(nèi)容的海量待解析電子文檔對(duì)應(yīng)的結(jié)構(gòu)化數(shù)據(jù)。

該方案中,通過獲取待解析電子文檔的文本模式,從待解析電子文檔的文本模式中提取符合設(shè)定匹配規(guī)則的數(shù)據(jù),然后將提取的數(shù)據(jù)生成結(jié)構(gòu)化數(shù)據(jù),從而實(shí)現(xiàn)自動(dòng)生成結(jié)構(gòu)化數(shù)據(jù),相對(duì)于相關(guān)技術(shù)中采用人工生成結(jié)構(gòu)化數(shù)據(jù)的方式,生成效率很高,能夠有效避免人為錯(cuò)誤,準(zhǔn)確性較好,即使待解析電子文檔是海量的不同格式的電子文檔,也能快速、準(zhǔn)確地生成結(jié)構(gòu)化數(shù)據(jù)。

根據(jù)本申請(qǐng)實(shí)施例提供另一種結(jié)構(gòu)化數(shù)據(jù)生成方法,該方法的流程如圖2所示,在如圖1所示的方法的基礎(chǔ)上還包括:

s14:接收用戶提供的統(tǒng)一資源定位符(universalresourcelocator,url)地址。

有時(shí),用戶會(huì)將電子文檔保存在網(wǎng)上,這時(shí)用戶只需要提供一個(gè)url地址即可,服務(wù)器可以通過該url地址獲取到需要的電子文檔,這樣不僅可以簡(jiǎn)化用戶的操作,并且可以反復(fù)提取電子文檔。

s15:獲取url地址對(duì)應(yīng)的原始電子文檔。

用戶提供的url地址對(duì)應(yīng)的電子文檔并不一定都是合格的待解析電子文檔,獲取到的電子文檔可以定義為原始電子文檔。

s16:從原始電子文檔中選取待解析電子文檔。

原始電子文檔中可能存在各種問題,例如,有的格式不正確,有的文件不完整,存在問題的原始電子文檔是無法參與生成結(jié)構(gòu)化數(shù)據(jù)的,因此需要提前過濾掉存在問題的電子文檔,剩下的才是可以參與生成結(jié)構(gòu)化數(shù)據(jù)的待解析電子文檔。

具體的,上述s16中從原始電子文檔中選取待解析電子文檔的實(shí)現(xiàn)方式,具體包括:確定與原始電子文檔的后綴文件名對(duì)應(yīng)的驗(yàn)證工具,得到原始電子文檔的驗(yàn)證工具;使用原始電子文檔的驗(yàn)證工具驗(yàn)證原始電子文檔;獲取通過驗(yàn)證的原始電子文檔,得到待解析電子文檔。

不同類型的原始電子文檔可以采用不同的驗(yàn)證工具,使用相應(yīng)的驗(yàn)證工具驗(yàn)證原始電子文檔的完整性和正確性,通過驗(yàn)證的原始電子文檔,即為待解析電子文檔。

一種優(yōu)選的方式,為了避免重復(fù)對(duì)原始電子文檔進(jìn)行驗(yàn)證,可以在待解析電子文檔中添加第一設(shè)定標(biāo)識(shí)。第一設(shè)定標(biāo)識(shí)可以根據(jù)實(shí)際需要進(jìn)行設(shè)定。

具體的,上述s11中獲取待解析電子文檔的文本模式的實(shí)現(xiàn)過程,具體包括:確定與待解析電子文檔的后綴文件名對(duì)應(yīng)的提取工具,得到待解析電子文檔的提取工具;使用待解析電子文檔的提取工具提取待解析電子文檔中的文字部分;獲取待解析電子文檔中的文字部分,得到待解析電子文檔的文本模式。

不同類型的待解析電子文檔可以采用不同的提取工具,待解析電子文檔的不同類型可以通過其后綴文件名來區(qū)分,例如,后綴文件名為“.doc”的待解析電子文檔,可以使用的提取工具為poi組件,后綴文件名為“.pdf”的待解析電子文檔,可以使用的提取工具為itext組件。使用相應(yīng)的提取工具提取待解析電子文檔中的文字部分,從而得到待解析電子文檔的文本模式。

具體的,上述s12中從待解析電子文檔的文本模式中提取符合設(shè)定匹配規(guī)則的數(shù)據(jù)的實(shí)現(xiàn)過程,具體包括:將待解析電子文檔的文本模式逐詞匹配設(shè)定匹配規(guī)則;獲取待解析電子文檔的文本模式中與設(shè)定匹配規(guī)則匹配的詞,得到符合設(shè)定匹配規(guī)則的數(shù)據(jù)。

通過提供待解析電子文檔的設(shè)定匹配規(guī)則,用該設(shè)定匹配規(guī)則與待解析電子文檔逐詞進(jìn)行匹配,若有匹配的詞,則可以得到符合設(shè)定匹配規(guī)則的數(shù)據(jù),直至完成所有待解析電子文檔的解析。

一種可選的方式,為了避免重復(fù)將待解析電子文檔與設(shè)定匹配規(guī)則進(jìn)行匹配,可以在完成與設(shè)定匹配規(guī)則匹配的待解析電子文檔中添加第二設(shè)定標(biāo)識(shí)。第二設(shè)定標(biāo)識(shí)可以根據(jù)實(shí)際需要進(jìn)行設(shè)定。

具體的,上述s13中將提取的數(shù)據(jù)生成結(jié)構(gòu)化數(shù)據(jù)的實(shí)現(xiàn)過程,具體包括:以表格的形式在頁面中展示提取的數(shù)據(jù)。從而便于用戶進(jìn)行比對(duì),篩選。

下面以一個(gè)具體實(shí)例說明上述結(jié)構(gòu)化數(shù)據(jù)生成方法,該方法的應(yīng)用場(chǎng)景是得到海量驗(yàn)廠報(bào)告的結(jié)構(gòu)化數(shù)據(jù)。假設(shè),在有大量服裝加工廠的驗(yàn)廠報(bào)告電子文檔中,由于不同的驗(yàn)廠機(jī)構(gòu)會(huì)采用不同的電子文檔格式,有doc文件、pdf文件、html文件等,并且還采用不同的描述方法來描述被驗(yàn)工廠的信息,這時(shí)就會(huì)迫切需要從各個(gè)驗(yàn)廠機(jī)構(gòu)提供的驗(yàn)廠報(bào)告電子文檔中提取出能對(duì)比的數(shù)據(jù),以便快速的篩選出其中符合條件的工廠。

首先,用戶將各自的驗(yàn)廠報(bào)告電子文檔上傳到互聯(lián)網(wǎng)上,獲取到該驗(yàn)廠報(bào)告電子文檔的url地址,并將該url地址提供給服務(wù)器。

其次,服務(wù)器根據(jù)用戶提供的url地址獲取到原始驗(yàn)廠報(bào)告電子文檔。

然后,服務(wù)器確定與原始驗(yàn)廠報(bào)告電子文檔的后綴文件名對(duì)應(yīng)的驗(yàn)證工具,得到原始 驗(yàn)廠報(bào)告電子文檔的驗(yàn)證工具;使用原始驗(yàn)廠報(bào)告電子文檔的驗(yàn)證工具驗(yàn)證原始驗(yàn)廠報(bào)告電子文檔;獲取通過驗(yàn)證的原始驗(yàn)廠報(bào)告電子文檔,得到待解析驗(yàn)廠報(bào)告電子文檔。

然后,服務(wù)器確定與待解析驗(yàn)廠報(bào)告電子文檔的后綴文件名對(duì)應(yīng)的提取工具,得到待解析驗(yàn)廠報(bào)告電子文檔的提取工具;使用待解析驗(yàn)廠報(bào)告電子文檔的提取工具提取待解析驗(yàn)廠報(bào)告電子文檔中的文字部分;獲取待解析驗(yàn)廠報(bào)告電子文檔中的文字部分,得到待解析驗(yàn)廠報(bào)告電子文檔的文本模式。

然后,服務(wù)器將待解析驗(yàn)廠報(bào)告電子文檔的文本模式逐詞匹配設(shè)定匹配規(guī)則;獲取待解析驗(yàn)廠報(bào)告電子文檔的文本模式中與設(shè)定匹配規(guī)則匹配的詞,得到符合設(shè)定匹配規(guī)則的數(shù)據(jù)。

例如,其中的一條匹配規(guī)則為“(‘電腦’or’電腦控制式’)(‘縫紉’or‘平縫’)機(jī){number}(‘臺(tái)’or‘套’or‘個(gè)’)”,則在待解析驗(yàn)廠報(bào)告電子文檔中若遇到“電腦平縫機(jī)5臺(tái)”、“電腦控制式縫紉機(jī)5套”或“電腦縫紉機(jī)5個(gè)”等都會(huì)作為匹配成功。一旦匹配成功,則會(huì)獲取其中的數(shù)字,并將其存儲(chǔ)到數(shù)據(jù)庫中“電腦平縫機(jī)”對(duì)應(yīng)的字段中。具體匹配結(jié)果參見表1:

表1

最后,以表格的形式在頁面中展示提取的數(shù)據(jù)。具體展示結(jié)果如圖3所示。

至此,不同驗(yàn)廠報(bào)告獲得的不同“電腦平縫機(jī)”數(shù)量等各種維度的參數(shù),將會(huì)很容易的比較、排序,方便用戶進(jìn)行比較,從而篩選出符合條件的工廠。

基于同一發(fā)明構(gòu)思,本申請(qǐng)實(shí)施例還提供一種結(jié)構(gòu)化數(shù)據(jù)生成裝置,該裝置與如圖1所示的結(jié)構(gòu)化數(shù)據(jù)生成方法相對(duì)應(yīng),可以但不限于應(yīng)用在服務(wù)器中,該裝置的結(jié)構(gòu)如4圖所示,包括第一獲取模塊41、提取模塊42和生成模塊43,其中:

上述第一獲取模塊41,用于獲取待解析電子文檔的文本模式;

上述提取模塊42,用于從待解析電子文檔的文本模式中提取符合設(shè)定匹配規(guī)則的數(shù)據(jù);

上述生成模塊43,用于將提取的數(shù)據(jù)生成結(jié)構(gòu)化數(shù)據(jù)。

該方案中,通過獲取待解析電子文檔的文本模式,從待解析電子文檔的文本模式中提取符合設(shè)定匹配規(guī)則的數(shù)據(jù),然后將提取的數(shù)據(jù)生成結(jié)構(gòu)化數(shù)據(jù),從而實(shí)現(xiàn)自動(dòng)生成結(jié)構(gòu)化數(shù)據(jù),相對(duì)于相關(guān)技術(shù)中采用人工生成結(jié)構(gòu)化數(shù)據(jù)的方式,生成效率很高,能夠有效避免人為錯(cuò)誤,準(zhǔn)確性較好,即使待解析電子文檔是海量的不同格式的電子文檔,也能快速、準(zhǔn)確地生成結(jié)構(gòu)化數(shù)據(jù)。

可選的,上述結(jié)構(gòu)化數(shù)據(jù)生成裝置中還包括:

接收模塊,用于接收用戶提供的url地址;

第二獲取模塊,用于獲取url地址對(duì)應(yīng)的原始電子文檔;

選取模塊,用于從原始電子文檔中選取待解析電子文檔。

具體的,上述選取模塊,用于從原始電子文檔中選取待解析電子文檔,具體用于:

確定與原始電子文檔的后綴文件名對(duì)應(yīng)的驗(yàn)證工具,得到原始電子文檔的驗(yàn)證工具;

使用原始電子文檔的驗(yàn)證工具驗(yàn)證原始電子文檔;

獲取通過驗(yàn)證的原始電子文檔,得到待解析電子文檔。

可選的,上述結(jié)構(gòu)化數(shù)據(jù)生成裝置中還包括:

第一添加模塊,用于在待解析電子文檔中添加第一設(shè)定標(biāo)識(shí)。

具體的,上述第一獲取模塊41,用于獲取待解析電子文檔的文本模式,具體用于:

確定與待解析電子文檔的后綴文件名對(duì)應(yīng)的提取工具,得到待解析電子文檔的提取工具;

使用待解析電子文檔的提取工具提取待解析電子文檔中的文字部分;

獲取待解析電子文檔中的文字部分,得到待解析電子文檔的文本模式。

具體的,上述提取模塊42,用于從待解析電子文檔的文本模式中提取符合設(shè)定匹配規(guī)則的數(shù)據(jù),具體用于:

將待解析電子文檔的文本模式逐詞匹配設(shè)定匹配規(guī)則;

獲取待解析電子文檔的文本模式中與設(shè)定匹配規(guī)則匹配的詞,得到符合設(shè)定匹配規(guī)則的數(shù)據(jù)。

可選的,上述結(jié)構(gòu)化數(shù)據(jù)生成裝置中還包括:

第二添加模塊,用于在完成與設(shè)定匹配規(guī)則匹配的待解析電子文檔中添加第二設(shè)定標(biāo)識(shí)。

具體的,上述生成模塊43,用于將提取的數(shù)據(jù)生成結(jié)構(gòu)化數(shù)據(jù),具體用于:

以表格的形式在頁面中展示提取的數(shù)據(jù)。

上述說明示出并描述了本申請(qǐng)的優(yōu)選實(shí)施例,但如前所述,應(yīng)當(dāng)理解本申請(qǐng)并非局限于本文所披露的形式,不應(yīng)看作是對(duì)其他實(shí)施例的排除,而可用于各種其他組合、修改和環(huán)境,并能夠在本文所述發(fā)明構(gòu)想范圍內(nèi),通過上述教導(dǎo)或相關(guān)領(lǐng)域的技術(shù)或知識(shí)進(jìn)行改動(dòng)。而本領(lǐng)域人員所進(jìn)行的改動(dòng)和變化不脫離本申請(qǐng)的精神和范圍,則都應(yīng)在本申請(qǐng)所附權(quán)利要求的保護(hù)范圍內(nèi)。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
静宁县| 淄博市| 象州县| 德清县| 贞丰县| 乌苏市| 汕尾市| 舒城县| 靖州| 阜南县| 运城市| 崇信县| 巢湖市| 江油市| 奉化市| 邳州市| 神农架林区| 满洲里市| 和龙市| 永年县| 台南市| 石棉县| 闽侯县| 平昌县| 东城区| 皋兰县| 财经| 衡东县| 鲁甸县| 孙吴县| 互助| 蓬溪县| 太仓市| 梅州市| 岢岚县| 陆丰市| 扬中市| 民勤县| 陈巴尔虎旗| 建平县| 崇明县|