1.一種文本查重并突出顯示的方法,其特征在于,包括:
2.根據(jù)權利要求1所述的文本查重并突出顯示的方法,其特征在于,所述接收目標文本,對所述目標文本進行結構化解析,分離出原始格式和第一純文本,包括:
3.根據(jù)權利要求1所述的文本查重并突出顯示的方法,其特征在于,所述基于第一長度閾值和第二長度閾值,對所述多個句子進行長度標準化,得到多個標準短句,包括:
4.根據(jù)權利要求1所述的文本查重并突出顯示的方法,其特征在于,在所述基于第一長度閾值和第二長度閾值,對所述多個句子進行長度標準化,得到多個標準短句之前,還包括:
5.根據(jù)權利要求4所述的文本查重并突出顯示的方法,其特征在于,所述調整倍數(shù)的計算公式如下:
6.根據(jù)權利要求1所述的文本查重并突出顯示的方法,其特征在于,所述根據(jù)所述起止位置在所述第一純文本中添加突出顯示標記,形成帶有突出顯示標記的文本結構,包括:
7.根據(jù)權利要求6所述的文本查重并突出顯示的方法,其特征在于,所述一對內聯(lián)樣式標簽包括開始標簽和結束標簽。
8.一種計算機裝置,其特征在于,所述計算機裝置包括:
9.一種計算機可讀存儲介質,其特征在于,該計算機可讀存儲介質存儲計算機指令,該計算機指令用于使計算機執(zhí)行權利要求1-7任一所述的文本查重并突出顯示的方法。
10.一種計算機程序產(chǎn)品,包括計算機指令,其特征在于,該計算機指令被處理器執(zhí)行時實現(xiàn)權利要求1-7任一項所述方法的步驟。