技術(shù)領(lǐng)域
本發(fā)明屬于計算機(jī)領(lǐng)域,尤其涉及一種在移動端進(jìn)行語料對齊的方法及系統(tǒng)。
背景技術(shù):
語料對齊,指把原文,譯文兩個語種的文檔實現(xiàn)句子的一一對應(yīng),也可以實現(xiàn)段落的一一對應(yīng),以形成規(guī)范的語對;
由于在雙語語料中,翻譯人員并不是總是一句一句的翻譯過來,因此可能存在一對多,多對一的情況,甚至是多對多的情況,句子的自動對齊是構(gòu)建雙語語料庫的關(guān)鍵環(huán)節(jié),是利用雙語句對進(jìn)行知識獲取的基礎(chǔ);
雙語語料的對齊技術(shù),業(yè)內(nèi)人士就此提出多種策略和方法,段落對齊還是句子對齊,最后并不是完全對應(yīng);目前一般做法是以表格的展示方式,通過過多的菜單操作來實現(xiàn)拆分,合并,刪除、還原、對齊的語料對齊,但是過多菜單的操作不利于在手機(jī)端的應(yīng)用,不能迎合市場需求;
市場需要一種不需要過多菜單操作就能幫助用戶實現(xiàn)拆分、合并、刪除、還原、對齊的語料對齊系統(tǒng)。
技術(shù)實現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是將語料對齊一般做法是以表格的展示方式,通過過多的菜單操作來實現(xiàn)拆分,合并,刪除、還原、對齊的語料對齊,但是過多菜單的操作不利于在手機(jī)端的應(yīng)用。
為解決上述技術(shù)問題,本發(fā)明提供了一種在移動端進(jìn)行語料對齊的方法,其特征是包括通過拖拽合并語料的步驟、通過拖拽移動語料的步驟、通過點擊拆分語料的步驟、通過點擊刪除語料的步驟、通過拖拽還原語料的步驟,
所述通過拖拽合并語料的步驟,是將選中的語料框拖拽到目標(biāo)語料框中,用于將選中的語料框中的語料內(nèi)容與目標(biāo)語料框中的語料內(nèi)容合并顯示在目標(biāo)語料框中,同時將選中的語料框中的語料內(nèi)容清空;
所述通過拖拽移動語料的步驟,是通過拖拽將選中的語料框在所在列表內(nèi)進(jìn)行位置移動,用以實現(xiàn)原文框和譯文框的對齊,所述位置移動是以語料框為整體進(jìn)行移動,并移動到任意兩個相鄰的語料框之間;
所述通過點擊刪除語料的步驟,是點擊選中的語料框,顯示刪除按鈕,點擊刪除按鈕將語料框中的語料放入回收站;
所述通過拖拽還原語料的步驟包括:在回收站中拖拽被刪除語料,拖拽的同時隱藏回收站,同時在語料框列表的最后一行新增被刪除語料作為隱藏數(shù)據(jù);將被刪除語料拖拽到語料框中或任意兩個語料框之間,同時清空隱藏數(shù)據(jù),顯示回收站,實現(xiàn)被刪除語料的還原;
所述通過點擊拆分語料的步驟,是點擊選中的語料框,彈出半透明遮罩層,并顯示當(dāng)前語料,在拆分的目標(biāo)位置顯示拆分符,通過點擊拆分符進(jìn)行拆分;
所述通過點擊拆分語料的實現(xiàn)方法是:
獲取拆分區(qū)域;
遍歷拆分區(qū)域的語料,添加標(biāo)簽,以及隱藏狀態(tài)的拆分符;
對拆分符綁定點擊觸發(fā)事件,當(dāng)點擊當(dāng)前拆分符時,對當(dāng)前拆分符賦予一個拆分符填充元素,
循環(huán)遍歷拆分區(qū)域內(nèi)的語料直到遇到所述拆分符填充元素,將拆分區(qū)域的語料以所述拆分符填充元素作為拆分節(jié)點進(jìn)行拆分。
進(jìn)一步,所述通過拖拽合并語料的步驟還包括:將選中的語料框拖拽到目標(biāo)語料框中,判斷拖拽的結(jié)束位置,并根據(jù)拖拽的結(jié)束位置決定合并到目標(biāo)語料框中語料的句首或者句尾。
進(jìn)一步,所述拖拽的結(jié)束位置包括語料框的上半部分和語料框的下半部分,如果拖拽的結(jié)束位置是在語料框的上半部分,則將選中的語料框中的語料合并到目標(biāo)語料框中語料的句首,如果拖拽的結(jié)束位置是在語料框的下半部分,則將選中的語料框中的語料合并到目標(biāo)語料框中語料的句尾。
進(jìn)一步,所述語料框的上半部分和語料框的下半部分是通過獲取語料框在垂直方向上的中間位置,以垂直方向上的中間位置為界線劃分形成的。
進(jìn)一步,所述通過拖拽移動語料的步驟, 是通過計算兩個語料框之間觸發(fā)位移事件的區(qū)域來實現(xiàn)的,所述計算兩個語料框之間觸發(fā)位移事件的區(qū)域包括:分別循環(huán)遍歷左右兩側(cè)語料,根據(jù)偏移量來計算兩句之間區(qū)域的左、上、右、下四個點位置,存在二維數(shù)組中。
本發(fā)明還提供一種在移動端進(jìn)行語料對齊的系統(tǒng),其特征是包括語料框界面,還包括拖拽合并模塊、拖拽位移模塊、點擊拆分模塊、點擊刪除模塊、拖拽還原模塊;
所述語料框界面包括語料框列表和回收站,所述語料框列表包括原文框列表和譯文框列表,
所述原文框列表包括若干個原文框,所述原文框是以原文為內(nèi)容的語料框,
所述譯文框列表包括若干個譯文框,所述譯文框是以譯文為內(nèi)容的語料框;
所述拖拽合并模塊,用于通過將選中的語料框拖拽到目標(biāo)語料框中,實現(xiàn)將選中的語料框中的語料內(nèi)容與目標(biāo)語料框中的語料內(nèi)容合并顯示在目標(biāo)語料框中,同時將選中的語料框中的語料內(nèi)容清空;
所述拖拽位移模塊,用于通過拖拽將選中的語料框在所在列表內(nèi)進(jìn)行位置移動,用以實現(xiàn)原文框和譯文框的對齊,所述位置移動是以語料框為整體進(jìn)行移動,并移動到任意兩個相鄰的語料框之間;
所述點擊刪除模塊,用于通過點擊選中的語料框,顯示刪除按鈕,點擊刪除按鈕將語料框中的語料放入回收站;
所述拖拽還原模塊,用于通過在回收站中拖拽被刪除語料,拖拽的同時隱藏回收站,同時在語料框列表的最后一行新增被刪除語料作為隱藏數(shù)據(jù);將被刪除語料拖拽到語料框中或任意兩個語料框之間,同時清空隱藏數(shù)據(jù),顯示回收站,實現(xiàn)被刪除語料的還原;
所述點擊拆分模塊,用于通過點擊選中語料框,彈出半透明遮罩層,并顯示當(dāng)前語料,在拆分的目標(biāo)位置顯示拆分符,點擊拆分符以實現(xiàn)語料拆分;
所述點擊拆分模塊,用于通過步驟一、步驟二、步驟三、步驟四實現(xiàn)語料框的點擊拆分,
所述步驟一為:獲取拆分區(qū)域;
所述步驟二為:遍歷拆分區(qū)域的語料,添加標(biāo)簽,以及隱藏狀態(tài)的拆分符;
所述步驟三為:對拆分符綁定點擊觸發(fā)事件,當(dāng)點擊當(dāng)前拆分符時,對當(dāng)前拆分符賦予一個拆分符填充元素;
所述步驟四為:循環(huán)遍歷拆分區(qū)域內(nèi)的語料直到遇到所述拆分符填充元素,將拆分區(qū)域的語料以所述拆分符填充元素作為拆分節(jié)點進(jìn)行拆分。
進(jìn)一步,所述拖拽合并模塊,還用于通過判斷拖拽的結(jié)束位置,將選中的語料框中的內(nèi)容合并到目標(biāo)語料框中語料的句首或者句尾;
進(jìn)一步,所述拖拽的結(jié)束位置包括語料框的上半部分和語料框的下半部分,用于判斷如果拖拽的結(jié)束位置是在語料框的上半部分,則合并到目標(biāo)語料框中語料的句首,如果拖拽的結(jié)束位置是在語料框的下半部分,則合并到目標(biāo)語料框中語料的句尾。
進(jìn)一步,所述語料框的上半部分和語料框的下半部分是通過獲取語料框在垂直方向上的中間位置,以垂直方向上的中間位置為界線劃分形成的。
進(jìn)一步,所述拖拽位移模塊, 用于通過分別循環(huán)遍歷左右兩側(cè)語料,根據(jù)偏移量計算兩句之間區(qū)域的左、上、右、下四個點位置,存在二維數(shù)組中計算兩個語料框之間觸發(fā)位移事件的區(qū)域,還用于通過計算兩個語料框之間觸發(fā)位移事件的區(qū)域?qū)崿F(xiàn)位置移動。
采用上述技術(shù)方案,可達(dá)到以下效果:不需要過多菜單操作僅僅需要拖拽或者點擊就能幫助用戶實現(xiàn)語料的拆分、合并、刪除、還原、對齊,提高了用戶體驗,方便了手機(jī)端的操作。
附圖說明
此處所說明的附圖用來提供對本發(fā)明的進(jìn)一步理解,構(gòu)成本申請的一部分,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中:
圖1示出了一種在移動端進(jìn)行語料對齊的方法的流程示意圖;
圖2示出了一種在移動端進(jìn)行語料對齊的系統(tǒng)的功能結(jié)構(gòu)框圖。
具體實施方式
下面結(jié)合附圖和具體實施方式對本發(fā)明的技術(shù)方案作進(jìn)一步具體說明。
為解決上述技術(shù)問題,本發(fā)明提供了一種在移動端進(jìn)行語料對齊的方法,如圖1所示,
其特征是包括通過拖拽合并語料的步驟、通過拖拽移動語料的步驟、通過點擊拆分語料的步驟、通過點擊刪除語料的步驟、通過拖拽還原語料的步驟,
所述通過拖拽合并語料的步驟,是將選中的語料框拖拽到目標(biāo)語料框中,用于將選中的語料框中的語料內(nèi)容與目標(biāo)語料框中的語料內(nèi)容合并顯示在目標(biāo)語料框中,同時將選中的語料框中的語料內(nèi)容清空;
所述通過拖拽移動語料的步驟,是通過拖拽將選中的語料框在所在列表內(nèi)進(jìn)行位置移動,用以實現(xiàn)原文框和譯文框的對齊,所述位置移動是以語料框為整體進(jìn)行移動,并移動到任意兩個相鄰的語料框之間;
所述通過點擊拆分語料的步驟,是點擊選中的語料框,彈出半透明遮罩層,并顯示當(dāng)前語料,在拆分的目標(biāo)位置顯示拆分符,點擊拆分符進(jìn)行拆分;
所述通過點擊刪除語料的步驟,是點擊選中的語料框,顯示刪除按鈕,點擊刪除按鈕將語料框中的語料放入回收站;
所述通過拖拽還原語料的步驟包括: 在回收站中拖拽被刪除語料,拖拽的同時隱藏回收站,同時在語料框列表的最后一行新增被刪除語料作為隱藏數(shù)據(jù);將被刪除語料拖拽到語料框中或任意兩個語料框之間,同時清空隱藏數(shù)據(jù),顯示回收站,實現(xiàn)被刪除語料的還原;
所述通過點擊拆分語料的步驟,是點擊選中的語料框,彈出半透明遮罩層,并顯示當(dāng)前語料,在拆分的目標(biāo)位置顯示拆分符,通過點擊拆分符進(jìn)行拆分;
所述通過點擊拆分語料的實現(xiàn)方法是:
獲取拆分區(qū)域;
遍歷拆分區(qū)域的語料,添加標(biāo)簽,以及隱藏狀態(tài)的拆分符;
對拆分符綁定點擊觸發(fā)事件,當(dāng)點擊當(dāng)前拆分符時,對當(dāng)前拆分符賦予一個拆分符填充元素;
循環(huán)遍歷拆分區(qū)域內(nèi)的語料直到遇到所述拆分符填充元素,將拆分區(qū)域的語料以所述拆分符填充元素作為拆分節(jié)點進(jìn)行拆分。
進(jìn)一步,所述通過拖拽合并語料的步驟還包括:將選中的語料框拖拽到目標(biāo)語料框中,判斷拖拽的結(jié)束位置,并根據(jù)拖拽的結(jié)束位置決定合并到目標(biāo)語料框中語料的句首或者句尾。
進(jìn)一步,所述拖拽的結(jié)束位置包括語料框的上半部分和語料框的下半部分,如果拖拽的結(jié)束位置是在語料框的上半部分,則將選中的語料框中的語料合并到目標(biāo)語料框中語料的句首,如果拖拽的結(jié)束位置是在語料框的下半部分,則將選中的語料框中的語料合并到目標(biāo)語料框中語料的句尾。
進(jìn)一步,所述語料框的上半部分和語料框的下半部分是通過獲取語料框在垂直方向上的中間位置,以垂直方向上的中間位置為界線劃分形成的。
進(jìn)一步,所述通過拖拽移動語料的步驟, 是通過計算兩個語料框之間觸發(fā)位移事件的區(qū)域來實現(xiàn)的,所述計算兩個語料框之間觸發(fā)位移事件的區(qū)域包括:分別循環(huán)遍歷左右兩側(cè)語料,根據(jù)偏移量來計算兩句之間區(qū)域的左、上、右、下四個點位置,存在二維數(shù)組中。
為解決上述技術(shù)問題,本發(fā)明還提供了一種在移動端進(jìn)行語料對齊的系統(tǒng),如圖2示,
其特征是包括語料框界面,還包括拖拽合并模塊、拖拽位移模塊、點擊拆分模塊、點擊刪除模塊、拖拽還原模塊;
所述語料框界面包括語料框列表和回收站,所述語料框列表包括原文框列表和譯文框列表,
所述原文框列表包括若干個原文框,所述原文框是以原文為內(nèi)容的語料框,
所述譯文框列表包括若干個譯文框,所述譯文框是以譯文為內(nèi)容的語料框;
所述拖拽合并模塊,用于通過將選中的語料框拖拽到目標(biāo)語料框中,實現(xiàn)將選中的語料框中的語料內(nèi)容與目標(biāo)語料框中的語料內(nèi)容合并顯示在目標(biāo)語料框中,同時將選中的語料框中的語料內(nèi)容清空;
所述拖拽位移模塊,用于通過拖拽將選中的語料框在所在列表內(nèi)進(jìn)行位置移動,用以實現(xiàn)原文框和譯文框的對齊,所述位置移動是以語料框為整體進(jìn)行移動,并移動到任意兩個相鄰的語料框之間;
所述點擊拆分模塊,用于通過點擊選中的語料框,彈出半透明遮罩層,并顯示當(dāng)前語料,在拆分的目標(biāo)位置顯示拆分符,點擊拆分符進(jìn)行拆分;
所述點擊刪除模塊,用于通過點擊選中的語料框,顯示刪除按鈕,點擊刪除按鈕將語料框中的語料放入回收站;
所述拖拽還原模塊,用于通過在回收站中拖拽被刪除語料,拖拽的同時隱藏回收站,同時在語料框列表的最后一行新增被刪除語料作為隱藏數(shù)據(jù);將被刪除語料拖拽到語料框中或任意兩個語料框之間,同時清空隱藏數(shù)據(jù),顯示回收站,實現(xiàn)被刪除語料的還原;
所述點擊拆分模塊,用于通過點擊選中語料框,彈出半透明遮罩層,并顯示當(dāng)前語料,在拆分的目標(biāo)位置顯示拆分符,點擊拆分符以實現(xiàn)語料拆分;
所述點擊拆分模塊,用于通過步驟一、步驟二、步驟三、步驟四實現(xiàn)語料框的點擊拆分,
所述步驟一為:獲取拆分區(qū)域;
所述步驟二為:遍歷拆分區(qū)域的語料,添加標(biāo)簽,以及隱藏狀態(tài)的拆分符;
所述步驟三為:對拆分符綁定點擊觸發(fā)事件,當(dāng)點擊當(dāng)前拆分符時,對當(dāng)前拆分符賦予一個拆分符填充元素;
所述步驟四為:循環(huán)遍歷拆分區(qū)域內(nèi)的語料直到遇到所述拆分符填充元素,將拆分區(qū)域的語料以所述拆分符填充元素作為拆分節(jié)點進(jìn)行拆分。
進(jìn)一步,所述拖拽合并模塊,還用于通過判斷拖拽的結(jié)束位置,將選中的語料框中的內(nèi)容合并到目標(biāo)語料框中語料的句首或者句尾;
進(jìn)一步,所述拖拽的結(jié)束位置包括語料框的上半部分和語料框的下半部分,用于判斷如果拖拽的結(jié)束位置是在語料框的上半部分,則合并到目標(biāo)語料框中語料的句首,如果拖拽的結(jié)束位置是在語料框的下半部分,則合并到目標(biāo)語料框中語料的句尾。
進(jìn)一步,所述語料框的上半部分和語料框的下半部分是通過獲取語料框在垂直方向上的中間位置,以垂直方向上的中間位置為界線劃分形成的。
進(jìn)一步,所述拖拽位移模塊, 用于通過分別循環(huán)遍歷左右兩側(cè)語料,根據(jù)偏移量計算兩句之間區(qū)域的左、上、右、下四個點位置,存在二維數(shù)組中計算兩個語料框之間觸發(fā)位移事件的區(qū)域,還用于通過計算兩個語料框之間觸發(fā)位移事件的區(qū)域?qū)崿F(xiàn)位置移動。
本領(lǐng)域技術(shù)人員還應(yīng)當(dāng)理解,以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。