本申請(qǐng)涉及大數(shù)據(jù)處理,尤其涉及一種題目生成方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀介質(zhì)。
背景技術(shù):
1、在現(xiàn)有的教育環(huán)境中,講師通常需要手動(dòng)從教材或講義中挑選題目,這個(gè)過(guò)程費(fèi)時(shí)且容易出錯(cuò)。一些題庫(kù)管理系統(tǒng),它們可以幫助講師存儲(chǔ)和管理已經(jīng)準(zhǔn)備好的題目。然而,這些系統(tǒng)通常缺乏智能抽取功能,不能自動(dòng)從原始文本中生成題目。此外,一些系統(tǒng)可能提供了題目的自動(dòng)生成,但往往缺乏對(duì)文本內(nèi)容的深入理解,無(wú)法根據(jù)章節(jié)和段落內(nèi)容智能地生成不同類(lèi)型的題目。題目生成質(zhì)量差、效率低。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本申請(qǐng)實(shí)施例提供一種題目生成方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀介質(zhì),能夠解決現(xiàn)有的題目生成質(zhì)量差、效率低的問(wèn)題。
2、為實(shí)現(xiàn)上述目的,根據(jù)本申請(qǐng)實(shí)施例的一個(gè)方面,提供了一種題目生成方法,包括:接收題目生成請(qǐng)求,獲取目標(biāo)文本;將目標(biāo)文本拆分為各個(gè)段落,基于各個(gè)段落抽取問(wèn)答對(duì);確定問(wèn)答對(duì)中的答案的長(zhǎng)度和可拆分屬性,根據(jù)長(zhǎng)度、可拆分屬性和預(yù)設(shè)閾值,確定問(wèn)答對(duì)中的答案的類(lèi)型,根據(jù)類(lèi)型對(duì)答案進(jìn)行拆分,以得到各個(gè)拆分答案;基于各個(gè)拆分答案,生成目標(biāo)題型的候選答案集合;生成混淆答案,進(jìn)而根據(jù)目標(biāo)題型、問(wèn)答對(duì)、候選答案集合、混淆答案,生成目標(biāo)題目。
3、可選地,基于各個(gè)段落抽取問(wèn)答對(duì),包括:調(diào)用大模型以識(shí)別各個(gè)段落中的問(wèn)句,提取識(shí)別出的問(wèn)句中的關(guān)鍵詞;將關(guān)鍵詞與各個(gè)段落中的候選答案進(jìn)行語(yǔ)義相似度匹配,以確定匹配答案;將問(wèn)句與匹配答案組合成問(wèn)答對(duì),抽取問(wèn)答對(duì)。
4、可選地,預(yù)設(shè)閾值包括第一預(yù)設(shè)閾值和第二預(yù)設(shè)閾值,第一預(yù)設(shè)閾值小于或等于第二預(yù)設(shè)閾值,確定問(wèn)答對(duì)中的答案的類(lèi)型,包括:響應(yīng)于長(zhǎng)度小于第一預(yù)設(shè)閾值并且可拆分屬性為可拆分,確定問(wèn)答對(duì)中的答案類(lèi)型為可拆分短答案;響應(yīng)于長(zhǎng)度小于第一預(yù)設(shè)閾值并且可拆分屬性為不可拆分,確定問(wèn)答對(duì)中的答案類(lèi)型為不可拆分短答案;響應(yīng)于長(zhǎng)度大于第二設(shè)閾值并且可拆分屬性為不可拆分,確定問(wèn)答對(duì)中的答案類(lèi)型為不可拆分長(zhǎng)答案。
5、可選地,根據(jù)類(lèi)型對(duì)答案進(jìn)行拆分,以得到各個(gè)拆分答案,包括:響應(yīng)于類(lèi)型為可拆分短答案,基于答案中包含的可拆分維度對(duì)答案進(jìn)行拆分,以得到各個(gè)拆分答案。
6、可選地,基于各個(gè)拆分答案,生成目標(biāo)題型的候選答案集合,包括:將各個(gè)拆分答案加入至由可拆分短答案對(duì)應(yīng)的題型的候選答案集合中,以得到可拆分短答案對(duì)應(yīng)的題型對(duì)應(yīng)的更新后的候選答案集合。
7、可選地,生成混淆答案,包括:根據(jù)目標(biāo)題型中的選擇題和判斷題、候選答案集合和目標(biāo)段落信息,生成混淆答案。
8、可選地,生成目標(biāo)題目,包括:調(diào)用目標(biāo)題型對(duì)應(yīng)的題目生成模板,從問(wèn)答對(duì)、候選答案集合和混淆答案中提取與題目生成模板中的占位符相應(yīng)的信息并將信息替換相應(yīng)的占位符,以生成目標(biāo)題目。
9、另外,本申請(qǐng)還提供了一種題目生成裝置,包括:接收單元,被配置成接收題目生成請(qǐng)求,獲取目標(biāo)文本;抽取單元,被配置成將目標(biāo)文本拆分為各個(gè)段落,基于各個(gè)段落抽取問(wèn)答對(duì);拆分單元,被配置成確定問(wèn)答對(duì)中的答案的長(zhǎng)度和可拆分屬性,根據(jù)長(zhǎng)度、可拆分屬性和預(yù)設(shè)閾值,確定問(wèn)答對(duì)中的答案的類(lèi)型,根據(jù)類(lèi)型對(duì)答案進(jìn)行拆分,以得到各個(gè)拆分答案;候選答案集合生成單元,被配置成基于各個(gè)拆分答案,生成目標(biāo)題型的候選答案集合;目標(biāo)題目生成單元,被配置成生成混淆答案,進(jìn)而根據(jù)目標(biāo)題型、問(wèn)答對(duì)、候選答案集合、混淆答案,生成目標(biāo)題目。
10、可選地,抽取單元進(jìn)一步被配置成:調(diào)用大模型以識(shí)別各個(gè)段落中的問(wèn)句,提取識(shí)別出的問(wèn)句中的關(guān)鍵詞;將關(guān)鍵詞與各個(gè)段落中的候選答案進(jìn)行語(yǔ)義相似度匹配,以確定匹配答案;將問(wèn)句與匹配答案組合成問(wèn)答對(duì),抽取問(wèn)答對(duì)。
11、可選地,預(yù)設(shè)閾值包括第一預(yù)設(shè)閾值和第二預(yù)設(shè)閾值,第一預(yù)設(shè)閾值小于或等于第二預(yù)設(shè)閾值,拆分單元進(jìn)一步被配置成:響應(yīng)于長(zhǎng)度小于第一預(yù)設(shè)閾值并且可拆分屬性為可拆分,確定問(wèn)答對(duì)中的答案類(lèi)型為可拆分短答案;響應(yīng)于長(zhǎng)度小于第一預(yù)設(shè)閾值并且可拆分屬性為不可拆分,確定問(wèn)答對(duì)中的答案類(lèi)型為不可拆分短答案;響應(yīng)于長(zhǎng)度大于第二設(shè)閾值并且可拆分屬性為不可拆分,確定問(wèn)答對(duì)中的答案類(lèi)型為不可拆分長(zhǎng)答案。
12、可選地,拆分單元進(jìn)一步被配置成:響應(yīng)于類(lèi)型為可拆分短答案,基于答案中包含的可拆分維度對(duì)答案進(jìn)行拆分,以得到各個(gè)拆分答案。
13、可選地,候選答案集合生成單元進(jìn)一步被配置成:將各個(gè)拆分答案加入至由可拆分短答案對(duì)應(yīng)的題型的候選答案集合中,以得到可拆分短答案對(duì)應(yīng)的題型對(duì)應(yīng)的更新后的候選答案集合。
14、可選地,目標(biāo)題目生成單元進(jìn)一步被配置成:根據(jù)目標(biāo)題型中的選擇題和判斷題、候選答案集合和目標(biāo)段落信息,生成混淆答案。
15、可選地,目標(biāo)題目生成單元進(jìn)一步被配置成:調(diào)用目標(biāo)題型對(duì)應(yīng)的題目生成模板,從問(wèn)答對(duì)、候選答案集合和混淆答案中提取與題目生成模板中的占位符相應(yīng)的信息并將信息替換相應(yīng)的占位符,以生成目標(biāo)題目。
16、另外,本申請(qǐng)還提供了一種題目生成電子設(shè)備,包括:一個(gè)或多個(gè)處理器;存儲(chǔ)裝置,用于存儲(chǔ)一個(gè)或多個(gè)程序,當(dāng)一個(gè)或多個(gè)程序被一個(gè)或多個(gè)處理器執(zhí)行,使得一個(gè)或多個(gè)處理器實(shí)現(xiàn)如上述的題目生成方法。
17、另外,本申請(qǐng)還提供了一種計(jì)算機(jī)可讀介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述的題目生成方法。
18、為實(shí)現(xiàn)上述目的,根據(jù)本申請(qǐng)實(shí)施例的又一個(gè)方面,提供了一種計(jì)算機(jī)程序產(chǎn)品。
19、本申請(qǐng)實(shí)施例的一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)本申請(qǐng)實(shí)施例提供的題目生成方法。
20、上述發(fā)明中的一個(gè)實(shí)施例具有如下優(yōu)點(diǎn)或有益效果:本申請(qǐng)通過(guò)接收題目生成請(qǐng)求,獲取目標(biāo)文本;將目標(biāo)文本拆分為各個(gè)段落,基于各個(gè)段落抽取問(wèn)答對(duì);確定問(wèn)答對(duì)中的答案的長(zhǎng)度和可拆分屬性,根據(jù)長(zhǎng)度、可拆分屬性和預(yù)設(shè)閾值,確定問(wèn)答對(duì)中的答案的類(lèi)型,根據(jù)類(lèi)型對(duì)答案進(jìn)行拆分,以得到各個(gè)拆分答案;基于各個(gè)拆分答案,生成目標(biāo)題型的候選答案集合;生成混淆答案,進(jìn)而根據(jù)目標(biāo)題型、問(wèn)答對(duì)、候選答案集合、混淆答案,生成目標(biāo)題目。提高基于文本的題目生成質(zhì)量和效率。
21、上述的非慣用的可選方式所具有的進(jìn)一步效果將在下文中結(jié)合具體實(shí)施方式加以說(shuō)明。
1.一種題目生成方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于所述各個(gè)段落抽取問(wèn)答對(duì),包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述預(yù)設(shè)閾值包括第一預(yù)設(shè)閾值和第二預(yù)設(shè)閾值,所述第一預(yù)設(shè)閾值小于或等于所述第二預(yù)設(shè)閾值,所述確定所述問(wèn)答對(duì)中的答案的類(lèi)型,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述類(lèi)型對(duì)所述答案進(jìn)行拆分,以得到各個(gè)拆分答案,包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于所述各個(gè)拆分答案,生成目標(biāo)題型的候選答案集合,包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述生成混淆答案,包括:
7.根據(jù)權(quán)利要求1~6中任一項(xiàng)所述的方法,其特征在于,所述生成目標(biāo)題目,包括:
8.一種題目生成裝置,其特征在于,包括:
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述抽取單元進(jìn)一步被配置成:
10.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述預(yù)設(shè)閾值包括第一預(yù)設(shè)閾值和第二預(yù)設(shè)閾值,所述第一預(yù)設(shè)閾值小于或等于所述第二預(yù)設(shè)閾值,所述拆分單元進(jìn)一步被配置成:
11.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述拆分單元進(jìn)一步被配置成:
12.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述候選答案集合生成單元進(jìn)一步被配置成:
13.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述目標(biāo)題目生成單元進(jìn)一步被配置成:
14.一種題目生成電子設(shè)備,其特征在于,包括:
15.一種計(jì)算機(jī)可讀介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-7中任一項(xiàng)所述的方法。
16.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-7中任一項(xiàng)所述的方法。