一種基于海報與劇情介紹的電影類型的快速分類方法
【技術領域】
[0001] 本發(fā)明涉及模式識別領域,特別涉及電影類型的檢測技術。
【背景技術】
[0002] 隨著互聯(lián)網(wǎng)的快速發(fā)展,電影已經(jīng)成為人們業(yè)余生活中不可缺少的一部分。目前 為止、還沒有對電影的種類做出統(tǒng)一的規(guī)定,電影的類別大體分為:恐怖、愛情、動作、喜劇、 科幻等等。電影網(wǎng)站上都會人工給電影標上類別標簽,所以、實現(xiàn)電影的快速分類是很有必 要。
[0003] 電影類型的檢測基本上都是基于視頻內(nèi)容本身來檢測。視頻內(nèi)容的檢測包括:鏡 頭邊界的檢測、鏡頭視頻關鍵幀的檢測和音頻特征的檢測。鏡頭邊界檢測的基本假設是相 鄰兩個鏡頭的內(nèi)容存在較大的差異。因此,可以通過測量相鄰幀之間的差異程度來確定鏡 頭的邊界。鏡頭視頻關鍵幀的特征包括:視頻關鍵幀的顏色、對比度、明亮度、紋理等特征。 通過提取這些特征對視頻的關鍵幀進行檢測。音頻特征主要有:時域特征、頻域特征和聲學 感知特征等。
[0004] 基于視頻內(nèi)容的檢測存在以下問題:需要的數(shù)據(jù)量大、視頻檢測較慢、在沒有視頻 內(nèi)容本身的情況下顯然無法完成檢測任務,同時準確率不是很高。
【發(fā)明內(nèi)容】
[0005] (一)要解決的技術問題
[0006] 本發(fā)明的目的在于提出一種在沒有電影視頻的情況下可以方便快速地對電影進 行檢測的方法,從而實現(xiàn)了快速的電影分類。
[0007] 二)技術方案
[0008] 為了解決上述技術問題,本發(fā)明提出了一種基于海報與劇情介紹的電影類型的快 速分類方法,該方法包括以下步驟:步驟1 :確定電影所屬的類型集合,建立各種類型的電 影的海報訓練集和劇情介紹的訓練集;
[0009] 步驟2 :提取待測電影的海報的特征,利用得到的每幅海報的特征及其對應的標 簽訓練支持向量機得到海報的分類模型;
[0010] 步驟3 :提取待測電影的劇情介紹的文本的特征,利用得到的每個文本的特征及 其對應的標簽訓練支持向量機得到文本的分類模型;
[0011] 步驟4 :用海報的分類模型,對待測電影的海報進行預測得到類型Y1,然后再調(diào)用 文本的分類模型對待測電影的劇情介紹進行預測得到類型Y2 ;最后將Yl和Y2進行"或"操 作;即與待測電影的類型標簽對比,只要一個預測結果是正確的,則預測正確的那個類型當 作最后的待測電影的類型;否則將Yl作為最后的待測電影的類型。
[0012] (三)有益效果
[0013] 本發(fā)明結合電影的海報和劇情介紹對電影的類型進行檢測,能夠在沒有電影視頻 的情況下,對電影的類型實現(xiàn)快速、高準確率的檢測。
【附圖說明】
[0014] 圖1是本發(fā)明的基于海報與劇情介紹的電影類型的快速分類方法的流程圖。
[0015] 圖2是本發(fā)明的確定電影的類型,和獲得類型集合的方法流程圖。
[0016] 圖3是本發(fā)明的獲得海報分類模型的方法流程圖。
[0017] 圖4是本發(fā)明的獲得文本分類模型的方法流程圖。
[0018] 圖5是本發(fā)明的獲得待測電影類型的方法流程圖。
【具體實施方式】
[0019] 為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚明白,以下結合具體實施例,并參照 附圖,對本發(fā)明作進一步的詳細說明。
[0020] 本發(fā)明的方法具體運行的硬件和編程語言并不受限制,用任何語言編寫都可以實 現(xiàn)本發(fā)明的方法。本發(fā)明采用一臺具有2. 67G赫茲中央處理器和4G字節(jié)內(nèi)存的計算機,并 用C++語言編制本發(fā)明所涉及到的程序,實現(xiàn)了本發(fā)明的方法。
[0021] 圖1是基于海報與劇情介紹的電影類型的快速分類方法的流程圖。
[0022] 步驟101 :搜集中外視頻網(wǎng)站,確定電影所屬的類型集合,搜集盡可能多的電影對 應的海報和劇情介紹,建立電影海報的訓練集和劇情介紹的訓練集,具體流程如圖2所示。
[0023] 首先搜集中外視頻網(wǎng)站上的電影常見類型,確定常見的電影類型集合為:恐怖片、 愛情片、喜劇片和動作片等。然后搜集盡可能多的這四種類型的電影的海報和劇情介紹。分 別建立電影海報的訓練集和電影劇情介紹的訓練集。
[0024] 步驟102 :提取海報的特征,利用得到的每幅海報的特征及其對應的標簽訓練支 持向量機得到海報的分類模型,具體流程如圖3所示。
[0025] 1):提取海報的特征。
[0026] 對每幅海報提取的海報的特征包括:顏色情感特征、顏色和諧度特征、邊緣特征、 紋理特征、顏色變化特征和海報中人臉的個數(shù)。
[0027] 顏色情感特征的計算方法如下。顏色情感常用來描述圖像的情感。在顏色情感特 征的計算中,首先,將RGB顏色空間轉換到CLELAB和CLELCH顏色空間中,與顏色情感特征 有關的三個因素為:熱度(heat)、重要性(weight)和活動性(activity),該三個因素的計 算方法如下:
[0029] weight = -1. 8+0. 45cos (h_10。)+0· 04 (100-L*)
[0030] heat = -0· 5+0. 02 (C*) i q7Cos (h_50° )
[0031] 其中,(L*,C*,h)和(L*,a' b〇分別是顏色空間CIELCH和CIELAB的顏色分量。
[0032] 本發(fā)明采用的顏色情感特征EI (X,y)的定義為:
[0034] 顏色和諧度特征的計算方法如下。顏色的和諧度特征同樣常用來描述圖像的情 感。在顏色情感特征的計算中,首先,將RGB顏色空間轉換到CLELAB顏色空間,與顏色 和諧度特征相關的和諧度因子包括:色調(diào)因子Hh(hue effect)、亮度因子Hjlightness effect)和飽和度因子 Hc(chromatic effect):
[0036] Hl= H L議+Hal
[0037] Hl_= 0· 28+0. 54tanh (-3. 88+0. 029 Δ L _)
[0038] Lsuni= L :+L2*
[0039] Hal= 0. 14+0. 15tanh (-2+0. 2 Δ L)
[0040] AL=| Li1-L^2
[0041] Hh= Hsn+Hsy2
[0042] Hsy = Ec (Hs+Εγ)
[0043] Ec= 0. 5+0. 5tanh(-2+0. 5C ab*)
[0044] Hs= 0. 08-0. 14sin(hab+50° )-〇. 07sin (2hab+90° )
[0046] 其中,hab和C、表示的是CIELAB顏色空間中的色調(diào)和色飽和度,Δ C :和Δ H \b 則分別是兩種顏色在CIELAB顏色空間中的色調(diào)和色
[0047] 飽和度差值,1