專利名稱:快速傅里葉變換旋轉(zhuǎn)乘法的制作方法
技術領域:
本申請涉及無線通信和無線通信信號處理的領域。更具體地講,本申請涉 及正交頻分復用(OFDM)信號的快速傅里葉變換(FFT)處理。
背景技術:
正交頻分復用(OFDM)是一種多載波調(diào)制技術,它將整個系統(tǒng)帶寬劃分成 多個(N個)正交的子帶。這些子帶也被稱為頻調(diào)、副載波、槽(bin)以及頻 道。使用OFDM時,每一個子帶都與可能用數(shù)據(jù)來調(diào)制的各個副載波相關聯(lián)。
在無線通信系統(tǒng)中,射頻(RF)調(diào)制信號可以通過許多信號通道從發(fā)射機前 進到接收機。如果這些信號通道具有不同的延遲,則接收機處所接收到的信號 將包括多個其增益和延遲不同的發(fā)送信號的實例。無線信道中的這種時間分散 引起了頻率選擇性衰減,其特征在于在系統(tǒng)帶寬上頻率響應不斷變化。對于 OFDM系統(tǒng),這N個子帶可能由此經(jīng)歷不同的有效信道,并且因此可能與不同 的復合信道增益相關聯(lián)。
與其它通信系統(tǒng)中對接收到的信號的處理相比,OFDM系統(tǒng)的處理可能復 雜得多。就處理能力而言,所需的大處理量給接收機帶來了很大的負擔。期望 能夠增大OFDM接收機中的處理能力,以允許使用調(diào)制方案的通信系統(tǒng)迅速擴大。
發(fā)明內(nèi)容
本文描述了用于OFDM接收機的FFT處理器以及用于在OFDM系統(tǒng)中處 理接收到的碼元的方法。FFT處理器包括多個相互關聯(lián)的操作塊,配置這些操 作塊以便對OFDM碼元執(zhí)行數(shù)據(jù)解調(diào)、信道估計以及精確定時獲取。FFT處理 器包括一種使用與信道估計和解調(diào)塊共享的存儲器體系結構的流水線化FFT引 擎。共享存儲器結構與流水線化FFT操作的組合能夠在捕獲下一個接收到的碼 元所用的時間內(nèi)完成信道估計和解調(diào)處理。
共享存儲器可以排列成多個存儲體,這些存儲體與它們所支持的功能塊相 關聯(lián)。FFT處理器的定時規(guī)定了存儲體、用于尋址各種存儲體的數(shù)據(jù)與控制復 用器的操作。
流水線化FFT引擎是FFT處理器的骨干,并且用在由FFT處理器執(zhí)行的 信道估計和時間獲取過程中。在接下來處理基礎數(shù)據(jù)的過程中,使用了信道估 計數(shù)值。
描述了一種FFT引擎,它實現(xiàn)了在多級中應用旋轉(zhuǎn)乘法(twiddle multiplication)的循環(huán)計數(shù)方法。當實現(xiàn)多級FFT時(比如一種基于基數(shù)-8芯 的實現(xiàn)方式),中間數(shù)值需要乘以各種旋轉(zhuǎn)因子(twiddle factor)。在有效的 流水線中,上述FFT引擎使用最少數(shù)目的乘法器來執(zhí)行旋轉(zhuǎn)乘法?;贔FT 基數(shù)和每一行存儲器中數(shù)值的數(shù)量來優(yōu)化復數(shù)乘法器的數(shù)量這一做法允許用
合理的存儲空間量和最少的循環(huán)次數(shù)來執(zhí)行FFT函數(shù)。這些數(shù)值的戰(zhàn)略性排序 和分組允許以更少的循環(huán)次數(shù)來執(zhí)行FFT操作。
一個方面包括一種FFT處理裝置,該裝置包括樣本存儲器,存儲許多樣 本數(shù)值,每行存儲等于FFT的基數(shù)的樣本數(shù)值;轉(zhuǎn)置存儲器;蝶形運算芯 (butterfly core),它被配置成接收來自樣本存儲器的一行數(shù)值、對這些數(shù)值 執(zhí)行蝶形運算操作、并將結果寫到轉(zhuǎn)置存儲器的列中;以及乘法器模塊,它被 配置成從轉(zhuǎn)置存儲器中檢索預定數(shù)目的相鄰數(shù)值并且使每一個這樣的數(shù)值都 乘以旋轉(zhuǎn)因子。
另一方面包括一種FFT處理裝置,該裝置包括樣本存儲器,它適于在每一行中存儲8個復數(shù)樣本數(shù)值;轉(zhuǎn)置存儲器,它排列成8X8個存儲單元;基 數(shù)-8蝶形運算芯,它適于檢索一行數(shù)值、執(zhí)行基數(shù)-8蝶形運算操作、并將輸出 數(shù)值按列寫入轉(zhuǎn)置存儲器中;旋轉(zhuǎn)存儲器,它適于在每一行中存儲四個旋轉(zhuǎn)數(shù) 值;以及具有四個復數(shù)乘法器的乘法器模塊,它適于檢索來自旋轉(zhuǎn)存儲器的一 行和來自轉(zhuǎn)置存儲器的四個相鄰數(shù)值、利用來自旋轉(zhuǎn)存儲器行中的數(shù)值對來自 相鄰轉(zhuǎn)置存儲單元的四個數(shù)值執(zhí)行復數(shù)乘法、以及將乘積回寫到四個相鄰轉(zhuǎn)置 存儲單元。
另一方面包括一種用于執(zhí)行FFT處理操作的方法。該方法包括讀取多行 樣本存儲器,每行等于FFT的基數(shù);針對一行樣本存儲器中的數(shù)值確定蝶形運 算蝶形并且將這些蝶形運算數(shù)值按列寫入轉(zhuǎn)置存儲器中;檢索一行旋轉(zhuǎn)因子, 該行存儲了多個旋轉(zhuǎn)因子數(shù)值;在單次循環(huán)中使多個蝶形運算數(shù)值乘以旋轉(zhuǎn)因 子數(shù)值以產(chǎn)生經(jīng)旋轉(zhuǎn)的蝶形運算數(shù)值;以及將經(jīng)旋轉(zhuǎn)的蝶形運算數(shù)值回寫到上 述多個蝶形運算數(shù)值的存儲單元。
另一方面包括一種FFT處理裝置,包括用于存儲許多樣本數(shù)值的裝置, 每一行中所存儲的個數(shù)等于FFT的基數(shù);用于轉(zhuǎn)置多個數(shù)值的裝置;用于計算
蝶形運算數(shù)值的裝置,該裝置被配置成接收來自樣本存儲器的一行數(shù)值、對這
些數(shù)值執(zhí)行蝶形運算操作、并將結果寫入轉(zhuǎn)置存儲器的列中;以及用于使來自
轉(zhuǎn)置存儲器的預定數(shù)目的相鄰數(shù)值乘以相應的旋轉(zhuǎn)因子的裝置。
另一方面包括計算機可讀介質(zhì),用計算機程序?qū)υ撚嬎銠C可讀介質(zhì)進行編
碼以執(zhí)行如下步驟讀取等于FFT基數(shù)的多行樣本存儲器,每行的個數(shù)等于 FFT的基數(shù);針對一行樣本存儲器中的數(shù)值確定蝶形運算蝶形并將這些蝶形運 算數(shù)值按列寫入轉(zhuǎn)置存儲器中;檢索一行旋轉(zhuǎn)因子,該行中存儲了多個旋轉(zhuǎn)因 子數(shù)值;在單次循環(huán)中使多個蝶形運算數(shù)值乘以旋轉(zhuǎn)因子數(shù)值以產(chǎn)生經(jīng)旋轉(zhuǎn)的 蝶形運算數(shù)值;以及將經(jīng)旋轉(zhuǎn)的蝶形運算數(shù)值回寫到上述多個蝶形運算數(shù)值的 存儲單元。
下文結合附圖從詳細描述中能更清楚地看到本發(fā)明各實施方式的特點、目 標和優(yōu)點,其中相同的元件用相同的標號來表示。圖1是無線通信系統(tǒng)的一個實施方式的功能框圖。
圖2是OFDM接收機的一個實施方式的簡化功能框圖。
圖3是用于OFDM系統(tǒng)的FFT處理器的一個實施方式的簡化功能框圖。
圖4是用于OFDM系統(tǒng)的FFT處理器的一個實施方式的簡化功能框圖。
圖5是OFDM交織處理的一個實施方式的簡化功能框圖。
圖6是在OFDM處理器中共享存儲器使用情況的簡化時間線。
圖7是導頻信道處理的一個實施方式的簡化功能框圖。
圖8是邏輯信道控制邏輯的一個實施方式的簡化狀態(tài)圖。
圖9是FFT處理器的一個實施方式的簡化狀態(tài)圖。
圖IO是FFT引擎的一個實施方式的簡化功能框圖。
圖11是基數(shù)-8FFT蝶形運算的一個實施方式的簡化功能框圖。
圖12是基數(shù)-8FFT蝶形運算的前兩個狀態(tài)的實施方式的簡化功能框圖。
圖13是一級基數(shù)-8 FFT蝶形運算的一實施方式的簡化功能框圖。
圖14是基數(shù)-8FFT中的旋轉(zhuǎn)乘法順序的簡化表示。
圖15是流水線化基數(shù)-8FFT操作的簡化時序圖。
圖16是流水線化256-點FFT的簡化時序圖。
圖17是一種用于處理OFDM信號的方法的簡化流程圖。
圖18是一種用于對碼元樣本進行解調(diào)的方法的簡化流程圖。
圖19是一種用于處理OFDM信號的方法的簡化流程圖。
圖20是FFT處理器的簡化功能框圖。
圖21是FFT引擎的簡化功能框圖。
具體實施例方式
圖1是無線通信系統(tǒng)100的一實施方式的簡化功能框圖。該系統(tǒng)包括可與 用戶終端110進行通信的一個或多個固定元件。用戶終端110可以是例如無線 電話,將其配置成根據(jù)一種或多種通信標準來進行工作。例如,用戶終端110 可以被配置成接收來自第一通信網(wǎng)絡的無線電話信號,并且可以被配置成接收 來自第二通信網(wǎng)絡的數(shù)據(jù)和信息。
用戶終端110可以是便攜式單元、移動的單元、或固定的單元。用戶終端110也可以被稱為移動單元、移動終端、移動站、用戶設備、便攜電話等。盡 管圖1只示出了單個用戶終端110,但是應該理解,典型的無線通信系統(tǒng)100 能夠與多個用戶終端110進行通信。
用戶終端110通常與一個或多個基站120a或120b進行通信,此處這些基 站被描繪成分地區(qū)的蜂窩塔。用戶終端IIO通常將與在用戶終端110內(nèi)的接收 機處提供最強信號強度的那個基站(例如120b)進行通信。
基站120a和120b各自可以耦合到基站控制器(BSC)140,該控制器將通信 信號路由到合適的基站120a和120b并且路由來自合適的基站120a和120b的 通信信號。BSC 140耦合到移動交換中心(MSC) 150,可以配置MSC以使其充 當用戶終端110和公共交換電話網(wǎng)絡(PSTN) 150之間的接口 。還可以配置MSC 以使其充當用戶終端IIO和網(wǎng)絡160之間的接口。例如,網(wǎng)絡160可以是局域 網(wǎng)(LAN)或廣域網(wǎng)(WAN)。在一個實施方式中,網(wǎng)絡160包括互聯(lián)網(wǎng)。因此, MSC 150耦合到PSTN 150和網(wǎng)絡160。 MSC 150也可以耦合到一個或多個媒 體源170。例如,媒體源170可以是由系統(tǒng)供應商提供的媒體庫,用戶終端110 可以訪問得到。例如,系統(tǒng)供應商可以提供視頻或一些其它形式的媒體,用戶 終端110可以按需要來訪問。還可以配置MSC 150以與其它通信系統(tǒng)(未示出) 協(xié)調(diào)系統(tǒng)之間的移交切換。
無線通信系統(tǒng)100還可以包括廣播發(fā)射機180,配置該廣播發(fā)射機以將信 號發(fā)送到用戶終端IIO。在一個實施方式中,廣播發(fā)射機180可以與基站120a 和120b相關聯(lián)。在另一個實施方式中,廣播發(fā)射機180可以不同于并且獨立 于含基站120a和120b的無線電話系統(tǒng)。廣播發(fā)射機180可以但不限于音頻發(fā) 射機、視頻發(fā)射機、無線電發(fā)射機、電視發(fā)射機等、或這些發(fā)射機的某種組合。 盡管無線通信系統(tǒng)100中只示出了一個廣播發(fā)射機180,但是無線通信系統(tǒng)100 可以被配置成支持多個廣播發(fā)射機180。
在重疊覆蓋區(qū)域,多個廣播發(fā)射機180可以發(fā)送信號。用戶終端110可以 同時接收來自多個廣播發(fā)射機180的信號。多個廣播發(fā)射機180可以被配置成 廣播完全一樣的、不同的、或相似的廣播信號。例如,其覆蓋區(qū)域與第一廣播 發(fā)射機的覆蓋區(qū)域相重疊的第二廣播發(fā)射機也可以廣播由第一廣播發(fā)射機所 廣播的信息的子集。廣播發(fā)射機180可以被配置成接收來自廣播媒體源182的數(shù)據(jù),并且可以 被配置成對該數(shù)據(jù)進行編碼、基于編碼后的數(shù)據(jù)調(diào)制信號、并將調(diào)制后的數(shù)據(jù) 廣播到終端用戶IIO可接收到該數(shù)據(jù)的服務區(qū)域。
在一個實施方式中,基站120a和120b之一或兩者以及廣播發(fā)射機180發(fā) 送正交頻分復用(OFDM)信號。OFDM信號可以包括被調(diào)制到預定工作波帶處 一個或多個載波上的多個OFDM碼元。
OFDM通信系統(tǒng)將OFDM用于數(shù)據(jù)和導頻傳輸。OFDM是一種多載波調(diào) 制技術,該技術將整個系統(tǒng)帶寬劃分成多個(K個)正交頻率子帶。這些子帶也 被稱為頻調(diào)、載波、副載波、槽以及頻道。使用OFDM時,每一子帶與可用數(shù) 據(jù)對其進行調(diào)制的各副載波相關聯(lián)。
OFDM系統(tǒng)中的發(fā)射機(比如廣播發(fā)射機180)可以向無線設備同時發(fā)送 多個數(shù)據(jù)流。這些數(shù)據(jù)流本質(zhì)是可以是連續(xù)的或脈沖的,可以具有固定的或可 變的數(shù)據(jù)速率,并且可以使用相同的或不同的編碼和調(diào)制方案。發(fā)射機也可以 發(fā)送導頻以幫助無線設備執(zhí)行許多功能,比如時間同步、頻率跟蹤、信道估計 等。導頻是一種發(fā)射機和接收機都事先知道的傳輸。
廣播發(fā)射機180可以根據(jù)交織子帶結構來發(fā)送OFDM碼元。OFDM交織 結構包括總共K個子帶,其中K〉1。 U個子帶可以被用于數(shù)據(jù)和導頻傳輸并 且被稱為可用子帶,其中IKK。其余G個子帶沒有被使用并且被稱為防護子 帶,其中G^K-U。作為一個示例,系統(tǒng)可以利用總共有〖=4096個子帶的 OFDM結構,其中11 = 4000個可用子帶和0 = 96個防護子帶。為了簡化,下 文假定所有K個總共的子帶都是可用的并且被分配有指數(shù)0到K-1,所以U二K 且G=0。
總共K個子帶可以排列成M個交織或非重疊子帶集。這M個交織是非重 疊的或不連續(xù)的,因為總共K個子帶中的每一個子帶只屬于一個交織。每一個 交織包含P個子帶,其中P-K/M。每一個交織中的P個子帶可以均勻分布在 總共K個子帶上,使得該交織中連續(xù)的子帶彼此都間隔了 M個子帶。例如, 交織0可以包含子帶0、 M、 2M等,交織1可以包含子帶1、 M + 1、 2M + 1 等,并且交織M-l可以包含子帶M - 1、 2M- 1、 3M- 1等。對于上述K- 4096 的典型OFDM結構,可以形成M = 8個交織,并且每一個交織可以包含P = 512個子帶,這些子帶彼此均勻間隔了 8個子帶。由此,每一個交織中的P個子帶 都與其它M-l個交織中的每一個交織的P個子帶交織在一起。
通常,廣播發(fā)射機180可以實現(xiàn)任何OFDM結構,其總子帶數(shù)、可用子帶 數(shù)和防護子帶數(shù)都可任選。也可以形成任何數(shù)目的交織。每一個交織可以包含 任何數(shù)目的子帶以及總共K個子帶中的任一個子帶。這些交織可以包含相同或 不同數(shù)目的子帶。為了簡化,下文的大部分描述都涉及N^8個交織且每一個交 織包含P:512個均勻分布的子帶這樣一種交織子帶結構。這種子帶結構提供了 若干個優(yōu)點。首先,實現(xiàn)了頻率分集,因為每一個交織包含了在整個系統(tǒng)帶寬 上取出的子帶。其次,無線設備可以通過執(zhí)行部分P-點快速傅里葉變換(FFT) 而非完整K-點FFT (這可以簡化無線設備處的處理),從而恢復在給定的交織 上所發(fā)送的數(shù)據(jù)或?qū)ьl。
廣播發(fā)射機180可以在一個或多個交織上發(fā)送頻分復用(FDM)導頻,以允 許無線設備執(zhí)行各種功能,比如信道估計、頻率跟蹤、時間跟蹤等。導頻是基 站和無線設備都事先知道的調(diào)制碼元構成的,它們也被稱為導頻碼元。用戶終 端110可以基于接收到的導頻碼元和已知的發(fā)送過的導頻碼元來估計無線信道 的頻率響應。用戶終端110能夠在用于導頻傳輸?shù)拿恳粋€子帶處對無線信道的 頻譜進行采樣。
系統(tǒng)100可以在OFDM系統(tǒng)中定義M個插槽(slot)以便于將數(shù)據(jù)流映射 到多個交織。每一個插槽可以被視為一個傳輸單元或一個用于發(fā)送數(shù)據(jù)或?qū)ьl 的裝置。用于數(shù)據(jù)的插槽被稱為數(shù)據(jù)插槽,用于導頻的插槽被稱為導頻插槽。 M個插槽可以被分配有指數(shù)0到M-1。插槽O可以用于導頻,插槽1到M-1可 以用于數(shù)據(jù)。數(shù)據(jù)流可以在插槽1到M-l上進行發(fā)送。使用具有固定指數(shù)的插 槽可以簡化插槽到數(shù)據(jù)流的分配。每一個插槽可以被映射到一個時間間隔中的 一個交織?;谀軐崿F(xiàn)頻率分集以及良好的信道估計和檢測性能的"插槽-交織" 映射方案,M個插槽可以被映射到不同時間間隔中的M個交織中不同的交織。 通常,時間間隔可以橫跨一個或多個碼元周期。下面的描述假定時間間隔橫跨 一個碼元周期。
圖2是可實現(xiàn)于圖1所示用戶終端中的OFDM接收機200的簡化功能框圖。 接收機200可以被配置成實現(xiàn)本文所描述的FFT處理塊以便對接收到的OFDM碼元進行處理。
接收機200包括接收機RF處理器210,它被配置成通過RF信道接收已發(fā) 送的RFOFDM碼元、處理這些碼元并且將它們頻率轉(zhuǎn)換成基帶OFDM碼元或 基本上將它們轉(zhuǎn)換成基帶信號。如果離基帶信號的頻率偏移是信號帶寬的分 數(shù),或者如果信號處于足夠低的中頻處以允許直接處理該信號而無需進一步作 頻率轉(zhuǎn)換,則信號可以基本上被稱為基帶信號。來自接收RF處理器210的 OFDM碼元耦合到幀同步器420。
幀同步器420可以被配置成使接收機200與碼元定時同步。在一個實施方 式中,幀同步器可以被配置成使接收機同步到超幀定時并且同步到超幀內(nèi)的碼 元定時。
幀同步器220可以被配置成基于為使插槽-交織映射不斷重復所必需的碼 元數(shù)量,確定一個交織。在一個實施方式中,插槽-交織映射可以每14個碼元 之后就重復一次。幀同步器220可以從碼元計數(shù)中確定模數(shù)-14碼元指數(shù)。接 收機200可以使用該模數(shù)-14碼元指數(shù)來確定導頻交織以及與所分配的數(shù)據(jù)插 槽相對應的一個或多個交織。
幀同步器220可以基于許多因素并利用任何技術來使接收機定時同步。例 如,幀同步器220可以對OFDM碼元進行解調(diào),并且可以從解調(diào)后的碼元中確 定超幀定時。在另一個實施方式中,例如在開銷信道中,幀同步器220可以基 于一個或多個碼元內(nèi)所接收到的信息來確定超幀定時。在另一個實施方式中, 幀同步器220通過經(jīng)不同信道接收信息(比如通過對不同于OFDM碼元而接收 到的開銷信道進行解調(diào)),使接收機200同步化。當然,幀同步器220可以使 用用于實現(xiàn)同步的任何方式,并且用于實現(xiàn)同步的方式并不必然地限制用于確 定模數(shù)碼元計數(shù)的方式。
幀同步器220的輸出耦合到樣本映射230,樣本映射230可以被配置成對 OFDM碼元進行解調(diào)并且將碼元樣本或碼片從串行數(shù)據(jù)通路映射到多個并行數(shù) 據(jù)通路中的任一個。例如,樣本映射220可以被配置成將OFDM碼片中的每一 個碼片映射到與OFDM系統(tǒng)中的子帶或副載波的數(shù)目相對應的多個并行數(shù)據(jù) 通道之一。
樣本映射230的輸出耦合到FFT模塊240,該模塊240被配置成將OFDM碼元變換成相應的頻域子帶。FFT模塊240可以被配置成基于模數(shù)-14碼元計 數(shù)來確定與導頻插槽相對應的交織。FFT模塊240可以被配置成將一個或多個 子帶(比如預定的導頻子帶)耦合到信道估計器250。導頻子帶可以是例如一 個或多個等間隔的OFDM子帶的集合,它們橫跨OFDM碼元的帶寬。
信道估計器250被配置成使用導頻子帶來估計對接收到的OFDM碼元有影 響的各種信道。在一個實施方式中,信道估計器250可以被配置成確定與每一 個數(shù)據(jù)子帶相對應的信道估計。
來自FFT模塊240的子帶以及上述信道估計都耦合到副載波碼元去交織器 260。碼元去交織器260可以被配置成基于對一個或多個所分配的數(shù)據(jù)插槽的 了解來確定上述交織,并且還確定與已分配的數(shù)據(jù)插槽相對應的經(jīng)交錯的子 帶。
碼元去交織器260可以被配置成例如對與已分配的數(shù)據(jù)交織相對應的每一 個副載波進行解調(diào)并且從解調(diào)后的數(shù)據(jù)中產(chǎn)生串行數(shù)據(jù)流。在另一個實施方式 中,碼元去交織器260可以被配置成對與已分配的數(shù)據(jù)交織相對應的每一個副 載波進行解調(diào)并且產(chǎn)生并行的數(shù)據(jù)流。在另一個實施方式中,碼元去交織器260 可以被配置成產(chǎn)生與已分配的插槽相對應數(shù)據(jù)交織的并行數(shù)據(jù)流。
碼元去交織器260的輸出耦合到基帶處理器270,基帶處理器270被配置 成進一步處理接收到的數(shù)據(jù)。例如,基帶處理器270可以被配置成將接收到的 數(shù)據(jù)處理成具有音頻和視頻的多媒體數(shù)據(jù)流?;鶐幚砥?70可以將經(jīng)處理的 信號發(fā)送到一個或多個輸出設備(未示出)。
圖3是OFDM系統(tǒng)中所用的接收機的FFT處理器300的一實施方式的簡 化功能框圖。FFT處理器300可以用在例如圖1的無線通信系統(tǒng)中或者用在圖 2的接收機中。在一個實施方式中,F(xiàn)FT處理器300可以被配置成執(zhí)行圖2所 示接收機的幀同步器、FFT模塊以及信道估計器的全部或部分功能。
FFT處理器300可以實現(xiàn)于單IC基片上的集成電路(IC)中,以提供用于 OFDM接收機設計的處理部分的單芯片解決方案?;蛘?,F(xiàn)FT處理器300可以 實現(xiàn)在多個IC或基片上并且包裝成一個或多個芯片或模塊。例如,F(xiàn)FT處理器 300可以在第一 IC上執(zhí)行其處理部分,并且這些處理部分可以與位于不同于第 一 IC的一個或多個存儲設備上的存儲器進行交互作用。FFT處理器300包括解調(diào)塊310,它耦合到存儲器體系結構320,存儲器 體系結構320使FFT計算塊360和信道估計器380互連起來。對數(shù)似然比塊350 可以任選地作為FFT處理器300的一部分包括在內(nèi),或者可以實現(xiàn)在一個不同 的塊之內(nèi),該不同的塊可能實現(xiàn)在與FFT處理器300相同或不相同的基片或IC上。
解調(diào)、FFT、信道估計以及對數(shù)似然比等模塊對樣本數(shù)值執(zhí)行各種操作。 存儲器體系結構320允許任何這些模塊在給定的時間訪問任何的塊。通過在時 間上劃分存儲體,便簡化了切換邏輯。
存儲器的一個存儲體被解調(diào)塊3I0反復使用。FFT計算塊320訪問當前正 被處理的存儲體。信道估計塊380訪問當前正被處理的存儲體的導頻信息。對 數(shù)似然比(LLR)塊350訪問含最舊的樣本的存儲體。
解調(diào)塊310包括耦合到系數(shù)ROM 314的解調(diào)器312。解調(diào)塊310處理經(jīng)時 間同步的OFDM碼元以恢復導頻和數(shù)據(jù)交織。在上述示例中,OFDM碼元包括 被分成8個不同交織的4096個子帶,每一個交織具有在整個4096個子帶上均 勻間隔的子帶。
解調(diào)器312將輸入的4096個樣本組織成8個交織。解調(diào)器使每一個輸入 樣本旋轉(zhuǎn)< ) = /^^, n表示交織0到7。前512個數(shù)值經(jīng)旋轉(zhuǎn)后再被存儲在 每一個交織中。對于隨后的每一組512個樣本,解調(diào)器312使這些數(shù)值旋轉(zhuǎn), 然后再添加這些數(shù)值。每一個交織中的每一個存儲單元將具有累加的8個經(jīng)旋 轉(zhuǎn)的樣本。交織O中的數(shù)值不經(jīng)旋轉(zhuǎn),僅僅經(jīng)累加。與用于表示輸入樣本的位 數(shù)相比,解調(diào)器312可以用更多個位來表示經(jīng)旋轉(zhuǎn)和累加的數(shù)值以適應因累加 和旋轉(zhuǎn)而導致的增長。
系數(shù)ROM 314被用于存儲復數(shù)旋轉(zhuǎn)系數(shù)。每一個輸入樣本需要7個系數(shù), 因為交織0不需要任何旋轉(zhuǎn)。系數(shù)ROM 314可以是上升沿觸發(fā)的,這可能導 致從解調(diào)塊310接收到該樣本時起有1個循環(huán)延遲。
解調(diào)塊310可以被配置成登記從系數(shù)ROM 314中檢索出的每一個系數(shù)數(shù) 值。在這些系數(shù)數(shù)值自身可以被使用之前,登記系數(shù)數(shù)值的行為添加了另一個 循環(huán)延遲。
對于每一個輸入樣本,使用7個不同的系數(shù),每一個系數(shù)都具有不同的地址。使用7個計數(shù)器來查找不同的系數(shù)。每一個計數(shù)器按其交織號增加;例如, 對于每一個新樣本,交織l增加l,而交織7增加7。通常,創(chuàng)建ROM映像以
保存單行所需的全部7個系數(shù)是不切實際的,或者使用7個不同的ROM也是 不切實際的。因此,解調(diào)流水線始于當新樣本到達時取系數(shù)數(shù)值。
為了減小系數(shù)存儲器的大小,只存儲了在0和7t/4之間的C O S和S IN數(shù)值。 未被發(fā)送到該存儲器的該系數(shù)地址的三個最高有效位(MSB)可以被用于將這 些數(shù)值引導至合適的象限。由此,從系數(shù)ROM 314中讀出的數(shù)值沒有被立刻 登記。
存儲器體系結構320包括輸入多路復用器322,它耦合到多個存儲體 324a-324c。存儲體324a-324c耦合到存儲器控制塊326,該控制塊326包括能 將來自存儲體324a-324c的數(shù)值路由到各種模塊的多路復用器。
存儲器體系結構320還包括用于導頻觀察處理的存儲器和控制。存儲器體 系結構320包括輸入導頻選擇多路復用器330,用于將導頻觀察耦合到多個導 頻觀察存儲器332a-332c中的任一個。所述多個導頻觀察存儲器332a-332c耦合 到輸出導頻選擇多路復用器334,以允許選擇任何存儲器的內(nèi)容以便于處理。 存儲器體系結構320也可以包括多個存儲器部分342a-342b,以存儲從導頻觀 察中確定的經(jīng)處理的信道估計。
用于產(chǎn)生OFDM碼元的正交頻率可以用傅里葉變換(比如FFT)來方便地 進行處理。FFT計算塊360可以包括許多元件,它們被配置成執(zhí)行一個或多個 預定維度的有效FFT和反向FFT (IFFT)操作。通常,維度是2的乘方,但是 FFT或IFFT操作并不限于2的乘方的維度。
FFT計算塊360包括蝶形運算芯370,它可以對從存儲器體系結構320或 轉(zhuǎn)置寄存器364中檢索出的復數(shù)數(shù)據(jù)進行操作。FFT計算塊360包括蝶形運算 輸入多路復用器362,它被配置成在存儲器體系結構320和轉(zhuǎn)置寄存器354之 間進行選擇。蝶形運算芯370與復數(shù)乘法器366和旋轉(zhuǎn)存儲器368 —起工作以 執(zhí)行蝶形運算操作。
信道估計器380可以包括導頻解擾碼器382,導頻解擾碼器382與PN序 列發(fā)生器384 —起工作以對導頻樣本進行解擾。相位斜坡模塊386用于使導頻 觀察從導頻交織旋轉(zhuǎn)到各種數(shù)據(jù)交織中的任一個數(shù)據(jù)交織。相位斜坡系數(shù)存儲器388被用于存儲相位斜坡信息,這種信息是將樣本旋轉(zhuǎn)到期望的頻率所需的。
時間濾波器392可以被配置成在多個碼元上對多個導頻觀察進行時間濾 波。來自時間濾波器392的經(jīng)濾波的輸出在返回到存儲器體系結構320以便用 在對數(shù)似然比塊350 (該塊350執(zhí)行基礎子帶數(shù)據(jù)的解碼)中之前,可以被存 儲在存儲器體系結構320中并且進一步由閾值器(thresholder) 394對其進行處理。
信道估計器380可以包括信道估計輸出多路復用器390以將各種信道估計 器輸出數(shù)值(其中包括中間的和最終的輸出數(shù)值)連接到存儲器體系結構320。
圖4是相對于OFDM接收機中的其它信號處理塊而言FFT處理器400的 一個實施方式的簡化功能框圖。TDM導頻獲取模塊402產(chǎn)生用于FFT處理器 400的初始碼元同步和定時。輸入的同相(I)和正交(Q)樣本耦合到AGC模塊 404,該模塊404用于實現(xiàn)增益和頻率控制環(huán)路,這些環(huán)路用于將信號維持在 期望的振幅和頻率誤差之內(nèi)。
FFT處理器400可以用于將定時和頻率信息提供給精細頻率獲取模塊406, 以維持比用AGC模塊404的AFC功能所能獲得的還要更準確的碼元頻率???制處理器408執(zhí)行FFT處理器400的高水平控制。例如,控制處理器408可以 是通用處理器或精簡指令集計算機(RISC)處理器,比如由ARMTM設計的那些處 理器。例如,通過控制碼元同步、將FFT處理器400的狀態(tài)選擇性地控制到活 動或睡眠狀態(tài)、或控制FFT處理器400的工作情況,控制處理器可以控制FFT 處理器408的工作過程。
FFT處理器400內(nèi)的控制邏輯410可以被用于連接FFT處理器400的各種 內(nèi)部模塊??刂七壿?10也可以包括用于與FFT處理器400外部的其它模塊相 連的邏輯。
I和Q樣本都耦合到FFT處理器400,更具體地講,耦合到FFT處理器400 的解調(diào)塊310。解調(diào)塊310用于將這些樣本分離成預定數(shù)目的交織。解調(diào)塊310 與存儲器體系結構320相連,以存儲用于處理的樣本并將這些樣本傳遞到對數(shù) 似然比塊350以便于基礎數(shù)據(jù)的解碼。
存儲器體系結構320可以包括存儲器控制器412,用于控制對存儲器體系 結構320內(nèi)的各種存儲體的訪問。例如,存儲器控制器412可以被配置成允許行寫入各種存儲體內(nèi)的位置。
存儲器體系結構320可以包括用于存儲FFT數(shù)據(jù)的多個FFT RAM 420a-420c。另外,多個時間濾波器存儲器430a-430c可以被用于存儲時間濾波 器數(shù)據(jù),比如用于產(chǎn)生信道估計的導頻觀察。
單獨的信道估計存儲器440a-440b可以被用于存儲來自信道估計器380的 中間信道估計結果。信道估計器380可以在確定信道估計時使用信道估計存儲 器440a-440b。
FFT處理器400包括FFT計算塊,它被用于執(zhí)行FFT操作的至少一些部分。 在圖4的實施方式中,F(xiàn)FT計算塊是8-點FFT引擎460。 8-點FFT引擎460可 以有利于處理上述OFDM碼元結構的說明性示例。如上所述,每一個OFDM 碼元包括4096個子帶,它們被劃分成8個交織,每一個交織有512個子帶。 每一個交織中的子帶數(shù)目即512是8的立方(83=512)。由此,可以在使用基數(shù)-8 FFT的三個級中執(zhí)行512-點FFT。事實上,因為4096是8的四次方,所以可 以僅僅用一個附加的FFT級來執(zhí)行4096-點FFT,這樣總共有四個級。
8-點FFT引擎460可以包括蝶形運算芯370和轉(zhuǎn)置寄存器364,它們適于 執(zhí)行基數(shù)-8 FFT。歸一化塊462被用于使由蝶形運算芯370所產(chǎn)生的乘積歸一 化。歸一化塊462可以用于限制存儲單元的位增長,這種增長是為了表示FFT 的每一級之后的蝶形運算芯所輸出的數(shù)值所需的。
圖5是OFDM交織處理的一個實施方式的簡化功能框圖。圖3或4的FFT 處理器可以被配置成執(zhí)行圖5所示的OFDM交織處理。該簡化功能框圖示出了 兩個數(shù)據(jù)交織處理器510k和510j以及單個導頻交織處理器510p。然而,F(xiàn)FT 處理器可以根據(jù)OFDM碼元中的交織的個數(shù),來實現(xiàn)任何數(shù)目的交織處理器。 例如,為了處理上述OFDM碼元實施方式,F(xiàn)FT處理器可以包含7個數(shù)據(jù)交織 處理器(比如510k)以及一個導頻交織處理器510p。
數(shù)據(jù)交織處理器510k、510j以相似的方式排列并且可以有效地對任何數(shù)據(jù) 交織進行操作。數(shù)據(jù)交織處理器510k、 510j分別包括旋轉(zhuǎn)器514k、 514j,它們 被配置成使輸入的樣本的相位旋轉(zhuǎn)。該相位旋轉(zhuǎn)有效地使每一個交織旋轉(zhuǎn)到用 于處理的一個公共的交織。每一個數(shù)據(jù)交織處理器510k、 510j對每組連續(xù)M 個樣本中的一個樣本進行操作,其中M表示交織的總數(shù)。各旋轉(zhuǎn)器514k、 514J的輸出耦合到累加器520k、 520j,它們累加8個交織 上的樣本。對于具有4096個子帶和8個交織的OFDM碼元,每一個交織包括 512個子帶,并且累加器520k、 520j將8個由512個樣本構成的實例加起來。 在上述OFDM碼元示例中,針對每一個交織旋轉(zhuǎn)并存儲前512個數(shù)值。對于每 一個由后來的512個樣本構成的組而言,旋轉(zhuǎn)器514k、 514j使這些樣本旋轉(zhuǎn), 并且累加器520k、 520j將這些數(shù)值加到先前存儲的樣本。每一個交織中的每一 個512存儲單元將累加8個經(jīng)旋轉(zhuǎn)的樣本。
數(shù)據(jù)交織處理器510k、 510j包括存儲器530k、 530j,用于存儲累加的樣本、 或累加的樣本的中間值。在一個示例中,各個存儲器530k、 530j可以存儲512 個樣本或累加的樣本。在每一個碼元的開始處,存儲單元被重設或者用第一組 數(shù)據(jù)交織樣本來覆寫。
計數(shù)器540可以被用于指向存儲器530k、 530j中的位置,其中輸入數(shù)值被 訪問并且累加的數(shù)值將被返回。盡管圖5只示出了一個耦合到導頻樣本存儲器 530p的模數(shù)-512計數(shù)器540,但是計數(shù)器540可以將計數(shù)數(shù)值提供給存儲器 530k、 530j,這些存儲器被用于存儲累加的數(shù)據(jù)樣本?;蛘?,各數(shù)據(jù)交織處理 器510k、510j可以包括單獨的計數(shù)器或一個或多個數(shù)據(jù)交織處理器510k、510j, 可以共享一個與導頻交織處理器510p所使用的計數(shù)器540相同或不同的計數(shù) 器°
在一個實施方式中,計數(shù)器540在每一個碼元的開始處被重設。相似的是, 數(shù)據(jù)存儲器530k、 530j以及導頻樣本存儲器530p可以在每一個碼元的開始處 被重設或清空。旋轉(zhuǎn)器514k、 514j使期望的交織樣本旋轉(zhuǎn)預定的相位并且將旋 轉(zhuǎn)后的樣本耦合到相關聯(lián)的累加器520k、 520j。累加器520k、 520n包括加法 器522k、 522j,它們從存儲器530k、 530j中讀取由計數(shù)器540所指向的先前累 加的數(shù)值。
加法器522k、 522j將檢索到的數(shù)值與來自旋轉(zhuǎn)器514k、 514j的數(shù)值加起 來。累加器520k、 520j將該和載入寄存器524k、 524j中,然后再將它回寫入 用來將輸入提供給加法器522k、 522j的同一存儲單元。
在所有交織已處理過一個樣本之后,計數(shù)器540才增長。由此,對于歷經(jīng) 全部交織的每一次循環(huán)(包括導頻交織),該計數(shù)可以保持不變。FFT模塊550k、 550J對存儲器530k、 530j中已存儲的累加的交織數(shù)據(jù)執(zhí) 行FFT。在圖5的示例中,F(xiàn)FT模塊550k、 550j對上述512個累加的樣本執(zhí)行 512-點FFT。 512-點FFT模塊550k、 550j的輸出代表了數(shù)據(jù)交織的子帶。
512-點FFT模塊550k、 550j的輸出耦合到相關聯(lián)的對數(shù)似然比(LLR)塊 580k、 5S0j,其中可以對每一個具有信息的子帶進行解碼。盡管在此所述的FFT 處理器和數(shù)據(jù)交織處理器510k、 510j實現(xiàn)了 LLR塊580k、 580j以便于對子帶 進行解碼,但是其它FFT處理器可以使用其它類型的解碼器。選擇用于FFT 處理器的解碼器的類型可以部分取決于發(fā)射機處所使用的編碼過程。例如,如 果數(shù)據(jù)是巻積編碼的,則FFT處理器可以使用維特比(Viterbi)解碼器。
LLR塊580k、 580j可以利用部分由導頻交織處理器510p所產(chǎn)生的信道估 計對子帶數(shù)據(jù)進行解碼。在圖5所示的示例中,導頻交織處理器510p包括旋 轉(zhuǎn)器510p和累加器520p,就像每一個數(shù)據(jù)交織處理器510k、 510j那樣。
累加器520p在存儲器530p中累加導頻樣本,其方式如同數(shù)據(jù)交織處理器 510k、510j中所實現(xiàn)的那樣。FFT模塊550p對累加的導頻樣本執(zhí)行512-點FFT, 以將時域表達變換成頻域?qū)ьl子帶。
FFT模塊550p的輸出耦合到導頻提取和解調(diào)模塊560。 OFDM系統(tǒng)可以在 頻率子帶定義的帶邊附近定義預定的防護頻帶以確保傳輸不超過所分配的帶 寬。在防護頻帶內(nèi)的子帶上不傳輸任何導頻或數(shù)據(jù)信息。
導頻外插和解調(diào)模塊560可以將這些數(shù)值外插到導頻子帶中,以估計防護 頻帶的子帶中的導頻數(shù)值。外插可以先于導頻解調(diào)而進行,在導頻解調(diào)過程中 對導頻子帶進行解調(diào)以恢復信道估計。導頻子帶是用已知的碼元或序列進行調(diào) 制的??梢杂脗坞S機序列對已知的碼元或序列進行擾頻,并且導頻外插和解調(diào) 模塊560可以在解調(diào)過程中對導頻子帶進行解擾。
經(jīng)解調(diào)、外插的導頻子帶代表了導頻子帶中的原始信道估計。IFFT模塊 560對這些原始信道估計進行操作以將這些信道估計變換成信道脈沖響應。在 圖5的示例中,IFFT模塊562執(zhí)行512-點IFFT,由此產(chǎn)生了 512-抽頭信道脈 沖響應。
信道脈沖響應耦合到旋轉(zhuǎn)器564,該旋轉(zhuǎn)器564所執(zhí)行的旋轉(zhuǎn)與在導頻交 織處理器510p中的初始旋轉(zhuǎn)器514p所執(zhí)行的旋轉(zhuǎn)基本上相反。旋轉(zhuǎn)器564的輸出耦合到時間濾波器566,其中信道脈沖響應可以經(jīng)時間濾波。時間濾波器
566可以被配置成部分基于當前的信道脈沖響應和附加的信道脈沖響應數(shù)值對 上述信道脈沖響應進行濾波。附加的信道脈沖響應數(shù)值可以包括過去的信道脈 沖響應數(shù)值以及將來的信道脈沖響應數(shù)值,其中將來的信道脈沖響應數(shù)值代表 了基于后續(xù)接收到的OFDM碼元的信道脈沖。
FFT處理器可以存儲多個碼元樣本并且可以確定每一個已存儲的碼元的信 道脈沖響應。通過存儲足夠數(shù)目的OFDM碼元并確定它們各自的信道估計,時 間濾波器566由此可以實現(xiàn)一種非因果濾波器。由此,時間濾波器可以對過去 充分確定的信道估計進行操作,以允許對后續(xù)碼元進行采樣和處理,相對于經(jīng) 濾波的信道脈沖響應而言這些后續(xù)碼元代表了 "將來的"碼元。
當然,時間濾波器566可以實現(xiàn)幾乎任何類型的濾波器,其中包括FIR、 IIR、或其它類型的濾波器。另外,時間濾波器566可以實現(xiàn)因果或非因果濾波 器響應。
經(jīng)時間濾波的導頻脈沖響應耦合到數(shù)據(jù)交織處理器510k、 510j,此處根據(jù) 涉及單個數(shù)據(jù)交織的參數(shù)對它作進一步的濾波或處理。導頻濾波器572k、 572j 可以部分基于該特定的數(shù)據(jù)交織來截取導頻脈沖響應或?qū)Ω鞣N脈沖響應抽頭 定閾值。
導頻濾波器572k、 572j的輸出耦合到旋轉(zhuǎn)器574k、 574j,該旋轉(zhuǎn)器使導頻 脈沖響應旋轉(zhuǎn)到特定的數(shù)據(jù)交織。旋轉(zhuǎn)器574k、 574j的輸出耦合到FFT模塊 576k、 576j,其中在數(shù)據(jù)交織頻率處將最終信道脈沖響應變換成信道頻率響應 估計。信道頻率響應估計耦合到LLR塊580k、 580j,以便用于對數(shù)據(jù)交織的子 帶進行解碼。
圖6是在OFDM處理器中共享的存儲器使用情況的簡化時間線600。 FFT 處理器的存儲器體系結構可以排列成多個存儲體。在FFT處理器的一個實施方 式(比如圖3或圖4的FFT處理器)中,存儲器可以排列成8個不同的存儲體。 存儲體l、 2和3用于輸入的樣本。存儲體4、 5和6存儲導頻信息。存儲體7 存儲精細頻率結果,并且存儲體8存儲信道估計結果。時間線600規(guī)定了存儲 體地址、數(shù)據(jù)和控制多路復用器的工作情況。
時間線600示出了輸入樣本流610的示例幀結構。輸入樣本流610可以按特定的順序排列。每一個信息的碼元(比如612)與相鄰的碼元隔開了循環(huán)前
綴614。 一些碼元可以包括橫跨整個碼元周期的數(shù)據(jù),而其它碼元可以具有能
在少于整個碼元周期內(nèi)捕獲的數(shù)據(jù)。
輸入的樣本存儲裝置620將輸入的樣本620引導至存儲體1、 2或3之一。 初始TDM導頻和開銷(OIS)信息被存儲在存儲體1中。之后,輸入的樣本在存 儲體1、 2和3中循環(huán)。
解調(diào)620對用于存儲當前輸入的樣本的存儲體進行操作。FFT引擎640在 捕獲到碼元之后再進行操作,并且利用存儲體1且循環(huán)經(jīng)過存儲體4、 5和6。
精細定時操作650出現(xiàn)在TDM導頻2碼元的一半期間并且利用存儲體l 和7進行工作。信道估計操作660對存儲體4、 5和6中的FFT結果進行操作, 并且還將存儲體8用于該結果。LLR塊670循環(huán)經(jīng)過用于輸入樣本的那些存儲 體。
時間線600示出了在FFT處理器的多個操作中是如何共享這些存儲體的。 時間線600示出了上述多個操作的定時是如何彼此相互依賴的。
樣本存儲器控制邏輯確定是否應該處理用于一碼元的任何數(shù)據(jù)。如果沒有 數(shù)據(jù)要處理,則用于該碼元時間的輸入樣本將不會被解調(diào)、存儲、或處理。然 而,在所期望的數(shù)據(jù)的開始之前的那個碼元中,對導頻信號進行解調(diào)以便于信 道估計。
FFT處理器中的各種操作的定時產(chǎn)生了大量的數(shù)據(jù)相關性。FFT和精細定 時塊必須在OIS信息開始之前就完成。具體來講,精細定時塊必須在接收到第 一個OIS碼元數(shù)據(jù)之前的一個循環(huán)就準備好。FFT、信道估計以及LLR塊必須 在比輸入樣本填滿存儲體所用時間要少的時間內(nèi)完成。
FFT處理器具有足夠大的存儲器以保存三個數(shù)據(jù)碼元。信道估計算法需要 來自下列碼元的導頻信息在當前進行數(shù)據(jù)處理的那個碼元之前、期間和之后 的碼元。這些樣本包括與串行到達的導頻數(shù)據(jù)交織的數(shù)據(jù)數(shù)值。在整個碼元都 被接收到之前,不執(zhí)行任何處理。因此,需要足夠大的存儲器來保存三個數(shù)據(jù) 碼元。
三個存儲器塊可以被用于以如下方式捕獲輸入碼元。第一存儲器(比如存 儲體l)收集來自AFC塊的輸入樣本。第二存儲器(比如存儲體2)保存數(shù)據(jù)數(shù)值。該存儲器被FFT處理單元中不同的計算引擎使用-FFT芯和信道估計塊。 第三存儲器(比如存儲體3)保存碼元交織數(shù)據(jù)。該存儲器被用于執(zhí)行大部分
的計算。
接收到的樣本以特定順序按列存儲,以優(yōu)化FFT處理。4096個樣本被劃 分成8個塊。塊O包含導頻信息,而塊1到7可以包含數(shù)據(jù)。
基數(shù)-8 FFT引擎需要將8個樣本輸入到其蝶形運算電路中。通過將這8個 樣本分組到單個存儲器行中,基數(shù)-8FFT引擎可以每一個循環(huán)都計算數(shù)值。
對于輸入的樣本數(shù)據(jù),讀取存儲體中合適的行。八個數(shù)值組成的行中的一 個數(shù)值在被回寫之前先進行更新?;鶖?shù)-8執(zhí)行512-點FFT共需要三個級。對存 儲器中不同的由8個行所構成的集合進行存取以執(zhí)行512-點FFT。
除了上述樣本存儲器以外,信道估計塊使用5個附加的存儲器。每一個存 儲器在大小方面都是512個樣本,其中有64個行,每一行有8個樣本。三個 信道估計存儲器保存過去的、當前的以及將來的導頻觀察。其它兩個信道估計 存儲器保存用于兩個時間濾波器電路的輸出。信道估計塊的最終輸出被往回存 儲到樣本存儲器的現(xiàn)用存儲體的導頻交織中。
圖7是利用共享存儲器的導頻處理的簡化功能框圖。從用于存儲樣本存儲 器導頻交織的存儲器710中讀取導頻數(shù)據(jù)。該導頻數(shù)據(jù)在旋轉(zhuǎn)器720中經(jīng)旋轉(zhuǎn) 之后再被存儲到三個信道估計存儲器740之一中。計數(shù)器在有現(xiàn)用數(shù)據(jù)時每一 個碼元就增加1,并且向多路復用器730指出要將導頻數(shù)據(jù)存儲到上述三個信 道估計存儲器740中的哪一個之中。
信道估計存儲器740中所存儲的信道估計被用在時間濾波器750中以產(chǎn)生 經(jīng)時間濾波的信道估計。時間濾波器750可以產(chǎn)生多個經(jīng)時間濾波的信道估計, 并且可以將上述多個經(jīng)時間濾波的信道估計存儲到相應的經(jīng)濾波的信道估計 存儲器760中。
第二旋轉(zhuǎn)器770可以組合或以其它方式選擇經(jīng)濾波的信道估計并且可以使 這些經(jīng)組合的信道估計發(fā)生旋轉(zhuǎn)。所得的信道估計被返回到樣本存儲器的存儲 體中。
圖8是信道處理狀態(tài)機的簡化狀態(tài)圖800。信道處理狀態(tài)機可以使用寄存 器設置以確定何時以及如何作用于輸入的數(shù)據(jù)碼元。對于任何給定的碼元,信道處理狀態(tài)機可以確定FFT處理器將要執(zhí)行多個功能中的任一個。
用于信道處理器的狀態(tài)機可以從空閑狀態(tài)轉(zhuǎn)變到操作確定狀態(tài)801,隨后 對輸入樣本進行解調(diào)。信道處理狀態(tài)機可以轉(zhuǎn)變到如下狀態(tài)提取用于信道估
計和信道估計的計算的導頻觀察803,向IFT塊請求動態(tài)時間跟蹤調(diào)節(jié) (DMTT)811;用于7個數(shù)據(jù)插槽中任何/全部的插槽的數(shù)據(jù)處理802;將數(shù)據(jù)從 7個數(shù)據(jù)插槽中任何/全部的插槽發(fā)送到LLR塊810;以及用于特殊幀0碼元的 特殊處理,比如WIC 809、 UC 813和TDM2精細定時處理804。
圖9是FFT處理器的一個實施方式的狀態(tài)圖卯0。該狀態(tài)圖示出了執(zhí)行導 頻處理、信道估計、LLR處理和FFT處理的各種狀態(tài)轉(zhuǎn)變。從該狀態(tài)圖可以看 出,在整個狀態(tài)機中可以使用FFT和IFFT操作,并且許多狀態(tài)轉(zhuǎn)變到或經(jīng)歷 FFT操作或IFFT操作。
圖IO是FFT引擎1000的一個實施方式的簡化功能框圖。因為FFT和IFFT 操作具有相似性,所以FFT引擎1000可以被配置成執(zhí)行FFT操作或IFFT操 作。FFT引擎是在512-點FFT的背景中進行描述的。然而,F(xiàn)FT引擎1000并 不限于這種實施方式,并且FFT引擎1000的各種元件的變化可以允許它執(zhí)行 其它FFT維度。
FFT引擎1000被配置成執(zhí)行利用頻率抽選所實現(xiàn)的512-點FFT。頻率抽 選和時間抽選之間的差異是旋轉(zhuǎn)存儲器系數(shù)。FFT引擎1000有利地利用基數(shù)-8 FFT,使得512-點FFT可以在三個級中進行。當然,其它基數(shù)數(shù)值或基數(shù)數(shù)值 的組合可以被用在FFT引擎1000中。例如,F(xiàn)FT引擎1000可以使用基數(shù)-2、 基數(shù)-4、基數(shù)-8FFT或不同基數(shù)FFT的組合。
FFT引擎IOOO包括樣本存儲器1010,用于存儲對其執(zhí)行FFT操作的復數(shù) 樣本。如上所述,該樣本存儲器可以在多個塊中被共享,并且經(jīng)處理的FFT結 果以及中間數(shù)值都可以被存儲在樣本存儲單元中以便于其它模塊來訪問。
FFT引擎IOOO包括用于訪問樣本存儲器的寄存器1020以便將這些樣本逐 行讀取到蝶形運算芯1030中。樣本存儲器行也可以被直接讀取到轉(zhuǎn)置存儲器 1040的行中,該轉(zhuǎn)置存儲器1040可以是寄存器存儲器。設置蝶形運算芯1030 以執(zhí)行FFT或IFFT,并且可以將它們作為單基數(shù)-8計算或雙基數(shù)-4計算來進 行計算。每一次蝶形運算操作的結果都按列寫入轉(zhuǎn)置存儲器1040,例如,該轉(zhuǎn)置存
儲器1040可以包括8X8配置的轉(zhuǎn)置寄存器。按行或列讀取來自轉(zhuǎn)置存儲器1040 的結果,并且將這些結果按行寫入樣本存儲器1010中。按列寫入后按行讀使 得存儲器中的內(nèi)容發(fā)生轉(zhuǎn)置。
用于FFT的每一級的旋轉(zhuǎn)因子可以被存儲在旋轉(zhuǎn)存儲器1070中,該存儲 器1070可以是旋轉(zhuǎn)ROM。這些旋轉(zhuǎn)因子可以排列成在存儲器的每一行中有四 個旋轉(zhuǎn)因子。
包括四個復數(shù)乘法器的乘法器模塊1060可以利用旋轉(zhuǎn)因子使轉(zhuǎn)置存儲器 1040中的數(shù)值發(fā)生旋轉(zhuǎn)。這四個復數(shù)乘法器與旋轉(zhuǎn)存儲器1070的單行中的旋 轉(zhuǎn)因子的個數(shù)一致,以允許單次循環(huán)中有四次復數(shù)乘法。
在歸一化寄存器1050中使轉(zhuǎn)置存儲器1040中的加權值歸一化,之后再回 寫到樣本存儲器1010的原始位置。
圖11示出了用于基數(shù)-8 FFT的完整的蝶形運算操作。通過調(diào)節(jié)區(qū)域A和 B中的旋轉(zhuǎn)乘法數(shù)值,便可以改變蝶形運算芯以執(zhí)行基數(shù)-8點IFFT。為了執(zhí)行 基數(shù)-4計算,使用第二級加法器的結果(圖11中的Out4),而非最終求和(圖 11中的Out8)。
從存儲器中讀取的所有數(shù)值都可以被立即登記。圖11示出了當該蝶形運 算芯以基數(shù)-8模式工作時所使用的寄存器。當?shù)芜\算芯作為2個基數(shù)-4段來 操作時,輸入數(shù)值來自寄存器轉(zhuǎn)置塊中的寄存器,因此,不需要被再次登記。
在第一組加法器之前,對這些輸入進行位-反轉(zhuǎn)。對于基數(shù)-8操作,這是 全3-位反轉(zhuǎn)0->0, 1->4, 2-〉2, 3-〉6, 4->1, 5->5, 6->3, 7-〉7。對于基數(shù)-4
操作,每一組的四個輸入使用2-位反轉(zhuǎn)0->0; 1->2; 2->1 ; 3->3; 4->4; 5->6;
6-〉5; 7-〉7。
當這些數(shù)值通過每一組加法器前進時,它們的位寬增大1以防止飽和。輸
入數(shù)值由9位來表示。第一種和是用10位表示的。Out4數(shù)值是用ll位表示的, 并且Out8數(shù)值是用12位表示的。
如圖11所示,A區(qū)域中的第4個和第8個和必須乘以w(2)以便進行FFT。 對于IFFT,該數(shù)值變?yōu)閣(6)。旋轉(zhuǎn)因子W(k)的確定過程由下式確定W(k)二exp C -j2兀k/8)。上述W。)乘法按以下方式來實現(xiàn)
wO等于(I+jQ) * (1 +jO) = I+jQ,從而消除了任何修正需求。 w'等于(I+jQ"(l/sqrt(2)-j/sqrt(2))。需要一個復數(shù)乘法器。對于1/sqrt(2)
的數(shù)值,使用9位帶碼元常數(shù)。
w2等于(1 + jQ) * (0 - jl) = Q - jl。不再對該輸入的實部執(zhí)行2補碼求反并 隨后作加法,而是令該實部的數(shù)值保持不變并且將后面的加法器變?yōu)闇p法器以 解釋上述碼元變化。
3等于(1 +JQ) * (國l/sqrt(2) - j/sqrt(2))。需要一個復數(shù)乘法器。對于1/sqrt(2) 的數(shù)值,使用9位帶碼元常數(shù)。
w4等于(I+jQ) * (-1+jO) = -I-jQ。然而,該數(shù)值不用于任何FFT計算。
w5等于(I+jQ) * (-1+j/sqrt(2))。需要一個復數(shù)乘法器。對于1/sqrt(2)的數(shù) 值,使用9位帶碼元常數(shù)。
6等于(1 + jQ) * (0 + jl) = -Q + jl。不再對該輸入的虛部執(zhí)行2補碼求反 并隨后作加法,而是令該虛部的數(shù)值保持不變并且將后面的加法器變?yōu)闇p法器 以解釋上述碼元變化。
w 等于(I + jQ) * (1/sqrt(2) +j/sqrt(2))。需要一個復數(shù)乘法器。對于1/sqrt(2) 的數(shù)值,使用9位帶碼元常數(shù)。
圖12是基數(shù)-8 FFT蝶形運算的前兩種狀態(tài)的一個實施方式的功能框圖。 部分蝶形運算芯1200包括從圖11所示的蝶形運算芯蝶形1100的Out4的計算。
兩組減法器被用于第四和第八求和過程。 一組計算w(2),而另一組計算 w(6)。 fft—ifft—n信號控制究竟使用哪一個求和過程。
圖13是基數(shù)-8 FFT蝶形運算的最后一級的一個實施方式的功能框圖。部 分蝶形運算芯1200包括從圖11所示的0ut4到蝶形運算芯1100的輸出的計算。
對于B區(qū)域中的第六和第八數(shù)值,需要真正的復數(shù)乘法器。
當執(zhí)行FFT時,它們是w(l)和w(3)。
當執(zhí)行IFFT時,它們分別是w(7)和w(5)。
對于w(l)/w(7),乘積和是
P = 1/sqrt(2),
W(l) = PI + PQ+j(-PI + PQ)W(7) = PI- PQ十j(PI + PQ)使用fft—ifft—n信號以便控制輸入數(shù)值到加法器和減法器,并且控制上述和 與差至其最終目的地。這種實現(xiàn)方式只需要兩個乘法器和兩個加法器(一個加 法器和一個減法器)。對于w(3)/w(7),乘積和是P = l/sqrt(2),W(3) = -PI+ PQ + j(-PI - PQ) W(5)=隱PI - PQ +j(PI - PQ)不再使用P, fft一core將R二-l/sqrt(2)用于這些乘積和。通過使用R,這些 方程變?yōu)閃(3) = RI- RQ +j(RI + RQ) W(5) = RI + RQ + j(陽RI + RQ)這些乘積和是20位寬,攜帶了兩個碼元位。當加上這些乘積和時,它們 變?yōu)?0位寬,攜帶了一個碼元位。然后,通過舍入8個最低有效位(LSB)并使 一個MSB飽和,便將這些和歸一化到11位。使用信號fft_ifft_n以便控制輸入數(shù)值到加法器和減法器,并且控制上述和 與差至它們的最終目的地。如上,只需要兩個乘法器和兩個加法器(一個加法 器和一個減法器)。區(qū)域B中的平凡的乘法w(2)或w(6)以與區(qū)域A相同的方式來進行處理。為了符合定時,在不包括多余硬件的情況下所有這些計算通常都無法在單 個時鐘周期中完成。添加了一組寄存器以捕獲Out4數(shù)值中的大部分數(shù)值。用 于第六和第八的Out4數(shù)值在被登記之前要與常數(shù)P和R相乘。寄存器的這種 排布以如下方式平衡了用于最不利路徑的計算第一循環(huán)多路復用器=> 加法器=> 加法器=> 多路復用器=> 乘法器第二循環(huán)加法器=> 多路復用器=> 加法器=> 加法器 最后,使用fft512_4—n信號以便發(fā)出Out4或Out8數(shù)值。Out4數(shù)值從11 位碼元擴展成12位。FFT塊使用三次穿過基數(shù)-8蝶形運算芯以執(zhí)行單個512點FFT。為了實現(xiàn)這一點,來自前兩次穿過的結果必須使其數(shù)值中的一些乘以旋轉(zhuǎn)數(shù)值并使它們 歸一化。因為存儲器的單行中存儲了 8個數(shù)值,所以讀取這些數(shù)值的順序不同 于回寫這些數(shù)值的順序。如果執(zhí)行2kl/FFT,則存儲器數(shù)值必須在被發(fā)送到蝶 形運算芯之前先被轉(zhuǎn)置?;鶖?shù)-8 FFT使用8x8個寄存器。所有64個寄存器接收來自蝶形運算芯的 輸入。其中的56個寄存器接收來自復數(shù)乘法器的輸入。32個寄存器接收來自 存儲器體系結構中的主存儲器的輸入。每一個寄存器可以在其輸入處具有2: 1 或3 : 1的多路復用器。來自主存儲器的輸入被寫到一行寄存器。來自蝶形運算 芯的輸入被寫入多列寄存器。來自復數(shù)乘法器的輸入是分多組來進行的。所有64個寄存器都通過歸一化計算和寄存器將輸出發(fā)送到主存儲器。對 于I/FFT的每一種類型和級,歸一化的順序都是不同的。所有64個寄存器都可以將輸出發(fā)送到復數(shù)乘法器。56個寄存器需要旋轉(zhuǎn) 乘法,32個寄存器需要平方運算。32個寄存器讓其值發(fā)送到蝶形運算芯。這些數(shù)值被逐行發(fā)送到歸一化電路以便于下列操作數(shù)據(jù)FFT,信道估計 FFT, WIC/LIC處理,以及精細定時IFFT。這些數(shù)值被逐列發(fā)送以便于信道估計IFFT、導頻FFT和IFFT。當這些數(shù)值被發(fā)送到蝶形運算芯時,它們是逐列被發(fā)送的。當這些數(shù)值被 發(fā)送到復數(shù)乘法器時,它們是分組實現(xiàn)的。圖14是用于顯示基數(shù)-8 FFT中的旋轉(zhuǎn)乘法順序的轉(zhuǎn)置存儲器1400的簡化 表示。為了減小執(zhí)行整個基數(shù)-8FFT所必需的循環(huán)的總數(shù),F(xiàn)FT運算是高度流 水線化的。 一旦這些數(shù)值被從蝶形運算芯中輸出并被登記在轉(zhuǎn)置存儲器1400 中,則它們可以被發(fā)送用于旋轉(zhuǎn)乘法。旋轉(zhuǎn)乘法的排序基于對來自蝶形運算芯的數(shù)值進行逐列登記;以及將經(jīng) 旋轉(zhuǎn)乘法的數(shù)值逐行發(fā)送到存儲器。對于整個基數(shù)-8FFT運算,最少需要8個 讀取加8個寫入循環(huán)。如果至少有16個循環(huán)可用,則將四個復數(shù)乘法器用于 旋轉(zhuǎn)操作需要14個循環(huán)。任何更少的乘法器都將使存儲器回寫操作停止,而 任何附加的乘法器都將是多余的硬件即至少對于一半的流水線而言將是空閑 的,從而浪費資源。在圖IO所示的實施方式中,整個基數(shù)-8 FFT運算需要21 個循環(huán)。圖14的轉(zhuǎn)置存儲器1400的第一列中的數(shù)值不需要旋轉(zhuǎn)乘法。 一旦第二列 被寫入,則分組1中的數(shù)值就可以被發(fā)送到復數(shù)乘法器。這一過程不斷重復直到分組7。前7個分組中所有的數(shù)值都是按列相鄰的。此時,前4行己準備好 被發(fā)送到主存儲器,而最底下4行則被旋轉(zhuǎn)相乘。其余分組的數(shù)值都是以按行分組的方式進行檢索的。每一按行分組都可以被視為相鄰的行數(shù)值,其中這些數(shù)值以循環(huán)方式相鄰。由此,在分組9中,數(shù) 值[4, O]循環(huán)地鄰接到最后一個數(shù)值n即行[4, 7]。圖15是流水線化的基數(shù)-8、 512-點、FFT運算的簡化定時圖。圖15中的 流水線時線1500示出了用于基數(shù)-8計算的蝶形運算計算、旋轉(zhuǎn)計算和歸一化 計算的重疊本性。在循環(huán)0期間,存儲器的第一行中的8個數(shù)值中的第一個數(shù)值被讀取(圖 M中的數(shù)值O)。來自存儲器的數(shù)值可用于下一個循環(huán)的FFT。來自存儲器的 數(shù)值在被作用之前先被登記。這導致存儲器訪問的一個循環(huán)的延遲。由此,直 到cycle—count = 2,這些輸入芯寄存器才具有有效用于第一存儲器行的數(shù)據(jù)。 為了符合定時要求,蝶形運算計算花了兩個循環(huán)。當cycle—count = 3時,對于 第一存儲器行而言已執(zhí)行了一半的蝶形運算計算。當cycle—count = 4時,蝶形 運算計算已完成并且這些結果被記錄在轉(zhuǎn)置寄存器存儲體中。為了在cycle count = 4時已準備好正確的旋轉(zhuǎn)系數(shù)數(shù)值,當cycle—count = 3 時就必須驅(qū)動旋轉(zhuǎn)存儲器的地址即rw—addr。這些系數(shù)在cycle—count = 4時都 已被記錄好并且可在cycle—count =5時用于乘以第二組蝶形運算結果。當cycle_count = 11時,用于分組7的數(shù)值被回寫到轉(zhuǎn)置寄存器。此時, 圖14的前四行都已完成并且可以被歸一化和回讀到存儲器。當cycle—count = 12時,第一行寄存器被讀取且這些數(shù)值被歸一化。歸一 化后的數(shù)值被存儲在歸一化寄存器中,它與包括轉(zhuǎn)置寄存器在內(nèi)的上述64個 寄存器是分開的。當Cycle_COunt= 13時,來自歸一化寄存器的數(shù)值被回送到主 存儲器。在任何I/FFT的第三級期間沒有發(fā)生任何旋轉(zhuǎn)乘法。由此,用該流水 線定時來進行逐列回寫(用于數(shù)據(jù)FFT)沒有任何問題。圖16是流水線化的2048-點FFT的簡化定時圖1600。流水線的定時圖1600 示出了從一組512-點FFT結果開始的用于執(zhí)行2048-點FFT的各項操作。2048-點FFT的操作與512-點FFT非常相似。然而,因為2048不是8的冪, 所以該FFT對512-點FFT的結果執(zhí)行基數(shù)-4操作。當執(zhí)行2048-點I/FFT時,四個不同的512點I/FFT的結果經(jīng)歷了基數(shù)-4 操作。從上述四個交織中的每一個交織處讀取一行,512個數(shù)值都經(jīng)歷了 512-點1/FFT。存儲器體系結構允許將交織數(shù)值用作多路復用器而非地址,該多路復用器 在正被討論的四個不同的交織中進行選擇。結果,當cycle_cnt= 1時,來自用 于所有4個交織的存儲單元0的數(shù)值都已準備好,并且fft一intl被用于選擇到合 適的數(shù)值。當CyCle_Cnt = 5,所有四個行都已被讀取并且前兩列被發(fā)送到蝶形 運算芯。蝶形運算芯在一個循環(huán)中執(zhí)行兩個基數(shù)-4計算并且將該數(shù)值返回到轉(zhuǎn) 置寄存器。為了減小各寄存器輸入的復雜性,在它們源自的那一列的最底下四 個寄存器中捕獲了每一對中用于第二列的四個數(shù)值。然后,通過使用用于執(zhí)行 旋轉(zhuǎn)乘法的樣本復數(shù)乘法器,使基數(shù)-4結果作平方運算。當cycle一cnt = 6時, 平方后的數(shù)值在被回寫到存儲器之前已準備好進行歸一化。因位寬限制,對平 方后的數(shù)值執(zhí)行不同的歸一化。這些歸一化后的數(shù)值被寫入初始精細定時塊即 IFT。在存儲器中組織旋轉(zhuǎn)系數(shù),使每一行上有四個數(shù)值??赡苡欣氖?,在存 儲器中與FFT特定的級相關聯(lián)的多個行中存儲旋轉(zhuǎn)數(shù)值,而非試圖計算這些數(shù) 值或者存儲一組非多余的旋轉(zhuǎn)數(shù)值并試圖尋址所期望的數(shù)值。56次乘法在每一個循環(huán)中執(zhí)行4次,由此需要14個循環(huán)。為了確定各種 旋轉(zhuǎn)系數(shù)的位置,需要用圖14所給出的乘法順序來覆蓋512-點和64-點系數(shù)矩 陣。當一行數(shù)據(jù)完成時,它被回寫到存儲體。在前8行(0、 8、 16等)被回寫之后,讀取接下來的8行。對于第一級,它 們是行l(wèi)、 9、 17等。在行7、 15、 23等被處理之后,F(xiàn)FT將推進到第二級。對 于第二和第三級,按順序地訪問這些行。寄存器數(shù)值是12位寬。旋轉(zhuǎn)系數(shù)是8位寬。所得的20位乘積在被存儲到 轉(zhuǎn)置寄存器之前先舍入到12位。當執(zhí)行信道估計的第一或第三級時,出現(xiàn)了 舍入。向12個MSB添加第13位。對于所有其它情況,不執(zhí)行舍入并且所有 歸一化都留了下來直到后來。簡單地返回12個MSB。使用相同的12x8乘法器來執(zhí)行平方運算。在基數(shù)-4操作之后,寄存器數(shù) 值是11位寬。對于一個乘法器輸入,將寄存器數(shù)值碼元擴展到12位。為了獲得用于其它乘法器輸入的8位,寄存器數(shù)值將其兩個LSB舍去并且接下來對照 MSB進行飽和檢查。然后,上述20位乘積被舍入到14位并且經(jīng)飽和檢查降至 11位。這ll位數(shù)值被發(fā)送到IFT塊以便于進一步的計算。圖17是用于處理OFDM信號的方法1700的簡化流程圖。例如,該方法可 以由圖3或4的FFT處理器或圖1的系統(tǒng)的用戶終端來執(zhí)行。方法1700始于框1710,此時FFT處理器接收樣本,其中這些樣本是接收 到的OFDM碼元或接收到的OFDM碼元碼片的復數(shù)樣本。FFT處理器繼續(xù)到 框1720并且對每一個接收到的樣本進行解調(diào)。FFT處理器繼續(xù)到框1730并且 將解調(diào)后的樣本存儲到存儲器中,例如存儲到圖3所示存儲器體系結構的樣本 存儲體中。FFT處理器繼續(xù)到框1740并且從解調(diào)后的樣本中確定出信道估計。在一 個實施方式中,解調(diào)后的樣本是作為多個交織樣本被存儲的,并且FFT處理器 基于導頻交織來確定信道估計。FFT處理器繼續(xù)到框750并且確定與一個或多個數(shù)據(jù)交織相對應的數(shù)據(jù)子 帶。每一個子帶可以在其上具有解碼后的數(shù)據(jù),并且FFT處理器或相關的模塊 可以執(zhí)行子帶數(shù)據(jù)的解碼。在一個實施方式中,上述子帶數(shù)據(jù)與用于交織中的 每一個子帶的信道估計一起在LLR模塊中被處理。圖18是對碼元樣本進行解調(diào)的方法1720的簡化流程圖。方法1720可以 對應于圖17所示方法中所執(zhí)行的解調(diào)動作。對樣本進行解調(diào)的方法1720可以 由圖3或圖4的FFT處理器來執(zhí)行。更具體地講,對碼元樣本進行解調(diào)的方法 可以由圖3的解調(diào)塊來執(zhí)行。解調(diào)塊可以包括許多計數(shù)器,并且可以通過在上述碼元的開始處使所有計 數(shù)器都復位從而開始方法1720。上述碼元的開始可以改變一小量,但是如果開 始時間的誤差小于任何OFDM循環(huán)前綴的持續(xù)時間,則對于解調(diào)的方法1720 的目的而言上述小量可能是可忽略的。解調(diào)塊繼續(xù)到框1820并且從OFDM碼元內(nèi)的多個交織中確定一個交織。 例如,解調(diào)框可以用模數(shù)-M計數(shù)器來跟蹤該交織,其中數(shù)字M對應于交織的個數(shù)。最初,該計數(shù)器可以被設為零并且可以在每一個樣本之后將增加1。解調(diào)塊繼續(xù)到框1830并且使接收到的樣本旋轉(zhuǎn)。在一個實施方式中,解 調(diào)塊使接收到的碼元旋轉(zhuǎn)了一個基于上述交織而確定的固定值。由此,對于具有8個交織的OFDM碼元而言,輸入的樣本將旋轉(zhuǎn)8個相位之一。在使樣本旋轉(zhuǎn)之后,解調(diào)塊繼續(xù)到框1840并且累加經(jīng)旋轉(zhuǎn)的樣本。解調(diào) 塊可以被配置成累加P個交織數(shù)值的M個經(jīng)旋轉(zhuǎn)的樣本。g卩,當OFDM碼元 包括M個交織時,在每一個交織都具有P個子帶的情況下,解調(diào)塊可以使前P 個樣本旋轉(zhuǎn)并且存儲它們,然后旋轉(zhuǎn)并累加模數(shù)-P配置中的樣本,直到碼元的 全部樣本都已被接收到、經(jīng)旋轉(zhuǎn)且經(jīng)累加。在每一次累加之后,解調(diào)塊繼續(xù)到確定框1850以確定是否所有的碼元樣 本都已經(jīng)被解調(diào)了。例如,通過確定第M個交織的第P個數(shù)值已累加了M個 數(shù)值,解調(diào)塊可以確定碼元樣本的完成。如果這些碼元樣本都經(jīng)過解調(diào),則解調(diào)塊繼續(xù)到框1860并且用碼元解調(diào) 來實現(xiàn)。解調(diào)塊可以繼續(xù)到下一個碼元解調(diào)。如果在確定框1850處該解調(diào)塊 確定并未處理過所有的碼元樣本,則解調(diào)塊繼續(xù)回到塊1820以確定下一個到 達的碼元樣本的交織。圖19是用于處理OFDM信號的方法1900的簡化流程圖。方法l卯0可以 由圖3和4所示的FFT處理器來執(zhí)行。特別是,方法1900可以由圖10的FFT 引擎來執(zhí)行。方法1900始于框1910,此時FFT引擎讀取樣本存儲器的多行。在一個實 施方式中,F(xiàn)FT引擎記錄從樣本存儲器中讀取的每一個數(shù)值。FFT引擎繼續(xù)到框1920并且對一行中的數(shù)值執(zhí)行蝶形運算。有利的是, 樣本存儲器的每一行都存儲許多樣本數(shù)值,其個數(shù)等于FFT基數(shù)數(shù)值。由此, 單行讀取可以載入用于單基數(shù)-RFFT的所有數(shù)值。FFT引擎繼續(xù)到框1930并且從旋轉(zhuǎn)存儲器中檢索一行旋轉(zhuǎn)因子。旋轉(zhuǎn)因 子行可以具有比樣本存儲器行較少的數(shù)值。在一個實施方式中,樣本存儲器的 每一行都包括8個樣本數(shù)值,并且旋轉(zhuǎn)存儲器在每一行中存儲了四個旋轉(zhuǎn)因子。FFT引擎繼續(xù)到框1940并且使蝶形運算數(shù)值乘以旋轉(zhuǎn)因子。在一個實施 方式中,復數(shù)乘法器的個數(shù)等于旋轉(zhuǎn)存儲器的一行中的旋轉(zhuǎn)因子的個數(shù),并且旋轉(zhuǎn)因子乘法可以在一個循環(huán)中執(zhí)行。因為有比旋轉(zhuǎn)因子更多的蝶形運算數(shù) 值,所以為了完成基數(shù)-RFFT的每一級,可能需要執(zhí)行不止一個乘法步驟。對 于FFT的每一級,每一個蝶形運算數(shù)值通常只與一個旋轉(zhuǎn)因子相乘。 一些蝶形運算數(shù)值可能不需要復數(shù)乘法函數(shù),因為旋轉(zhuǎn)因子可以在沒有乘法的情況下被執(zhí)行。在使蝶形運算數(shù)值乘以旋轉(zhuǎn)因子之后,F(xiàn)FT引擎將經(jīng)旋轉(zhuǎn)的數(shù)值回寫到存 儲器或回寫到寄存器,并且該行數(shù)值的處理便完成了。由此,F(xiàn)FT引擎可以執(zhí) 行基數(shù)-RFFT,比如基數(shù)-8FFT,只從存儲器中讀取了8次。圖20是FFT處理器2000的簡化功能框圖。FFT處理器包括用于解調(diào)的裝 置,它耦合到用于存儲數(shù)據(jù)的裝置。在各種模塊中共享該用于存儲數(shù)據(jù)的裝置。 用于變換樣本的裝置可以耦合到用于存儲數(shù)據(jù)的裝置。用于估計信道的裝置也 可以耦合到用于存儲數(shù)據(jù)的裝置并且可以對己存儲的數(shù)據(jù)進行運算。對用于變 換樣本數(shù)值的裝置所產(chǎn)生的子帶信息進行解碼的裝置可以對經(jīng)變換的樣本數(shù) 值進行操作。圖21是FFT引擎2100的簡化功能框圖。FFT引擎2100包括用于存儲樣 本的裝置,這些樣本可能是經(jīng)解調(diào)的OFDM碼元樣本。用于存儲樣本的裝置耦 合到用于計算蝶形運算的裝置。用于處理的裝置可以被配置成將來自用于存儲 樣本的裝置的數(shù)值載入寄存器中以便于用于計算蝶形運算的裝置進行操作。用于計算蝶形運算的裝置被配置成對檢索到的樣本計算蝶形運算數(shù)值,將 計算后的蝶形運算數(shù)值寫入用于使數(shù)值轉(zhuǎn)置的裝置。這些數(shù)據(jù)可以按列被寫入 用于使數(shù)值轉(zhuǎn)置的裝置,并且按行對這些數(shù)據(jù)進行讀取,以能夠使這些數(shù)值發(fā) 生轉(zhuǎn)置。用于存儲系數(shù)的裝置可以被用于將旋轉(zhuǎn)因子存儲到多行中。用于使數(shù)值歸 一化的裝置可以被用于使來自用于使數(shù)值轉(zhuǎn)置的裝置的數(shù)值歸一化。上文已描述了許多FFT處理器、FFT引擎以及用于處理OFDM碼元的方 法。利用共享存儲器體系結構使多個模塊整合在一起便可以極大地簡化OFDM 接收機設計。FFT引擎可以按這樣一種方式進行實施從而極大地減少了 FFT循 環(huán)計數(shù),同時不會使任何昂貴的資源(比如復數(shù)乘法器)利用不足。在本文中,術語耦合或連接用于指非直接耦合和直接耦合或連接。當兩個或更多個塊、模塊、設備、或裝置耦合時,在上述兩個相耦合的塊之間可能有 一個或更多個中間的塊。結合本文所揭示的各實施方式加以描述的各種說明性邏輯塊、模塊以及電 路可以與下列各種設備一起實現(xiàn)或執(zhí)行通用處理器,數(shù)字信號處理器(DSP), 精簡指令集計算機(RISC)處理器,專用集成電路(ASIC),現(xiàn)場可編程門陣列(FPGA)或其它可編程邏輯器件,分立的門或晶體管邏輯,分立的硬件組件,或者用于執(zhí)行本文所描述的各種功能的上述設備的任意組合。通用處理器可以是 微處理器,但在替代方案中,該處理器可以是任何處理器、控制器、微控制器、或狀態(tài)機。處理器可以被實現(xiàn)成各種計算設備的組合,例如,DSP和微處理器 的組合,多個微處理器,與DSP芯相結合的一個或多個微處理器,或者任何其 它這樣的配置。結合本文各實施方式所描述的方法、過程、或算法的諸多步驟可以直接以 硬件、處理器所執(zhí)行的軟件模塊、或這兩者的結合來實施。方法或過程中的各 步驟或動作可以按所示的順序來執(zhí)行,或者可以按另一種順序來執(zhí)行。另外, 一個或多個過程或方法的步驟可能省略,或者一個或多個過程或方法的步驟可 以被添加到上述方法和過程中。附加的步驟、塊、或動作可以被添加到上述方 法和過程的開始、結束、或中間。上文描述了所公開的各種實施方式,以使本領域普通技術人員能夠重現(xiàn)或 利用本發(fā)明。這些實施方式的各種修改對于本領域的技術人員而言都是很明顯 的,在不背離本發(fā)明的精神或范圍的情況下本文所定義的一般原則可以應用于 其它實施方式。由此,本發(fā)明并不限于本文所示的各種實施方式,而是符合與 本文所揭示的原理和新穎特征相一致的最寬的范圍。
權利要求
1.一種快速傅立葉變換(FFT)處理裝置,所述裝置包括樣本存儲器,所述樣本存儲器的每一行中所存儲的樣本數(shù)值的個數(shù)等于所述FFT的基數(shù);轉(zhuǎn)置存儲器;蝶形運算芯,它被配置成接收來自所述樣本存儲器的一行數(shù)值、對這些數(shù)值執(zhí)行蝶形運算操作、并將結果寫入所述轉(zhuǎn)置存儲器的一列中;以及乘法器模塊,它被配置成從所述轉(zhuǎn)置存儲器中檢索預定數(shù)目的相鄰數(shù)值并且使每一個這樣的數(shù)值都乘以旋轉(zhuǎn)因子。
2. 如權利要求l所述的裝置,其特征在于,所述預定數(shù)目的相鄰數(shù)值是按列相鄰的數(shù)值。
3. 如權利要求l所述的裝置,其特征在于,所述預定數(shù)目的相鄰數(shù)值是按行相鄰的數(shù)值。
4. 如權利要求l所述的裝置,其特征在于,所述預定數(shù)目的相鄰數(shù)值是按行循環(huán)相鄰的數(shù)值。
5. 如權利要求l所述的裝置,其特征在于,所述蝶形運算芯適于執(zhí)行基數(shù)-R FFT,并且所述轉(zhuǎn)置存儲器包括RXR寄存器。
6. 如權利要求l所述的裝置,還包括旋轉(zhuǎn)存儲器,它被配置成在同一行內(nèi)存 儲其個數(shù)等于單個時鐘周期中可執(zhí)行的復數(shù)乘法的次數(shù)的旋轉(zhuǎn)因子。
7. 如權利要求l所述的裝置,其特征在于,所述乘法器模塊包括多個復數(shù)乘 法器。
8. 如權利要求l所述的裝置,其特征在于,所述乘法器模塊包括多個復數(shù)乘 法器,其個數(shù)基于旋轉(zhuǎn)運算的最大數(shù)目以及等于蝶形運算基數(shù)數(shù)值兩倍的時鐘周期 的最小數(shù)目。
9. 一種快速傅立葉變換(FFT)處理裝置,所述裝置包括 樣本存儲器,它適于在每一行中存儲8個復數(shù)樣本數(shù)值; 轉(zhuǎn)置存儲器,它排列成8X8個存儲單元;基數(shù)-8蝶形運算芯,它適于檢索一行數(shù)值、執(zhí)行基數(shù)-8蝶形運算、并將輸出數(shù)值按列寫入所述轉(zhuǎn)置存儲器;旋轉(zhuǎn)存儲器,它適于在每一行中存儲4個旋轉(zhuǎn)數(shù)值;以及具有4個復數(shù)乘法器的乘法器模塊,所述乘法器模塊適于檢索來自旋轉(zhuǎn)存儲 器的一行以及來自轉(zhuǎn)置存儲器的4個相鄰數(shù)值、用來自旋轉(zhuǎn)存儲器行的數(shù)值對來自 相鄰轉(zhuǎn)置存儲單元的4個數(shù)值執(zhí)行復數(shù)乘法運算、并將乘積回寫到所述4個相鄰的 轉(zhuǎn)置存儲單元。
10. 如權利要求9所述的裝置,其特征在于,所述相鄰的轉(zhuǎn)置存儲單元包括按列相鄰的存儲單元。
11. 如權利要求9所述的裝置,其特征在于,所述相鄰的轉(zhuǎn)置存儲單元包括按行循環(huán)相鄰的存儲單元。
12. 如權利要求9所述的裝置,其特征在于,所述相鄰的轉(zhuǎn)置存儲單元包括 用于一周期子集的按列存儲單元以及用于一不同周期子集的按行循環(huán)相鄰存儲單元。
13. —種用于執(zhí)行快速傅里葉變換(FFT)處理操作的方法,所述方法包括 讀取樣本存儲器的多個行,其每行樣本個數(shù)等于所述FFT的基數(shù); 針對樣本存儲器的一行中的數(shù)值確定蝶形運算,并且將蝶形運算數(shù)值按列寫入轉(zhuǎn)置存儲器中;檢索一行旋轉(zhuǎn)因子,所述的行中存儲有多個旋轉(zhuǎn)因子數(shù)值; 在單個周期內(nèi)使多個蝶形運算數(shù)值乘以所述旋轉(zhuǎn)因子數(shù)值以產(chǎn)生經(jīng)旋轉(zhuǎn)的蝶形運算數(shù)值;以及將所述經(jīng)旋轉(zhuǎn)的蝶形運算數(shù)值回寫到所述多個蝶形運算數(shù)值的存儲單元。
14. 如權利要求13所述的方法,還包括從所述轉(zhuǎn)置存儲器中的相鄰寄存器中檢索多個蝶形運算數(shù)值。
15. 如權利要求14所述的方法,其特征在于,所述相鄰的寄存器包括按列相鄰的寄存器。
16. 如權利要求14所述的方法,其特征在于,所述相鄰的寄存器包括循環(huán)相 鄰的按行寄存器。
17. 如權利要求13所述的方法,其特征在于,檢索一行旋轉(zhuǎn)因子包括從具 有基于最大FFT維度而確定的多個行的旋轉(zhuǎn)存儲器中檢索一行。
18. 如權利要求13所述的方法,其特征在于,乘以多個蝶形運算數(shù)值包括 執(zhí)行所述旋轉(zhuǎn)因子與所述蝶形運算數(shù)值的復數(shù)乘法。
19. 一種快速傅里葉變換(FFT)處理裝置,所述裝置包括用于在每一行中存儲許多樣本數(shù)值的裝置,每一行中所存儲的樣本數(shù)值的個 數(shù)等于所述FFT的基數(shù);用于使多個數(shù)值轉(zhuǎn)置的裝置;用于計算蝶形運算的裝置,它被配置成接收來自樣本存儲器的一行數(shù)值、對這些數(shù)值執(zhí)行蝶形運算操作、并將結果寫入轉(zhuǎn)置存儲器的一列中;以及用于使來自轉(zhuǎn)置存儲器的預定數(shù)目的相鄰數(shù)值乘以相應的旋轉(zhuǎn)因子的裝置。
20. —種計算機可讀介質(zhì),它編碼有計算機程序以執(zhí)行如下步驟讀取樣本存儲器的多個行,每行的樣本數(shù)等于FFT的基數(shù);針對樣本存儲器的一行中的數(shù)值確定蝶形運算,并且將蝶形運算數(shù)值按列寫入轉(zhuǎn)置存儲器;檢索一行旋轉(zhuǎn)因子,所述的行中存儲有多個旋轉(zhuǎn)因子數(shù)值; 在單個周期內(nèi)使多個蝶形運算數(shù)值乘以所述旋轉(zhuǎn)因子數(shù)值以產(chǎn)生經(jīng)旋轉(zhuǎn)的蝶形運算數(shù)值;以及將經(jīng)旋轉(zhuǎn)的蝶形運算數(shù)值回寫到所述多個蝶形運算數(shù)值的存儲單元。
全文摘要
一種FFT引擎,用于實現(xiàn)一種在多級中應用旋轉(zhuǎn)乘法的循環(huán)計數(shù)方法。當實現(xiàn)多級FFT時,中間數(shù)值需要乘以各種旋轉(zhuǎn)因子。在高效的流水線中,F(xiàn)FT引擎使用最少個數(shù)的乘法器來執(zhí)行旋轉(zhuǎn)乘法。基于FFT基數(shù)和存儲器的每一行中數(shù)值的數(shù)量來優(yōu)化復數(shù)乘法器的數(shù)量這一做法允許用合理的存儲空間量和數(shù)目最少的循環(huán)來執(zhí)行FFT功能。這些數(shù)值的戰(zhàn)略排序和分組允許以個數(shù)更少的循環(huán)來執(zhí)行FFT運算。
文檔編號H04L27/26GK101300572SQ200680013483
公開日2008年11月5日 申請日期2006年3月13日 優(yōu)先權日2005年3月11日
發(fā)明者K·S·庫森紐, R·克里希納穆斯 申請人:高通股份有限公司