Xem mẫu
- Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)
Tối Ưu Và Thực Thi Khối Giải mã Cầu trong hệ
thống MIMO
Nguyễn Đức Thắng1, Vũ Tiến Anh1, Nguyễn Minh Thường2, Trần Xuân Nam1, Trịnh Quang Kiên1,
1
Trường Đại học Kỹ thuật Lê Quý Đôn;
2
Viện Khoa học và Công nghệ quân sự;
Email: ducthang98mta@gmail.com, vtienanhmta@gmail.com
Abstract— Trong bài báo này, chúng tôi đề xuất cấu trúc mới tìm kiếm kết hợp giữa cây tìm kiếm theo chiều sâu kết hợp với
của bộ giải mã cầu K-best và tổng hợp thiết kế trên phần cứng cây tìm kiếm theo chiều rộng [12].
có thể cấu hình lại FPGA đối với các hệ thống đa đầu vào đa đầu
ra MIMO được ghép kênh không gian. Mục tiêu là đề xuất một Với chiến lược duyệt cây theo chiều sâu được sử dụng, bán
kiến trúc đơn giản hóa dựa trên thuật toán giải mã cầu K-best kính cầu khởi tạo được thiết lập bởi nhánh đầu tiên. Khi đó ta
và cải thiện đáng kể tính phù hợp cho việc triển khai phần cứng. sẽ thiết lập được một hình cầu với tâm là điểm tạo bởi véc-tơ
Thiết kế được đánh giá là mang lại giá trị gần đúng về chất tín hiệu nhận được và bán kính là khoảng cách giữa tâm và
lượng của phương pháp ước lượng hợp lý cực đại (ML) nhưng điểm tương ứng nhánh khởi tạo. Thực hiện duyệt lần lượt các
với độ phức tạp tính toán giảm đáng kể. Phân tích tổng hợp cho nhánh tiếp theo, nếu điểm tương ứng của nhánh được duyệt
thấy rằng kiến trúc được đề xuất đạt được thông lượng 1.76 nằm trong cầu thì ta khởi tạo một hình cầu mới với tâm vẫn là
Gbps tại tần số clock 440 MHz. điểm tạo bởi véc-tơ tín hiệu nhận được và bán kính mới bằng
khoảng cách giữa tâm và điểm nhánh vừa được duyệt. Còn với
Keywords— MIMO, FPGA, Bộ giải mã cầu (SD), Hợp lệ cực các điểm nằm ngoài cầu sẽ bị loại bỏ. Như vậy hình cầu sẽ
đại (ML). được cập nhật nếu thỏa mãn tìm được một điểm mới nằm trong
hình cầu thiết lập. Do vậy nếu theo quan điểm thực thi phần
I. GIỚI THIỆU
cứng, các bộ giải mã cầu theo sử dụng chiến lược tìm kiếm
Sự phát triển nhanh chóng của điện toán di động, các dịch theo chiều sâu có thể giảm tài nguyên chiếm dụng và đạt được
vụ đa phương tiện di động và các ứng dụng di động khác làm chất lượng của ML. Tuy nhiên các bộ giải mã loại này thì có
cho truyền thông không dây tốc độ cao trở thành một trong độ phức tạp tính toán không cố định, điều này thì sẽ gây khó
những công nghệ phát triển nhanh nhất trong những năm gần cho thực thi trên phần cứng. Đặc biệt chúng là làm giảm thông
đây. Công nghệ truyền thông đa đầu vào đa đầu ra (MIMO) lượng hệ thống và tăng độ trễ truyền tin.
đã được nghiên cứu vì nó đáp ứng nhu cầu về cả dung lượng
tăng và độ tin cậy liên kết được cải thiện [1]. Hiện nay, các kỹ Để giải quyết vấn đề trên, chiến lược tìm kiếm theo chiều
thuật MIMO đã được chấp nhận như một tiêu chuẩn giao tiếp rộng đã được đề xuất với thuật toán điển hình là thuật toán K-
vô tuyến cho các hệ thống truyền thông không dây hiện đại best. Tại các lớp trên cây tìm kiếm, thuật toán K-best thực hiện
như hệ thống thông tin di động 4G LTE, 5G…, cho phép tăng giữ lại K nút có khoảng cách ước lượng đến điểm tâm cầu
thông lượng truyền dẫn bằng cách thực hiện các sửa đổi trong tương ứng là ngắn nhất và K nút này sẽ được chuyển tiếp
lớp PHY và MAC [2]. Việc tối ưu các thuật toán tính toán và xuống cho lớp tiếp theo. Do đó, độ phức tạp tính toán của bộ
xử lý tín hiệu trong hệ thống là yêu cầu cấp thiết để cải thiện tách tính hiệu theo phương pháp K-best có giá trị cố định. Với
hiệu suất hệ thống, bao gồm tỉ lệ lỗi, thông lượng, độ trễ truyền việc sử dụng hệ số K lớn, phương pháp này sẽ cho hệ số phẩm
tin và hiệu quả phổ, đồng thời cân bằng giữa tài nguyên chiếm chất BER dần tiệm cận được với phương pháp ML [13]. Tuy
dụng và các hệ số phẩm chất hệ thống. nhiên, nếu K càng lớn thì độ phức tạp tính toán của hệ thống
càng tăng lên. Nếu triển khai thực thi trên phần cứng sẽ dẫn
Một phương pháp phát hiện tín hiệu mang lại chất lượng tới tài nguyên chiếm dung cũng tăng lên. Điều này làm giảm
của tỉ lệ lỗi tốt nhất đó là sử dụng bộ tách tín hiệu ước lượng tính khả thi khi triển khai thực thi trên phần cứng. Do đó,
hợp lý cực đại ML. Phương pháp ML ước lượng tín hiệu được chúng ta cần đảm bảo tính phải cân bằng giữa sự hệ số phẩm
truyền đến điểm đích theo phương pháp tìm kiếm vét cạn các chất hệ thống và phức tạp tính toán.
mẫu trong toàn bộ tập tín mẫu có thể được truyền đến. Do vậy,
phương pháp ML có độ phức tạp cao, đặc biệt với các hệ thống Trong bài báo này, một kiến trúc cho bộ tách tín hiệu theo
MIMO được trạng bị nhiều anten thu và anten phát. Độ phức phương pháp cầu K-best thỏa hiệp giữa hai yêu cầu là độ phức
tạp của phương pháp ML là một hàm số biến đổi theo hàm mũ tạp tính toán và các hệ số phẩm chất của hệ thống được đề
của số lượng anten thu và phát ăng [3], [4]. Để giảm độ phức xuất. Ý tưởng của phương pháp này là thông qua việc khảo sát
tạp của bộ tách tín hiệu ML mà vẫn đảm bảo tương đối hệ số thống kê các nút còn tồn tại ở mỗi lớp kết hợp với khảo sát
phẩm chất của tỉ lệ lỗi, thuật toán tách tín hiệu theo phương ước lượng tỉ lệ lỗi bit (BER) của các điểm được giữ lại tương
pháp cầu (SD) đã được đề xuất trong [5], [6], [7], [8]. Với ứng với các lớp trên cây tìm kiếm để đưa ra các hệ số K phù
phương pháp SD, ta có thể tính toán để đạt được hệ số phẩm hợp với từng lớp trên cây tìm kiếm. Để có một kiến trúc tin
chất của tỉ lệ lỗi bit (BER) tiệm cận đến đường cong BER của cậy, nhóm nghiên cứu tiến hành mô phỏng kiến trúc này trên
bộ tách tín hiệu ML với độ phức tạp tính toán có thể chấp nhận Matlab với các bộ giá trị K được ước lượng theo kết quả thống
được. Một số sơ đồ cây tìm kiếm được sử dụng trong giải mã kê trong [14] để tìm ra được bộ tốt nhất. Từ kết quả mô phỏng,
cầu đã được đề xuất có thể kể đến như: cây tìm kiếm theo một kiến trúc được xây dựng để tiến hành thiết kế bộ giải mã
chiều sâu, cây tìm kiếm theo chiều rộng [9], [10], [11] và cây cầu K-best trên FPGA. Chất lượng BER của thiết kế đạt được
ISBN 978-604-80-5958-3 113
- Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)
tiệm cận với giải pháp ML với độ phức tạp tính toán phù hợp độ phức tạp tính toán của SD và hiệu suất BER. Để giảm hơn
với các chip có tài nguyên trung trung bình. nữa số lượng tính toán của SD, phương trình (3) có thể được
chuyển đổi thành một dạng khác tương đương nhờ biến đổi
Phần còn lại của bài báo được tổ chức như sau. Phần 2
QRD cho ma trận kênh 𝑯, khi đó 𝑯 = 𝑸𝑹 trong đó ma trận
trình bày mô hình hệ thống chung và định dạng tín hiệu tương
𝑸 là ma trận đơn nhất có kích thước là 𝑁𝑅 × 𝑁𝑅 và 𝑸𝑸𝐻 = 𝑰
ứng. Phần 3 đề xuất kiến trúc khối giải mã cầu theo định
trong khi 𝑹 là ma trận tam giác trên 𝑁𝑅 × 𝑁𝑇 . Thay thế 𝑯
hướng thiết kế phần cứng. Phần 4 thiết kế trên phần cứng khối
bằng 𝑸𝑹 và sau khi biến đổi, biểu thức (1) trở thành:
giải mã cầu K-best. Phần 5 kết luận bài báo.
II. MÔ HÌNH HỆ THỐNG ̃ = 𝑹𝒙 + 𝑸𝐻 𝒏
𝒚 với ̃ = 𝑸𝐻 𝒚
𝒚 (4)
x H (NR x NT) y
x1
n1
s1 y1 Lưu ý rằng 𝑸𝐻 𝒏 có cùng thống kê với 𝒏, nên phương trình
MIMO Transmitter
MIMO SD Detector
n2 (3) được biến đổi về dạng tương đương:
MIMO Reciever
x2 s2 y2
n3 y3
x3 s3 2
̂ = arg min
𝒙 ̃ − 𝑹𝒙||
||𝒚 khi ̂ = 𝑹𝒙
𝒚 (5)
𝐱∈𝐒
nN Phương trình (5) có thể được tính toán thông qua hàm giá trị
xN sN yN
như sau:
R
T R R
MIMO channel
2
Hình 1: Mô hình hệ thống MIMO ̃, 𝒚
𝐷( 𝒚 ̃ − 𝑹𝒙||2 ≤ 𝑟𝑠𝑝ℎ
̂) = ||𝒚 . (6)
Xem xét một hệ thống MIMO với 𝑁𝑇 anten phát và 𝑁𝑅
̂) cũng
̃, 𝒚
Vì ma trận 𝑹 là tam giác trên nên hàm giá trị 𝐷( 𝒚
anten thu như trong Hình 1. Kênh MIMO được đặc trưng bởi
𝑁𝑅 ×𝑁𝑇 là khoảng cách Euclide một phần có thể được tính toán đệ quy
ma trận kênh phức 𝑯 = (ℎ𝑖𝑗 ) ∈ ℂ𝑁𝑅 ×𝑁𝑇 , các phần tử từ một ăng ten phát này đến một ăng ten phát khác
của 𝑯 có phân bố với phương sai đơn vị và kỳ vọng bằng 0.
Các thông số này mô tả độ suy hao và lệch pha đối với mỗi 𝑁𝑅 𝑁𝑇 2
đường dẫn từ một ăng-ten phát đến một ăng-ten thu; chúng
được giả định là đã biết trước một cách hoàn hảo (có thể thông ̃, 𝒚
𝐷𝑚 ( 𝒚 ̂) ≜ ∑ (𝑦̃𝑖 − ∑ 𝑅𝑖𝑗 𝑥𝑖𝑗 ) (7)
qua giai đoạn ước lượng kênh). Đối với quá trình truyền dẫn, 𝑖=𝑚 𝑗=𝑖
các phần tử 𝑥𝑖 của véc-tơ tín hiệu phức 𝒙 = (𝑥𝑖 )𝑁𝑇×1 ∈ 𝜴 ⊂
ℂ𝑁𝑇×1 được gửi đồng thời qua 𝑁𝑇 anten phát, trong đó 𝜴 là ̃, 𝒚
𝐷( 𝒚 ̂) = 𝐷1 ( 𝒚
̃, 𝒚
̂) (8)
tập hợp của chòm sao điều chế tín hiệu. Do đó, véc-tơ tín hiệu
phức nhận được 𝒚 = (𝑦𝑖 )𝑁𝑅 ×1 ∈ ℂ𝑁𝑅 ×1 có thể được biểu thị 𝑁𝑇 2
bằng công thức: ̃, 𝒚
𝐷𝑚−1 ( 𝒚 ̂ ) = 𝐷𝑚 ( 𝒚
̃, 𝒚
̂ ) + (𝑦̃𝑚−1 − ∑ 𝑅𝑚−1,𝑖 𝑥𝑖 ) (9)
𝑖=𝑚−1
𝒚 = 𝑯𝒙 + 𝒏 (1)
với 𝑦̃𝑚−1 là phần tử thứ (𝑚 − 1) của vector tín hiệu thu được
trong đó 𝒏 = (𝑛𝑖 )𝑁𝑅 ×1 ~𝐶𝑁(0, 𝛿 2 𝑰) là một véc-tơ tạp âm sau khi nó được nhân với 𝑸𝑯 , (𝑅)𝑖,𝑗 là phần tử của ma trận
Gauss phức trắng cộng tính (AWGN). Bộ giải mã ML thực 𝑹 thuộc hàng thứ 𝑖 và cột thứ 𝑗 và hàm giá trị 𝐷𝑚 ( 𝒚 ̃, 𝒚
̂) là
hiện tìm kiếm theo phương pháp vét cạn tất cả các véc-tơ ký khoảng cách Euclid một phần của symbol 𝒙 tại mức tìm kiếm
hiệu có thể có trong tập 𝑺𝑁𝑇×1 để thu được véc-tơ phát với cự m. Đối với tất cả các véc-tơ ký hiệu phát thỏa mãn 𝒙𝑗 ∈ {𝒙 ∈
ly Euclid đến véc-tơ tín hiệu nhận được có giá trị nhỏ nhất: 𝑺𝑁𝑇 ⊂ (ℂ)𝑁𝑇 : ‖𝑹𝒙 − 𝒚‖ ≤ 𝑟𝑠𝑝ℎ }, khởi tạo 𝐷𝑁𝑅 +1 ( 𝒚̃, 𝒚
̂) = 0
̂𝑀𝐿 = arg min ||𝒚 − 𝑯𝒙||2
𝒙 (2) (10)
𝒙∈𝜴 𝐷𝑚−1 ( 𝒚 ̂) ≤ 𝑟𝑠𝑝ℎ_ 2 − 𝐷𝑚 ( 𝒚
̃, 𝒚 ̃, 𝒚
̂)
𝑚
Do đó, độ phức tạp tính toán của bộ giải mã ML tăng lên 𝑁𝑅
theo hàm mũ của bậc điều chế tín hiệu M và số lượng các ăng-
trong đó 𝑟𝑠𝑝ℎ_ 2𝑚 = 𝑟𝑠𝑝ℎ 2 − ∑ 𝐷𝑖 ( 𝒚
̃, 𝒚
̂) (11)
ten thu trong hệ thống. Bộ giải mã cầu SD đơn giản hóa bộ
𝑖=𝑚+1
giải mã ML bằng việc hạn chế các điểm tìm kiếm của SD để
giảm độ phức tạp tính toán theo hướng chỉ so sánh những
Đối với việc triển khai phần cứng, việc thực hiện phân rã
điểm tín hiệu nằm bên trong siêu cầu với bán kính xác định
giá trị thực (RVD) của 𝑯 cũng hiệu quả, điều này giúp đơn
trước được hình thành xung quanh véc-tơ tín hiệu nhận được,
giản hóa việc tính toán khoảng cách Euclid. Phép phân tích
tức là:
giá trị thực tách phương trình kênh (1) thành một biểu diễn
giá trị thực mới như sau [15]:
̂𝑆𝐷 = arg min ||𝒚 − 𝑯𝒙||2
𝒙 (3)
𝒙∈𝑺
ℜ(𝒚) ℜ(𝑯) −ℑ(𝑯) ℜ(𝒙) ℜ(𝒏)
trong đó 𝑺 ⊂ (ℂ)𝑁𝑇 ×1 : ‖𝒚 − 𝑯𝒙‖ ≤ 𝑟𝑠𝑝ℎ là tập hợp tất cả các [ ]=[ ][ ]+[ ] (12)
ℑ(𝒚) ℑ(𝑯) ℜ(𝑯) ℑ(𝒙) ℑ(𝒏)
điểm nằm trên lưới thỏa mãn khoảng cách của nó tới y luôn
nhỏ hơn bán kính 𝑟𝑠𝑝ℎ của siêu cầu. Việc chọn giá trị của 𝑟𝑠𝑝ℎ với ℑ(. ), ℜ(. ) tương ứng biểu diễn phần thực và phần ảo
về cơ bản là quan trọng có ý nghĩa quyết định trực tiếp đến của véc-tơ phức. Hơn nữa, chúng ta có thể giải phương trình
ISBN 978-604-80-5958-3 114
- Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)
Full (ML solution) Sorting Pipeline registers
K8=4 K7=16 K6=64 K5=256 m=4 K4=16 K3=64 n=3 K2=12 K1=48
Processing
Processing
Processing
Processing
Processing
Processing
Processing
Processing
best values
best values
Choose 3
best root
Choose 4
Choose
Layer
Layer
Layer
Layer
Layer
Layer
Layer
Layer
y xmin
Layer 8 Layer 7 Layer 6 Layer 5 Layer 4 Layer 3 Layer 2 Layer 1
Hình 2: Kiến trúc thuật toán giải mã cầu K-best đề xuất
(1) thông qua phương trình (12) với các bước như trên, và với nghiệm của 4 lớp đầu. Sự phình to của các nút diễn ra ở các
việc biến đổi tập hợp chòm sao phức thành tập số nguyên như lớp giữa [14], do vậy một bộ so sánh và sắp xếp chọn ra 4 nút
sau: tốt nhất làm đầu vào của lớp thứ tư được thực hiện, góp phần
giảm khối lượng tính toán đi đáng kể. Tương tự như vậy, ta
𝑆𝑟 = {−√𝑀 + 1, … , √𝑀 − 1} (13) chọn 3 nút tốt nhất ở lớp thứ 2., Bằng việc sử dụng phương
pháp sắp xếp Batcher [17] tiến hành sắp xếp các giá trị theo
chiều bán kính tăng dần sau đó ra số giá trị cần thiết để đưa
trong đó 𝑀 là bậc điều chế. Sau đó, QRD có thể được thực xuống lớp dưới. Để có thể đơn giản hơn trong tính toán chúng
hiện nói chung dựa trên phương trình kênh tăng cường trong tôi tiến hành phân hoạch các lớp theo cấu trúc 2-2-2-2 Hình
(12). Kích thước của ma trận kênh tương đương (𝑯), ma trận 2 để xử lý.
đơn nhất (𝑸) và ma trận tam giác trên (𝑹) lần lượt được biến
đổi thành 2𝑁𝑅 × 2𝑁𝑇 , 2𝑁𝑅 × 2𝑁𝑅 , 2𝑁𝑅 × 2𝑁𝑇 . Số lượng Với cách kiến trúc kiểu này thì mỗi lần chúng ta có thể xử
cấp độ tìm kiếm cây thay đổi thành 2𝑁𝑅 . Trong phần sau, sẽ lý luôn được hai lớp, điều này sẽ làm đơn giản hơn một số
trình bày thực thi thuật toán giải mã cầu trên phần cứng bước so với tính toán từng lớp một, giảm đi được việc phải
chuyên dụng. so sánh và lựa chọn các nút giữa hai lớp trong cùng một cặp
chẳng hạn. Kiến trúc của hai lớp đầu sẽ là cơ sở để xây dựng
III. ĐỀ XUẤT KIẾN TRÚC KHỐI GIẢI MÃ CẦU THEO ĐỊNH HƯỚNG kiến trúc của các lớp sau được phân cách bởi các thanh ghi
THIẾT KẾ PHẦN CỨNG kiểu đường ống giúp nâng cao thông lượng của thiết kế.
Để thích hợp thực thi được kiến trúc bộ giải mã cầu trên B. Mô phỏng đánh giá chất lượng của thiết kế
phần cứng thì vấn đề làm giảm độ phức tạp tính toán mà vẫn
đáp ứng được phẩm chất BER theo yêu cầu là rất quan trọng. Bảng 1: Tham số mô phỏng
Việc giới hạn xử lý các nút tại mỗi lớp trong thuật toán giải
mã cầu là biện pháp được đưa ra để xử lý vấn đề này. Trong Tham số Cài đặt
nghiên cứu [14] đã phân tích sự phân bố của số lượng các nút Mã hóa kênh Không
hợp lệ (đường dẫn tìm kiếm tồn tại) ở mọi lớp của thuật toán Số lượng anten 4×4
SD liên quan đến các kích thước bán kính và SNR khác nhau.
Số lượng symbol mô phỏng 1000000 symbol
Một mô hình SD thông thường đã được xây dựng trên
MATLAB cho hệ thống MIMO 4 × 4 ăng-ten. Số lượng nút Kiến trúc điều chế 16-QAM
hợp lệ tối đa có xu hướng tăng lên và đạt mức tối đa ở lớp giữa
[14]. Khả năng loại nghiệm của phương pháp giải mã cầu là
rất lớn, biểu thị qua số nút tồn tại ở mỗi lớp là khá thấp so với
phương pháp ước lượng hợp lý cực đại ML. Tuy nhiên, nếu
sử dụng đúng những tham số khảo sát đó để làm cấu hình thực
thi trên phần cứng thì vẫn là khá lớn đối với các chip FPGA
hiện tại. Ở mỗi lớp, bằng việc sắp xếp và lựa chọn những nút
tốt nhất trong số các nút được tính toán, ta có thể giảm số nút
phải xử lý ở mỗi lớp đi mà chất lượng BER chỉ giảm đi một
lượng không đáng kể. Tại những lớp ở trên việc giữ lại số
lượng nút cao sẽ giúp chúng ta có thể tiệm cận phương pháp
ML, còn ở các lớp dưới việc lựa chọn chỉ một số lượng nút
nhỏ giúp tiết kiệm được tài nguyên phần cứng [16]. Từ những
phân tích trên, một kiến trúc giải mã cầu kiểu K-best được đề
xuất mang lại phẩm chất xấp xỉ như phương pháp ML với độ
phức tạp có thể thực thi được trên phần cứng Hình 2.
A. Layer processing Block (LPB)
Một khối khối xử lý này sẽ tính toán 4 giá trị bán kính có
thể có ứng với mỗi chiều trong vector nghiệm (4 nút với điều
chế 16-QAM) sau đó các giá trị này được tổng hợp lại và đưa
xuống lớp tiếp theo. Những lớp đầu tiên khối lượng tính toán
còn ít, tuy nhiên nó lại ảnh hưởng nhiều tới chất lượng của hệ Hình 3: Mô phỏng đánh giá chất lượng BER
thống. Do vậy thiết kế này tiến hành tính toán đầy đủ các
ISBN 978-604-80-5958-3 115
- Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)
R y = [y1 , y2 , y3 ,..., y8 ]T
CLK
16 SD CELLs
4 SD CELLs 3 SD CELLs
1 SD CELL
COMPARATOR
REG PIPELINE
REG PIPELINE
REG PIPELINE
Sorting 256 - 4
SD
Sorting 64 - 3
SD SD SD
SD SD SD
SD SD
CELL
SD SD SD xˆ min
CELL
CELL CELL
CELL
CELL CELL
CELL
CELL
CELL CELL CELL
xˆ
r02
Level 8,7 Level 6,5 Level 4,3 Level 2,1
LAYER_ID
1 2 3 4 5 6 7 8 xˆ -- 1- - - -3
- - -1
- - -1 - 1- -3 - 3
- - - - - - - - - - - 33
xˆ 1- - - 33 -- - --
-- -- -- -- -- -- 3
xˆ - 33
-- -- -- -- -- --
- - - - - - - -
SYMBOL
SYMBOL SYMBOL -3 -1 1 3
-3 -1 1 3 -3 -1 1 3
Hình 4: Cấu trúc tổng thể của khối giải mã cầu
Trong suốt quá trình mô phỏng, chúng tôi xem xét một hệ mục đính dễ dàng áp dụng phép tính trên phần cứng (tránh
thống 4 × 4 MIMO, giả định rằng kênh là Rayleigh pha đinh các phép toán khai căn), trong thiết kế sẽ tính luôn giá trị bình
phẳng với môi trường tán xạ phong phú. Không gian giữa phương của bán kính. SD CELL là khối tính toán giải mã cầu
anten phát và anten thu đủ lớn. Kênh của đầu cuối nhận được quan trọng nhất trong thiết kế này Hình 6. Để đảm nhiệm tính
thực sự đã biết và có thể duy trì đồng bộ hóa chính xác. Các toán giải mã đồng thời cho hai lớp liên tiếp, theo sơ đồ giải
tham số kênh giữa mỗi ăng-ten là vectơ AWGN tương ứng với mã hình cây chúng ta cần tổng cộng 20 khối SDE, 4 khối cho
phương sai đơn vị và trung bình bằng 0. Các thông số mô lớp đầu tiên, 16 khối cho lớp thứ hai. SD CELL đơn giản là
phỏng được thể hiện trong Bảng 1.
Từ khảo sát phẩm chất BER của các phương pháp, ta thấy CLK SPHERE DECODING ELEMENT (SDE)
xˆ8
rằng phương pháp giải mã cầu được đề xuất tốt hơn nhiều so yˆ8,1
với các phương pháp như ZF, MMSE. Với các bộ (𝑚, 𝑛) thích
MUX
LAYER_ID
ym
hợp thuật toán giải mã cầu được đề xuất này xấp xỉ với phương yˆ8,4
SUM
pháp ML. Ta thấy rằng việc lựa chọn nhiều nghiệm hơn tại xˆ7
yˆ 7,1
lớp 4 và lớp 2 (𝑚, 𝑛 lớn) sẽ làm cho chất lượng của hệ thống xˆ m
REGISTER PIPELINE 2
REGISTER PIPELINE 1
MUX
SUM
tăng lên. Tuy nhiên sự đánh đổi giữa chất lượng và độ phức yˆ7,4
rm2
tạp của hệ thống cũng như tài nguyên để thực thi trên phần ( xˆ m−1 , rm2−1 )
SUM
SUB
Rm xˆm+1
SUB
cứng là không tương xứng. Ta nhận thấy hai cặp (𝑚, 𝑛) = yˆ m+1,1 X 2
MUX
(5,2) và (4,3) có chất lượng BER tương tự nhau và xấp xỉ
SUM
yˆ m+1,4 ym
với phương pháp ML. Việc lấy chỉ nhiều hơn một nghiệm tại rm2 xˆm
SUM
lớp 4 cũng đã làm cho các khối tính toán của hệ thống tăng lên yˆ m ,1
đáng kể trong khi lấy nhiều hơn một nghiệm tại lớp 2 sẽ tốn ít
MUX
yˆ m,4
khối tính toán hơn. Do đó để cân đối giữa các yếu tố này, ta sẽ
lựa chọn cấu hình (𝑚, 𝑛) = (4,3) để thiết kế trên phần cứng. Hình 5: Cấu trúc khối tính toán cơ bản SDE
IV. THIẾT KẾ TRÊN PHẦN CỨNG KHỐI GIẢI MÃ CẦU K-BEST SD CELL
FIRST LAYER SECOND LAYER
Từ những đề xuất về cấu trúc thực hiện khối giải mã cầu
ym+1 & ym xˆ m−1,0
đã được trình bày ở phần trước, dựa trên những phân tích
thống kê về đặc tính của nghiệm cũng như các phương pháp xˆ m,0 xˆ m,0 CLK
tìm nghiệm tối ưu. Phần này cụ thể hóa thiết kế khối giải mã
INPUT_
Rm+1 & Rm
xˆ m-1
SELECTOR
SDE_4
CLK rm2−1,0
xˆ m +1
cầu về mặt phần cứng, tập trung vào trình bày cấu trúc phần INPUT_
rm2,0
Rm
SELECTOR ym
SDE_0
rm2,0
cứng của khối giải mã cầu K-best trên nền tảng phần cứng
COMBINER
Rm+1
FPGA. ym+1
CLK rm2+1
REG
A. Cấu trúc các khối cơ bản xˆ m ,3 xˆ m−1,19
xˆ m+1
Kiến trúc từng khối trong hệ thống áp dụng kiến trúc 2
rm-1
xˆ m+1 CLK
xˆ m ,3 CLK
pipeline nên các khối chức năng điều khiển sẽ được đơn giản INPUT_
SELECTOR
rm2,3 INPUT_
SELECTOR
SDE_3
SDE_19
hóa, thêm vào đó khối phần tử tính toán cơ bản sẽ được tối ưu Rm+1 Rm
rm2−1,19
2
cho từng lớp. r
m+1 ym+1 r2
m ,3
ym
rm2+1
Phần tử tính toán cơ bản (Sphere Decoder Element – SDE)
Hình 5 thực hiện tính giá trị bán kính cầu mới công thức (11),
Hình 6: Cấu trúc khối tính toán CELL
đó là phép tính cơ bản nhất của thuật toán giải mã cầu. Nhằm
ISBN 978-604-80-5958-3 116
- Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)
sự ghép nối các khối SDE lại với nhau theo đúng sơ đồ giải chiếm một lượng nhỏ trên tổng khối lượng mà những chip
mã hình cây, trong đó sự tổ hợp các dữ liệu đầu ra của từng này mang lại.
khối SDE tạo thành các luồng dữ liệu mới được sử dụng cho
lớp tiếp theo, đồng thời xác định các tổ hợp nghiệm đúng C. Đánh giá thông lượng của thiết kế
bằng cách xét các giá trị bán kính cầu mới từ các SDE. Bộ giải mã cầu K-best được đề xuất có kiến trúc pipeline
không hoàn toàn. Với tần số clock cực đại có thể đạt là 𝑓𝑐𝑙𝑘 =
Thiết kế tổng thể của bộ giải mã cầu K-best Hình 4 cấu 440 𝑀𝐻𝑧 thông lượng của khối giải mã cầu K-best được đề
thành từ các khối chức năng thành phần bao gồm: Khối tính xuất đạt được là:
toán giải mã cầu CELL; khối sắp xếp và lựa chọn nghiệm
Sorting. Chúng được sắp xếp nối tầng với nhau theo kiến trúc
𝑓𝑐𝑙𝑘 440.106
pipeline, theo hình ta có thể thấy các khối tính toán và các 𝑇= × 16(𝑏𝑖𝑡) = × 16(𝑏𝑖𝑡) = 1.76(𝐺𝑏𝑝𝑠)
khối chọn nghiệm tạo thành bốn giai đoạn tính toán, mỗi giai 4 4
đoạn tính toán được phân biệt với nhau bởi các thanh ghi và
khối kết hợp và lựa chọn và lựa chọn nghiệm. Sau khi các Với thông lượng đạt 1.76 (𝐺𝑏𝑝𝑠) khối giải mã cầu
khối CELL hoàn tất 4 giai đoạn tính toán, khối so sánh được đề xuất này có thể tiệm cận các tiêu chuẩn về tốc độ của
COMPARATOR lựa chọn trong số các tổ hợp nghiệm được các hệ thống thông tin di động mới nhất như LTE, 4G
đưa vào so sánh nghiệm tốt nhất, đó chính là nghiệm của toàn Advanced. Độ trễ đáp ứng của thiết kế phụ thuộc vào số lớp
bộ quá trình giải mã. thanh ghi của kiến trúc pipeline, cụ thể trong thiết kế này có
26 lớp thanh ghi pipeline với chu kỳ chốt dữ liệu là bốn xung
B. Tổng hợp thiết kế trên Vivado clock. Với tần số clock cực đại là 𝑓𝑐𝑙𝑘 = 440 𝑀𝐻𝑧 thời gian
Qua tổng hợp thiết kế trên phần mềm Vivado kiến trúc trễ đáp ứng của khối giải mã là:
của khối giải mã cầu K-best trên một số loại chip Hình 7, ta
4 4
nhận thấy rằng tài nguyên chiếm dụng của thiết kế là tương 𝐿𝑎𝑡𝑒𝑛𝑐𝑦 = × 26 = × 26 = 236.36 (𝑛𝑠)
𝑓𝑐𝑙𝑘 440.106
LUT DSP FLIP FLOP LUTRAM MAX FREQ D. Đánh giá chất lượng BER của thiết kế
100% 500
440
Từ kết quả khảo sát Hình 9, đường cong BER của kiến
83% trúc mà bài báo đề xuất tốt hơn đáng kể đáng phương pháp
80% 400 giải mã cầu trong các công trình [18], [19], [20], [21] và gần
Clock frequency (MHz)
đường ML nhất khi xét cùng một mô hình hệ thống 4 × 4
Hardware resources
65%
60% 55% 57% 268 300 MIMO 16-QAM. Với kiến trúc sử dụng các bộ lựa chọn với
241
sắp xếp toàn cục, và việc xử lý tối đa ở các lớp đầu độ phức
40% 37% 37% 200 tạp tính toán mặc dù có tăng như điều này là chấp nhận được
134 25% 25%
để đánh đổi với chất lượng BER của hệ thống. Với thiết kế
20% 17%
14% 100
này thì có thể đảm bảo được độ tin cậy khi truyền tin, có thể
6%
11%
6%
hạn chế việc sử dụng các bộ mã hóa kênh, bộ sửa sai ở máy
4% 2% 1% thu. Qua khảo sát này khẳng định thêm kiến trúc thuật toán
0% 0
xc7a200tifbg484-1L xc7k325tfbg676-3 xc7k480tffv1156-3 xcvu7p-flva2104-3-e giải mã cầu nhóm đề xuất có tính khả thi cao, có thể đáp ứng
FPGA chip được các yêu cầu về chất lượng mà các hệ thống thông tin
Hình 7: Khảo sát tài nguyên chiếm dụng của thiết kế trên một số chip
hiện nay yêu cầu.
Hình 8: Phân bổ tài nguyên trên chip xcvu7p-flva2104-3-e Hình 9: So sánh chất lượng BER với các công trình nghiên cứu khác
đối lớn, đối với những chip có dung lượng nhỏ thiết kế gần E. Đánh giá độ phức tạp tính toán
như chiếm toàn bộ tài nguyên. Đối với những chip tầm trung Mặc dù phương pháp giải mã cầu có độ phức tạp thấp hơn
hay cao cấp thì vấn đề này sẽ không đáng quan ngại do nó chỉ phương pháp ML nhưng để thực hiện trên phần cứng chuyên
ISBN 978-604-80-5958-3 117
- Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021)
dụng ta cần phải tiếp tục tối ưu về mặt giải thuật nhằm giảm Transactions on Information Theory, vol. 49, pp. 2389-2402, Oct.
độ phức tạp hơn nữa. Bản thân phương pháp giải mã cầu lý 2003.
thuyết có độ phức tạp không cố định, nó phụ thuộc mạnh vào [5] U. Fincke, M. Pohst, "Improved methods for calculating vectors of
short length," Mathematics of Computation, 1985.
sự phân bố các nút hợp lệ ở từng lớp giải mã. Về mặt lý thuyết
độ phức tạp của phương giáp giải mã cầu càng lớn khi phải [6] D. Wubben, R. Bohnke, V. Kuhn, and K.-D. Kammeyer, "MMSE
extension of V-BLAST based on sorted QR decomposition," in Proc.
xử lý càng nhiều nút hợp lệ. Độ phức tạp được thể hiện bằng IEEE 58th Vehicular Technology Conference (VTC), vol. 1, no. 1, p.
tài nguyên chiếm dụng của thiết kế thi ta thực thi trên phần 508–512, Oct. 2003..
cứng chuyên dụng mà cụ thể là FPGA ở trong bài báo này. [7] M. Pohst, "On the computation of lattice vectors of minimal length,
Độ phức tạp của kiến trúc khối giải mã cầu đề xuất được đánh successive minima and reduced bases with applications," SIGSAM
giá thông qua số lượng khối SDE trong thiết kế vì mỗi khối Bull., vol. 15, no. 1, pp. 37-44, 1981.
SDE được sử dụng để xử lý một nút hợp lệ. Khác với phần [8] X. Jun, G. Diyuan and W. Zengye, "Research of Improved Sphere
Decoding Algorithm," 2019 Chinese Control And Decision
mềm, khi thiết kế trên phần cứng chúng ta cần phải bố trí số Conference (CCDC),, pp. 1043-1047,, 2019.
lượng cố định phần tử giải mã cho từng nút. Trong trường
[9] P. Tsai, W. Chen, X. Lin and M. Huang, "A 4×4 64-QAM reduced-
hợp tổng quát với phương pháp giải mã cầu lý thuyết chúng complexity K-best MIMO detector up to 1.5Gbps," Proceedings of
ta cần tới ∑8𝑖=1 4𝑖 = 87380 khối SDE để có thể đạt đến BER 2010 IEEE International Symposium on Circuits and Systems, pp.
của ML, đó là một con số quá lớn mà không có chip FPGA 3953-3956, 2010.
nào có thể đáp ứng được ở thời điểm hiện tại. Để giảm độ [10] B. Shim and I. Kang, "Sphere Decoding With a Probabilistic Tree
phức tạp tính toán, thiết kế khối giải mã cầu đã giới hạn số Pruning," IEEE Transactions on Signal Processing,, vol. 56, pp. 4867-
4878, Oct. 2008.
lượng nút hợp lệ được xử lý ở từng lớp dựa vào các phân tích
[11] K.-W. Wong, C.-Y. Tsui, R. S.-K. Cheng, and W.-H. Mow, "A VLSI
thống kê. Cùng với cách lựa chọn nút hợp lệ tối ưu mà số Architecture of a K-Best Lattice Decoding Algorithm for MIMO
lượng khối SDE cần sử dụng giảm xuống chỉ còn 480, điều Channels," in Proc. IEEE International Symposium on Circuits and
này tương đương với giảm khối lượng tính toán cũng như độ Systems (ISCAS), vol. 3, no. 1, p. 273–276, 2002.
phức tạp xuống 180 lần. Đổi lại BER của khối giải mã cầu [12] B. Hassibi and H. Vikalo, "On the expected complexity of sphere
kém hơn so với ML (theo các phân tích ở Hình 3 và Hình 9) decoding," in Proc. Thirty-Fifth Asilomar Conference on Signals,
Systems and Computers, vol. 2, p. 1051–1055, Nov. 2001.
nhưng vẫn vượt trội hơn so với các phương pháp tuyến tính.
[13] H. Fang, L. Ge and G. Zhu, "An improved radius adaptive K-Best
Khi thực thi thuật toán giải mã cầu trên phần cứng chúng ta
algorithm for MIMO system," 2014 IEEE International Conference
phải cân nhắc giữa ba yếu tố chính là thông lượng, độ phức on Progress in Informatics and Computing, pp. 562-566, 2014.
tạp và tỷ lệ lỗi bit. Các yếu tố này tác động qua lại lẫn nhau [14] Minh-Thuong Nguyen, Xuan-Nam Tran, Vu-Duc Ngo, Quang-Kien
và cần được cân bằng để thiết kế phần cứng có tính khả thi Trinh, Duc-Thang Nguyen, Tien-Anh Vu, "An Analysis of Valid
cao và đáp ứng được các chỉ tiêu thiết kế cụ thể. Nodes Distribution for Sphere Decoding in the MIMO Wireless
Communication System," Journal of Research and Development on
V. KẾT LUẬN Information and Communication Technology, vol. 2021, pp. 97-104,
2021.
Bộ giải mã cầu K-best cung cấp sự cân bằng hiệu suất-độ [15] Ibrahim A, Bello, Basel Halak, Mohammed El-Hajjar, Mark
phức tạp, làm cho chúng phù hợp với việc triển khai phần cứng Zwolinski, "VLSI Implementation of a Fully-Pipelined K-Best
của hệ thống truyền thông MIMO. Trong bài báo này, chúng MIMODetector with Successive Interference Cancellation," in
tôi đã thực thi bộ giải mã cầu với chất lượng xấp xỉ với bộ giải Circuits Systems and Signal Processing, 2019.
mã ML về tỷ lệ lỗi bit. Các kết quả bước đầu trong thiết kế [16] P. Tsai, W. Chen, X. Lin and M. Huang, "A 4×4 64-QAM reduced-
này cho thấy tính khả thi của thiết kế các khối tăng tốc giải mã complexity K-best MIMO detector up to 1.5Gbps," Proceedings of
trên FPGA. Phương pháp này cũng có thể được mở rộng để 2010 IEEE International Symposium on Circuits and Systems, pp.
3953-3956, 2010.
đáp ứng nhu cầu ngày càng tăng của các tiêu chuẩn truyền
thông không dây trong tương lai. Những kết quả này cho thấy [17] M. Ouyang, "Sorting sixteen numbers," 2015 IEEE High Performance
Extreme Computing Conference (HPEC), pp. 1-6, 2015.
cần có sự những nghiên cứu sâu hơn để có thể đẩy thông lượng
[18] W. Fan, Y. Liu, Z. Wang and X. Mao, "A new dynamic K-best SD
hệ thống cũng như chất lượng lên cao hơn nữa để có thể ứng
algorithm for MIMO detection," 2014 Sixth International Conference
dụng thực tế. on Wireless Communications and Signal Processing (WCSP), pp. 1-
5, 2014.
TÀI LIỆU THAM KHẢO
[19] Umamaheshwar Soma, Anil Kumar Tipparti, Srinivasa Rao
Kunupalli, "Performance Analysis of K-Best Sphere Decoder
[1] A. Goldsmith, S. A. Jafar, N. Jindal and S. Vishwanath, "Capacity Algorithm for Spatial Multiplexing MIMO Systems," International
limits of MIMO channels," IEEE Journal on Selected Areas in Journal of Pure and Applied Mathematics, vol. 114, pp. 97-107, 2017.
Communications, vol. 21, pp. 684-702, June 2003. [20] X. Mao, S. Ren and H. Xiang, "Layer reduced K-best sphere
[2] Zekry, Abdelhalim, "FPGA Implementation of Sphere Detector for decoding," 2011 International Conference on Wireless
Spatial Multiplexing MIMO System," International Journal of Communications and Signal Processing (WCSP), pp. 1-4, 2011.
Electronics and Telecommunications, vol. 65, p. 245–252, 219. [21] H. Fang, L. Ge and G. Zhu, "An improved radius adaptive K-Best
[3] Trần Xuân Nam, Lê Minh Tuấn, Xử lý tín hiệu không gian thời gian, algorithm for MIMO system," 2014 IEEE International Conference
Hà Nội: Nhà xuất bản Khoa học và kỹ thuật, 2013. on Progress in Informatics and Computing, pp. 562-566, 2014.
[4] M. O. Damen, H. El Gamal and G. Caire, "On maximum-likelihood
detection and the search for the closest lattice point," IEEE
ISBN 978-604-80-5958-3 118
nguon tai.lieu . vn