Thứ Tư, 1 tháng 1, 2014

Wavelet và nén tín hiệu ảnh

-5-

6. Cấu trúc của luận văn
Bố cục của luận văn ñược tổ chức thành 3 chương, có nội
dung như sau:
Chương 1: Trình bày các khái niệm về các kiểu nén ảnh, các chuẩn
liên quan ñến việc nén ảnh sao cho ñạt chất lượng ảnh tối ưu nhất và
các hàm toán học liên quan ñến việc nén ảnh ñể làm cơ sở tiền ñề ñể
sử dụng phép biến ñổi Wavelet trong việc nén tín hiệu ảnh.
Chương 2: Đi sâu vào việc trình bày các họ hàm liên quan ñến phép
biến biến ñổi Wavelet và vận dụng phép biến ñổi Wavelet ñể triển
khai việc nén tín hiệu ảnh.
Chương 3: Đưa ra giải pháp ñể cải tiến giải thuật mã hóa cây triệt
tiêu ñể các cây có thể mã hóa nằm lọt hoàn toàn vào các gói tin. Các
gói tin này có thể ñược giải mã ñộc lập. Vì vậy, mỗi gói tin bị mất sẽ
chỉ ảnh hưởng ñến một vùng nhỏ của ảnh. Từ ñó làm cho chất lượng
hình ảnh ñược rõ nét và ñạt ñược kết quả tốt hơn.
-6-

Chương 1. TỔNG QUAN VỀ NÉN TÍN HIỆU ẢNH
1.1. TỔNG QUAN VỀ NÉN TÍN HIỆU ẢNH
Trong chương này, tôi sẽ trình bày các nguyên lý của nén tín
hiệu ảnh, bao gồm nén ảnh không mất thông tin và nén ảnh mất
thông tin. Phần nén ảnh mất thông tin sẽ giới thiệu phương pháp nén
số học sẽ ñược dùng trong phần cài ñặt ở bước mã hóa Entropy của
quy trình nén ảnh mất thông tin.
1.2. CÁC KIỂU NÉN
Một tính chất chung nhất của tất cả các ảnh ñó là tương quan
giữa các pixel ở cạnh nhau lớn, ñiều này dẫn ñến dư thừa thông tin
ñể biểu diễn ảnh. Dư thừa thông tin sẽ làm cho việc mã hoá không
tối ưu. Do ñó công việc cần làm ñể nén ảnh là phải tìm ñược các
cách biểu diễn ảnh với tương quan nhỏ nhất ñể giảm thiểu ñộ dư thừa
thông tin của ảnh. Thực tế, có hai kiểu dư thừa thông tin ñược phân
loại như sau:
- Dư thừa trong miền không gian: tương quan giữa các giá trị
pixel của ảnh, ñiều này có nghĩa rằng các pixel lân cận của ảnh có
giá trị gần giống nhau (trừ những pixel ở giáp ñường biên ảnh).
- Dư thừa trong miền tần số: Tương quan giữa các mặt
phẳng màu hoặc dải phổ khác nhau.
Trọng tâm của các nghiên cứu về nén ảnh là tìm cách giảm
số bít cần thiết ñể biểu diễn ảnh bằng việc loại bỏ dư thừa trong miền
không gian và miền tần số càng nhiều càng tốt.
Nén tín hiệu ảnh là làm giảm số lượng các bít cần thiết ñể
bi
ễu diễn một ảnh cho trước. Mục ñích của việc nén tín hiệu ảnh là
ñể dễ dàng lưu trữ và truyền tải dữ liệu. Để nén tín hiệu ảnh người ta
sử dụng một dãy các phép biến ñổi dữ liệu mà khi biến ñổi ngược lại
-7-

có thể khôi phục lại hoàn toàn chính xác ảnh gốc hoặc xấp xỉ gần
giống như ảnh gốc ban ñầu. Điều ñó có nghĩa là nén tín hiệu ảnh
ñược chia làm hai loại:
- Loại nén ảnh không mất thông tin (có thể không phục lại
hoàn toàn ảnh gốc).
- Loại nén ảnh mất thông tin (có thể khôi phục lại xấp xỉ với
ảnh gốc ban ñầu).
Cả hai loại trên ñều ñược sử dụng rộng rãi và tùy vào mỗi
ứng dụng cụ thể mà sử dụng loại nào cho tối ưu hơn và thích hợp
hơn. Mã hóa không mất thông tin không ñòi hỏi chất lượng của dữ
liệu và ứng dụng của nó bị giới hạn kết quả ñạt ñược khá khiêm tốn.
Nén ảnh không mất thông tin thường ñược dùng cho ảnh
trong y học và trong khoa học không gian, do vấn ñề pháp lý và tính
duy nhất của dữ liệu. Một lĩnh vực ñáng chú ý trong lĩnh vực này
liên quan ñến những vấn ñề cốt tử, chẳng hạn tòa án Hoa Kỳ lưu trữ
những ảnh vân tay ñược số hóa không mất thông tin, tuy nhiên cũng
ñã chuyển sang nén mất thông tin do cần thiết.
Nén ảnh mất thông tin có thể cung cấp tỷ lệ nén cao hơn rất
nhiều lần so với nén ảnh không mất thông tin, tùy thuộc vào kiểu dữ
liệu và mức ñộ mất thông tin mà chúng ta có thể chấp nhận ñược.
Nén ảnh mất thông tin ñuợc sử dụng trong việc truyền và duyệt
Internet, những ứng dụng thương mại, những hội nghị trực tuyến qua
video. Các máy quay video thông thường trong gia ñình thường áp
dụng nén ảnh mất thông tin ñể dễ dàng lưu trữ dữ liệu video phức
tạp, nhưng lại tái hiện hình ảnh với mức ñộ trung thực chấp nhận
ñược cho việc sử dụng trong gia ñình.
-8-

Nhiều ý tưởng và cách tiếp cận ñã ñược ñưa ra ñể ñạt ñược
việc nén ảnh mất thông tin và không mất thông tin theo những triết lý
riêng biệt và theo từng bài toán. Kết quả ñạt ñược bởi nhóm những
giải thuật dẫn ñầu trong mỗi loại không sai biệt nhau nhiều, ñiều ñó
chỉ ra rằng có những nguyên lý cơ bản nằm dưới tất cả các giải thuật
ñó.
Thực tế thì tất cả các kỹ thuật nén ảnh là dựa trên sự hiện
hữu của hai ñặc tính trong dữ liệu ñể ñạt ñược việc giảm thiểu có lợi:
sự dư thừa và sự không thích hợp.
Một ví dụ tầm thường của sự dư thừa dữ liệu là một chuỗi
nhị phân gồm toàn các số zero (số 0) hay là toàn số 1, nó không chứa
ñựng thông tin và có thể ñược mã hóa bởi chỉ một bít và chiều dài
của chuỗi ñể giải mã một cách chính xác. Một ví dụ quan trọng của
dữ liệu không thích hợp xuất hiện trong ảnh ñộ xám với quá nhiều
mức xám, ví dụ như là 12 bít hay nhiều hơn 12 bít. Kinh nghiệm
thực tế cho thấy ảnh ñơn sắc 6 ñến 8 bít là giới hạn của ñộ nhạy thị
giác. Bất cứ bít thêm vào nào cũng ñều không làm tăng thêm khả
năng quan sát (không làm thấy rõ hơn) và có thể loại bỏ.
Số lượng lớn các giải thuật nén chủ yếu khác nhau trong
cách tiếp cận ñể rút ra và tận dụng hai ñặc tính dư thừa và không
thích hợp này. Quan ñiểm trên cho thấy một sự khác biệt giữa mã
hóa mất thông tin và mã hóa không mất thông tin.
- Mã hóa không mất thông tin chỉ dựa vào ñặc tính dư thừa
của dữ liệu, tận dụng những khả năng có thể xảy ra ký hiệu không
giống nhau và khả năng ñoán trước ký hiệu. Nói một cách khác
chu
ỗi các ký hiệu càng nhiều thông tin, càng xuất hiện ngẫu nhiên
nhiều thì càng khó ñể mã hóa mà không mất thông tin. Thông tin trù
-9-

mật, có ít sự dư thừa và khả năng mã hóa không mất thông tin là
những khái niệm gần như ñồng nhất.
- Mã hóa mất thông tin dựa trên một ñặc tính khác của dữ
liệu: sự không thích hợp. Trong bất kỳ hệ thống xử lý ảnh nào, nếu
các yêu cầu thực hiện không cần mức ñộ chính xác (ñộ phân giải
không gian-thời gian hay khoảng biễu diễn) của dữ liệu, sự chính xác
quá ñáng có thể ñược loại bỏ mà không làm mất ñi sự thể hiện. Ví dụ
ảnh mức xám, khoảng biễu diễn dùng 8 bít là ñủ. Như sẽ thấy sau
này, sau khi áp dụng những phép biến ñổi chọn lọc một cách khéo
léo, ngay cả những ảnh 8 bít cũng có thể cho phép loại bỏ một ít dữ
liệu cũng không làm giảm ñến chất lượng của ảnh.
Phương pháp mã hóa mất thông tin sử dụng phép biến ñổi
Wavelet ñể tách phần thích hợp với phần không thích hợp là chủ ñề
chính của ñề tài.
1.3. NÉN ẢNH KHÔNG MẤT THÔNG TIN
Nén ảnh không mất thông tin là một nhánh của lý thuyết
thông tin do Claude Shannon ñề xuất trong một lý thuyết toán học về
truyền tin. Về cơ bản, một kênh truyền tin ñược mô hình hóa như là
sự truyền của một chuỗi vô tận các ký hiệu, mỗi một ký hiệu ñược
rút ra từ một bộ chữ cái (alphabet) xác ñịnh. Những ký hiệu có thể
xuất hiện theo một quy luật xác suất nào ñó và kênh truyền tin có thể
bị “nhiễu”. Việc sử dụng hiệu qủa kênh truyền tin như vậy ñể truyền
tin ñặt ra: 0 LNLogH =≤≤
2

Trong ñó:
- H = 0 khi và chỉ khi tất cả ký hiệu (ngoại trừ 1) có xác suất =
0 và ký hi
ệu còn lại có xác suất ñơn vị.
-10-

- H = Log
2
N = L khi và chỉ khi tất cả các ký hiệu có cùng xác
suất, trong trường hợp này là
N
1
.
Trong thực tế ta luôn mã hóa những chuỗi ký hiệu hữu hạn.
Tuy nhiên, ñộ ño Entropy nói trên ñược dùng như là tỷ lệ chuẩn cần
ñạt ñến trong lĩnh vực này và hoàn toàn có giá trị. Kỹ thuật mã hóa
không mất thông tin cố gắng làm giảm một dòng dữ liệu ñến mức
Entropy của nó.
Một cách tự nhiên, dòng dữ liệu càng dài và con số thống kê
của dữ liệu càng ổn ñịnh thì những kỹ thuật này càng thành công
trong việc tiếp cận ñến mức Entropy. Sau ñây là một số kỹ thuật mã
hóa.
1.3.1. Điều xung mã vi sai (DPCM-Differential Pulse Coded
Modulation)
1.3.2. Mã hóa Huffman
1.3.3. Mã hóa số học
1.4. LƯỢNG TỬ HÓA
1.5. NÉN ẢNH MẤT THÔNG TIN
Giải thuật nén ảnh mất thông tin rất ña dạng, chúng ta chỉ
giới hạn sự quan tâm ñến các cách mã hóa dùng phép biến ñổi. Mã
hóa mất thông tin bao gồm ba khối là:
- Biến ñổi.
- Lượng tử hóa.
- Mã hóa Entropy.
Phép biến ñổi làm giảm tương quan và thu gọn vùng dữ liệu,
l
ượng tử hóa cấp phát số bít cần thiết trên mỗi ký hiệu với ñộ chính
xác tối ña như mong muốn. Bộ mã hóa biến ñổi dữ liệu ñã ñược
-11-

lượng tử hóa thành những ký hiệu gồm hai chữ số là 0 và 1 theo một
cách lợi dụng ñược những sự khác nhau trong xác suất xuất hiện của
những giá trị ñã lượng tử hóa. Ở ñây ta chỉ quan tâm ñặc biệt ñến
những ứng dụng có ñộ nén cao trong ñó số 0 là giá trị sẽ ñược lượng
tử hóa phổ biến nhất, mã hóa loạt dài (RLC-Run-length Coding)
ñược áp dụng trước tiên vào việc mã hóa ñể làm co những dữ liệu ñã
lượng tử hóa ngay lập tức.
1.5.1. Chuẩn JPEG
1.5.2. So sánh chuẩn nén ảnh JPEG2000 với chuẩn nén ảnh
JPEG và các chuẩn nén ảnh khác
1.6. WAVELET
1.6.1. Khái quát về Wavelet
Wavelet,hay tổng quát hơn là tiếp cận băng con, là sự cố
gắng ñể ñạt ñược sự biến ñổi hợp nhất của dữ liệu, bảo toàn mẫu.
Hoạt ñộng trong không gian hai chiều dẫn ñến phép chia bức ảnh các
phần tử tại mỗi bước. Ngoài việc bảo toàn các mẫu quan trọng, thì
toàn bộ cách tiếp cận này ñưa ñến sự ñơn giản hóa ấn tượng khi
thống kê mẫu trong các băng thông cao, tất cả ngoài trừ băng thông
ñều có con số thống kê tương ñương như giá trị trung bình bằng
không, biểu ñồ tương tự như nhau.
Cơ sở của lý thuyết Wavelet như một phương tiện tạo cơ sở
trực chuẩn ñể khai triển tín hiệu thay cho cơ sở trực chuẩn cổ ñiển
dùng các hàm tuần hoàn. Cơ sở trực chuẩn này ñược sinh từ một hàm
nhân tỉ lệ duy nhất hoặc một hàm Wavelet duy nhất cho phép biểu
diễn tín hiệu, tín hiệu có khả năng ñịa phương hóa tốt cho cả hai yếu
t
ố là: thời gian và tần số, như vậy khắc phục ñược nhược ñiểm lớn
-12-

nhất của biến ñổi Fourier. Phần ñầu trình bày một số khái niệm trong
xử lý tín hiệu làm cơ sở cho lý thuyết Wavelet ở các phần tiếp theo.
1.6.2. Một số ứng dụng nổi bật của Wavelet
1.6.2.1. Nén tín hiệu
1.6.2.2. Khử nhiễu
1.6.2.3. Mã hóa nguồn và mã hóa kênh
1.6.3. Cơ sở toán học
1.6.3.1. Khai triển trực chuẩn
1.6.3.2. Tích chập
1.6.3.3. Tính lọc
1.6.3.4. Biến ñổi Fourier
1.6.3.5. Chuỗi Fourier
1.6.3.6. Biến ñổi Fourier rời rạc
1.6.3.7. Chuỗi Fourier rời rạc
1.6.3.8. Lấy mẫu lên và lấy mẫu xuống
1.7. TỔNG KẾT CHƯƠNG 1




-13-

Chương 2. CƠ SỞ LÝ THUYẾT BIẾN ĐỔI WAVELET
2.1. GIỚI THIỆU TỔNG QUAN
Giải thuật mã hóa bằng cây triệt tiêu (Zerotree Coding) do
Shapiro ñề xuất là một giải thuật ñơn giản cho phép nén ảnh hiệu
quả, có ñặc tính các bít ñược phát sinh và mã hóa theo thứ tự của tầm
quan trọng, nhờ vậy hoạt ñộng theo nguyên tắc mã hóa liên tiến
(progressive coding) hay còn gọi là mã hóa nhúng (embeded coding).
Các bít ñược mã hóa liên tiến ñể từ ảnh rỗng ban ñầu có
ñược nén phác họa rồi ñến các chi tiết ñược thêm vào. Dùng giải
thuật mã hóa liên tiến, bộ mã hóa liên tiến, bộ mã hóa có thể ngưng
tại bất kỳ thời ñiểm nào khi ñã ñược số bít trên mỗi pixel (BPP-Bit
Per Pixel) mong muốn hoặc ñạt ñược ñộ méo dạng trong phạm vi
chấp nhận cho trước. Đảo lại, khi có trước các bít ñã ñược mã hóa,
bộ giải mã có thể ngưng tại bất kỳ thời ñiểm nào ñể cho ảnh có thể
ñược phục hồi từ thô ñến mịn dần khi thực hiện cho ñến khi cùng
dòng bít ñã ñược mã hóa, ảnh sẽ ñược khôi phục sẽ có ñầy ñủ chi tiết
mà bộ mã hóa ñã ñược thực hiện. Nếu bộ mã hóa thực hiện việc mã
hóa không mất thông tin thì sẽ khôi phục ñược ảnh không mất thông
tin.
Do ñặc tính liên kết kể trên, mã hóa bằng cây triệt tiêu có thể
ñược áp dụng cho việc truyền ảnh trên mạng khi ñường truyền không
tốt, người sử dụng có thể ngưng tại một thời ñiểm bất kỳ trong quá
trình giải mã nhưng vẫn có ñược phác họa ñược ảnh như mong
muốn, tuy không ñầy ñủ chi tiết so với trường hợp toàn bộ ảnh ñược
giải mã (nhưng thời gian chờ có thể rất lâu).
Gi
ải thuật cây triệt tiêu ñược thực hiện dựa trên biến ñổi
Wavelet và dựa trên sự tương quan giữa các ñiểm ảnh trong ma trận
-14-

biến ñổi ở các băng thông con khác nhau nhưng tương ứng với cùng
một vị trí về mặt không gian trên ảnh gốc. Giải thuật cây triệt tiêu
tìm cách khai thác sự tương tự này.
Với các ñặc tính như trên, phương pháp mã hóa cây triệt tiêu
giải quyết ñược hai vấn ñề:
1. Cho trước một tỷ lệ nén mong muốn với bitrate mong muốn
( tỉ lệ bít trên mỗi pixel), sẽ ñược ảnh có chất lượng tốt nhất.
2. Ảnh ñược mã hóa theo nghĩa liên tiến hay nhúng (embedded
coding), nghĩa là kết quả mã hóa của cùng một ảnh ở tỷ lệ bít/pixel
thấp trùng với phần ñầu của kết quả mã hóa ở tỷ lệ bít/pixel cao hơn.
Ví dụ nén một ảnh ở tỉ lệ 0.5 bpp (số bít trên 1 pixel) là 16384 bytes
thì ảnh này sẽ trùng với 16384 bytes ñầu tiên của ảnh 26216 bytes.
Ngược lại nếu giải mã 16384 bytes ñầu tiên của ảnh 26216 bytes
ñược ảnh có chất lượng như giải mã ñầy ñủ ảnh 16384 bytes.
Các ñặc tính trên có nhiều ứng dụng như tryền ảnh theo
nghĩa liên tiến, duyệt ảnh nhanh (xem trước, chỉ cần ñọc và giải mã
phần ñầu của ảnh ñể có ñược nét phác họa của ảnh), nó cũng có ứng
dụng trong việc truyền tin qua các kênh hay bị nhiễu vì thứ tự các bít
thường tương ứng với thứ tự quan trọng nên tự nhiên ñược bảo vệ
với ñộ ưu tiên cao.
2.2. GIỚI THIỆU MỘT SỐ HỌ CỦA WAVELET
2.2.1. Hàm Wavelet sinh
2.2.2. Hàm nhân tỉ lệ
2.2.3. Phân tích ña phân giải
2.2.4. Hàm Wavelet
2.2.5. Bi
ến ñổi Wavelet rời rạc

Không có nhận xét nào:

Đăng nhận xét