LUẬN VĂN NÉN ẢNH SỬ DỤNG BIẾN ĐỔI WAVELET VÀ ỨNG DỤNG TRONG CÁC DỊCH VỤ DỮ LIỆU ĐA PHƯƠNG TIỆN DI ĐỘNG

Để có thể sử dụng các dịch vụ Internet không dây cũng như nhiều dịch vụ dữ liệu khác trên nền các ứng dụng di động cần có một kỹ thuật then chốt để có thể hỗ trợ truyền thông nhiều dạng dữ liệu trong thông tin di động tế bào như: thoại, văn bản, hình ảnh và video.

Luận văn cao học ĐTVT 2004 – 2006 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI -------- -------- LUẬN VĂN THẠC SỸ KHOA HỌC NÉN ẢNH SỬ DỤNG BIẾN ĐỔI WAVELET VÀ ỨNG DỤNG TRONG CÁC DỊCH VỤ DỮ LIỆU ĐA PHƯƠNG TIỆN DI ĐỘNG NGHÀNH: ĐIỆN TỬ VIỄN THÔNG ĐỖ NGỌC ANH Người hướng dẫn khoa học: PGS.TS. Nguyễn Đức Thuận HÀ NỘI 2006 Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 MỤC LỤC CÁC HÌNH VẼ, BẢNG BIỂU TRONG LUẬN VĂN ..............................5 THUẬT NGỮ TIẾNG ANH ......................................................................7 LỜI GIỚI THIỆU .......................................................................................8 CHƯƠNG 1: MỞ ĐẦU..............................................................................9 1.1. Cơ sở nghiên cứu và mục đích của luận văn ...................................9 1.2. Tổ chức luận văn............................................................................10 CHƯƠNG 2:TỔNG QUAN CÁC KỸ THUẬT NÉN TRONG MÃ HOÁ ẢNH ..........................................................................................................11 2.1. Giới thiệu chung về nén ảnh số .....................................................11 2.2. Phân loại các kỹ thuật nén .............................................................13 2.2.1. Nén tổn hao và không tổn hao ................................................13 2.2.2. Mã hoá dự đoán và mã hoá dựa trên phép biến đổi................13 2.2.3. Mã hoá băng con.....................................................................14 2.3. Tiêu chuẩn đánh giá chất lượng mã hoá ảnh .................................14 2.4.Các kỹ thuật nén có tổn hao............................................................15 2.4.1. Kỹ thuật mã hoá băng con ......................................................15 2.4.2. Kỹ thuật mã hoá dựa trên phép biến đổi.................................19 2.4.2.1. Kỹ thuật mã hoá dựa trên phép biến đổi DCT.................19 2.4.2.2. Kỹ thuật mã hoá dựa trên phép biến đổi DWT ...............25 CHƯƠNG 3:CƠ SỞ LÝ THUYẾT BIẾN ĐỔI WAVELET...................30 3.1. Cơ sở toán học ...............................................................................30 3.1.1. Biến đổi Wavelet liên tục........................................................30 3.1.2. Biến đổi Wavelet rời rạc .........................................................32 3.2. Tính chất của biến đổi Wavelet......................................................33 3.3. Giới thiệu một số họ Wavelet ........................................................37 3.3.1. Biến đổi Wavelet Haar ............................................................37 3.3.2. Biến đổi Wavelet Meyer .........................................................38 Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 3.3.3. Biến đổi Wavelet Daubechies .................................................38 3.4. Một số ứng dụng nổi bật của Wavelet ...........................................39 3.4.1. Nén tín hiệu.............................................................................39 3.4.2. Khử nhiễu ...............................................................................40 3.4.3. Mã hoá nguồn và mã hoá kênh ...............................................40 CHƯƠNG 4:CHUẨN NÉN ẢNH TĨNH DỰA TRÊN BIẾN ĐỔI WAVELET – JPEG2000..........................................................................41 4.1. Lịch sử ra đời và phát triển chuẩn JPEG2000...............................41 4.2. Các tính năng của JPEG2000 ........................................................41 4.3. Các bước thực hiện nén ảnh theo chuẩn JPEG2000 .....................42 4.3.1. Xử lý trước biến đổi................................................................42 4.3.2. Biến đổi liên thành phần .........................................................42 4.3.3. Biến đổi riêng thành phần (biến đổi Wavelet) ........................43 4.3.4.Lượng tử hoá - Giải lượng tử hoá............................................44 4.3.5. Mã hoá và kết hợp dòng dữ liệu sau mã hoá ..........................45 4.3.6. Phương pháp mã hoá SPIHT ..................................................45 4.3.7. Phương pháp mã hoá EZW .....................................................47 4.4. So sánh chuẩn JPEG2000 với JPEG và các chuẩn nén ảnh tĩnh khác .......................................................................................................49 CHƯƠNG 5:ỨNG DỤNG WAVELET TRONG CÁC DỊCH VỤ DỮ LIỆU ĐA PHƯƠNG TIỆN TRONG THÔNG TIN DI ĐỘNG ...............54 5.1. Nén ảnh bằng Wavelet ...................................................................54 5.2.1. Sơ đồ khối tổng quát...............................................................54 5.1.2. Biến đổi Wavelet.....................................................................55 5.1.3. Tính toán năng lượng tiêu hao................................................56 5.2. Thuật toán nén ảnh bằng Wavelet hiệu năng - EEW .....................58 5.2.1. Hiệu năng của các kỹ thuật loại bỏ.........................................60 5.3.2. Các kết quả thực nghiệm ........................................................62 5.3.2.1. Ảnh hưởng đến năng lượng tính toán và chất lượng ảnh 62 Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 5.3.2.2. Ảnh hưởng đến năng lượng truyền thông và chất lượng ảnh.................................................................................................62 5.4. Các tham số nén ảnh bằng Wavelet ...............................................62 5.4.1. Thay đổi mức biến đổi Wavelet ..............................................62 5.4.2. Thay đổi các mức lượng tử .....................................................62 5.5. Truyền ảnh trên mạng ...................................................................62 5.5.1. Phương pháp lựa chọn tham số động......................................62 5.5.2. Kết quả thực nghiệm...............................................................62 KẾT LUẬN...............................................................................................63 Kết quả đạt được và ứng dụng của luận văn.........................................63 Hướng phát triển nghiên cứu ................................................................63 PHỤ LỤC..................................................................................................65 TÀI LIỆU THAM KHẢO ........................................................................66 Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 CÁC HÌNH VẼ, BẢNG BIỂU TRONG LUẬN VĂN Hình 2.1 Sơ đồ bộ khái quát hệ thống nén ảnh.........................................12 Hình 2.2. Sơ đồ minh hoạ kỹ thuật mã hoá băng con – M băng con .......16 Hình 2.3 Minh hoạ quá trình phân ly băng con cây bát phân...................17 Hình 2.4. Phân ly hai ảnh mẫu thành bốn băng con .................................18 Hình 2.5. Sơ đồ bộ mã hoá theo chuẩn JPEG ..........................................23 Hình 2.6. Sắp xếp Zigzag các hệ số DCT ở bộ mã hoá............................23 Hình 2.7. Sơ đồ khối bộ giải mã theo chuẩn JPEG..................................23 Hình 2.8. Bank lọc khôi phục lý thuyết sử dụng DWT 1D ......................28 Hình 2.9. Minh hoạ DWT hai chiều cho ảnh ............................................28 Hình 2.10(a). Minh hoạ DWT kiểu dyadic mức 3 để nén ảnh..................28 Hình 2.10(b). Minh hoạ DWT kiểu dyadic mức 3 để nén ảnh..................29 Hình 3.1. Minh hoạ lưới nhị tố dyadic với các giá trị của m và n............33 Hình 3.2. Phân tích đa phân giải áp dụng cho biểu diễn tín hiệu .............36 Hình 3.3. Hàm ψ ( t ) của biến đổi Haar ....................................................38 Hình 3.4: Hàm ψ ( t ) của biến đổi Meyer..................................................38 Hình 3.5. Hàm ψ ( t ) của họ biến đổi Daubechies n với n=2, 3, 7, 8........39 Hình 4.1: Trình tự mã hoá (a) và giải mã JPEG2000 (b).........................42 Hình 4.2: Minh hoạ ảnh với RGB và YCrCb ...........................................43 Hình 4.3: Phương pháp Lifting 1D dùng tính toán biến đổi Wavelet.......44 Hình 4.4: Minh hoạ cây tứ phân (a) và sự phân mức (b)..........................47 Hình 4.5: Hai cách sắp xếp thứ tự các hệ số biến đổi...............................48 Hình 4.6: So sánh JPEG và JPEG2000....................................................50 Bảng 4.1: So sánh JPEG và JPEG2000 ...................................................51 Hình 4.7: Minh hoạ tính năng ROI ...........................................................52 Bảng 4.2: So sánh tính năng của JPEG2000 với các chuẩn nén ảnh tĩnh khác ...........................................................................................................53 Hình 5.1. Sơ đồ khối quá trình nén ảnh bằng Wavelet .............................54 Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 Hình 5.2. (a) Biến đổi Wavelet 2D mức 3 và (b) Minh hoạ bằng ảnh “CASTLE” ................................................................................................56 Hình 5.3. Phân bố số học các hệ số thông cao sau phép biến đổi Wavelet mức 2.........................................................................................................59 Hình 5.4: Dữ liệu sau phép biến đổi Wavelet với hai kỹ thuật loại bỏ HH và H* .........................................................................................................61 Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 THUẬT NGỮ TIẾNG ANH CWT Biến đổi Wavelet liên tục (Continuous Wavelet Transform) DCT Biến đổi Cosine rời rạc (Discrete Cosine Transform) DFT Biến đổi Fourier rời rạc (Discrete Fourier Transform) DPCM Điều xung mã vi sai (Differized Pulse Code Modulation) DWT Biến đổi Wavelet rời rạc (Discrete Wavelet Transform) EZW Wavelet cây zero (Embedded Zerotree Wavelet) HVS Hệ thống cảm nhận hình ảnh của mắt người (Human Visual System) IDWT Biến đổi Wavelet rời rạc ngược JPEG Chuẩn nén ảnh của ủy ban JPEG quốc tế (Joint Photographic Experts Group) JPEG2000 Chuẩn nén ảnh JPEG2000 Lossless Compression Kỹ thuật nén ảnh không tổn hao (không mất dữ liệu) Lossy Compression Kỹ thuật nén ảnh có tổn hao (có mất dữ liệu) MRA Phân tích đa phân giải (Multi Resolution Analysis) MSE Sai số bình phương trung bình (Mean Square Error) PCM Điều xung mã (Pulse Code Modulation) PSNR Tỷ số tín hiệu đỉnh trên nhiễu (Peak Signal to Noise Ratio) QMF Lọc gương cầu tứ phương (Quardrature Mirror Filters) RLC Mã hoá loạt dài (Run Length Coding) ROI Kỹ thuật mã hóa ảnh theo vùng (Region Of Interest) – Một tính năng mới nổi bật của JPEG2000 SPIHT Phương pháp mã hoá phân cấp theo vùng (Set partitioning in hierarchical trees) STFT Biến đổi Fourier thời gian ngắn (Short Time Fourier Transform) Wavelet Biến đổi băng con Wavelet Wavelet Decomposition Cây phân giải Wavelet Tree Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 LỜI GIỚI THIỆU Trong những năm gần đây, nhu cầu các dịch vụ dữ liệu trên mạng di động, nhất là dữ liệu đa phương tiện là rất lớn. Cùng với nhu cầu đó, vấn đề đặt ra là làm thế nào tìm được một kỹ thuật mã hoá dữ liệu then chốt (chuẩn), có hiệu quả để truyền các dữ liệu này trên mạng di động. Mục đích của luận văn là trình bầy một kỹ thuật nén ảnh sử dụng biến đổi Wavelet cho ảnh tĩnh và đặc biệt là ảnh tĩnh trong các dịch vụ dữ liệu đa phương tiện trong mạng di động. So với các kỹ thuật nén sử dụng phép biến đổi trước đây như biến đổi Fourier (FT), biến đổi cosine rời rạc (DCT), biến đổi xếp chồng (LT),.., biến đổi Wavelet (DWT) có nhiều ưu điểm không chỉ trong xử lý ảnh mà còn nhiều ứng dụng khác. Bằng chứng là sự ra đời của chuẩn nén JPEG2000 (dựa trên DWT) có tính năng vượt trội so với JPEG (DCT). Tuy nhiên chuẩn JPEG, MPEG hay ngay cả JPEG2000 cũng chỉ tập trung vào hiệu quả nén (tỉ số nén) và chất lượng ảnh mà không chú ý đến năng lượng tiêu hao trong quá trình xử lý và truyền trên mạng. Trong luận văn đã trình bầy một kỹ thuật nén ảnh trong mạng di động sử dụng biến đổi Wavelet hiệu năng không chỉ đem lại hiệu quả nén, chất lượng hình ảnh mà còn tiết kiệm năng lượng xử lý của hệ thống. Điều này hứa hẹn có thể xây dựng một bộ mã hoá ảnh tiết kiệm năng lượng xử lý, thời gian truyền mà vẫn phù hợp với điều kiện băng thông thấp, ràng buộc về chất lượng dữ liệu trong các mạng thông tin di động. Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 CHƯƠNG 1: MỞ ĐẦU 1.1. Cơ sở nghiên cứu và mục đích của luận văn Để có thể sử dụng các dịch vụ Internet không dây cũng như nhiều dịch vụ dữ liệu khác trên nền các ứng dụng di động cần có một kỹ thuật then chốt để có thể hỗ trợ truyền thông nhiều dạng dữ liệu trong thông tin di động tế bào như: thoại, văn bản, hình ảnh và video. Tuy nhiên vấn đề truyền thông nội dung đa phương tiện trong thông tin di động gặp một số khó khăn: băng thông của mạng di động tế bào, nhiễu kênh, giới hạn của pin cho các ứng dụng, tính tương thích dữ liệu giữa các thuê bao. Trong khi việc cải thiện băng thông di động cần một công nghệ mới của tương lai còn việc cải thiện giới hạn của pin không đáp ứng được sự phát triển của các dịch vụ tương lai, thì phương pháp giảm kích thước dữ liệu bằng các kỹ thuật nén là một cách tiếp cận hiệu quả giải quyết các khó khăn trên. Mặc dù cho đến nay có rất nhiều kỹ thuật nén dữ liệu đa phương tiện như: chuẩn JPEG (dựa trên biến đổi DCT), chuẩn JPEG2000 (dựa trên biến đổi Wavelet) và chuẩn MPEG, tuy nhiên những kỹ thuật này chỉ tập trung vào hiệu quả nén và cố gắng đánh mất chất lượng ảnh ít vì thế chúng bỏ qua vấn đề tiêu hao năng lượng trong quá trình nén và truyền RF (trong thông tin động). Luận văn này trình bầy một kỹ thuật hiệu quả để khắc phục những khó khăn trên cho loại dữ liệu đa phương tiện điển hình trong thông tin di động là ảnh tĩnh. Đó là kỹ thuật nén ảnh sử dụng biến đổi Wavelet thích nghi và hiệu năng cho dữ liệu đa phương tiện trong thông tin di động. Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 1.2. Tổ chức luận văn Luận văn được trình bầy thành 5 chương và 1 phụ lục. Chương 1, tác giả trình bày tóm tắt cơ sở nghiên cứu và mục đích cũng như tổ chức của luận văn. Chương 2 trình bầy khái quát các kỹ thuật nén ảnh, phân loại các nguyên lý nén và định nghĩa một số thuật ngữ được sử dụng rộng rãi như MSE, PSNR và SNR. Chương này cũng trình bầy cơ sở lý thuyết của các nguyên lý nén có tổn hao điển hình như: mã hoá băng con; mã hoá dựa trên biến đổi cosine rời rạc (DCT), biến đổi xếp chồng (LT), biến đổi Wavelet rời rạc (DWT). Chương 3 trình bầy cơ sở toán học, tính chất của biến đổi Wavelet. Nội dung của chương này là lý thuết nền tảng cho các ứng dụng Wavelet. Chương này cũng đưa ra một số họ Wavelet phổ biến và giới thiệu một số ứng dụng nổi bật của Wavelet ngoài ứng dụng để nén ảnh. Chương 4 giới thiệu tổng quan về chuẩn nén JPEG2000 dựa trên biến đổi Wavelet. Mục đích không chỉ là giới thiệu một chuẩn nén vượt trội so với chuẩn JPEG dựa trên biến đổi DCT mà còn đưa ra một lựa chọn giải quyết bài toán đặt ra trong luận văn. JPEG2000 đang từng bước được tổ chức ISO công nhận nên chắc chắn sẽ trở thành một chuẩn nén phổ biến trong các ứng dụng di động tương lai. Cũng trong chương này, tác giả trình bầy tóm tắt các bước thực hiện nén ảnh theo JPEG200 và so sánh nó với chuẩn JPEG và các chuẩn nén ảnh tĩnh khác. Chương 5 cũng là chương quan trọng nhất. Dựa trên kỹ thuật nén ảnh bằng Wavelet, luận văn đưa ra một thuật toán biến đổi ảnh bằng Wavelet hiệu năng làm giảm đáng kể năng lượng tính toán và truyền thông cần thiết cho ảnh mà vẫn đảm bảo được chất lượng bức ảnh (và như vậy giảm được giá thành dịch vụ). Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 CHƯƠNG 2:TỔNG QUAN CÁC KỸ THUẬT NÉN TRONG MÃ HOÁ ẢNH 2.1. Giới thiệu chung về nén ảnh số Nén ảnh số là một đề tài nghiên cứu rất phổ biến trong lĩnh vực xử lý dữ liệu đa phương tiện. Mục đích là làm thế nào để lưu trữ bức ảnh dưới dạng có kích thước nhỏ hơn hay dưới dạng biểu diễn mà chỉ yêu cầu số bít mã hoá ít hơn so với bức ảnh gốc. Nén ảnh thực hiện được là do một thực tế: thông tin trong bức ảnh không phải là ngẫu nhiên mà có trật tự, có tổ chức. Vì thế nếu bóc tách được tính trật tự, cấu trúc đó thì sẽ biết được phần thông tin nào quan trọng nhất trong bức ảnh để biểu diễn và truyền đi với số lượng bít ít hơn so với ảnh gốc mà vẫn đảm bảo tính đầy đủ thông tin. Ở phía thu, quá trình giải mã sẽ tổ chức, sắp xếp lại được bức ảnh xấp xỉ gần chính xác so với ảnh gốc nhưng vẫn thoả mãn chất lượng yêu cầu, đảm bảo đủ thông tin cần thiết. Tóm lại, tín hiệu ảnh, video hay audio đều có thể nén lại bởi chúng có những tính chất như sau: • Có sự tương quan (dư thừa) thông tin về không gian: Trong phạm vi một bức ảnh hay một khung video tồn tại sự tương quan đáng kể (dư thừa) giữa các điểm ảnh lân cận. • Có sự tương quan (dư thừa) thông tin về phổ: Các dữ liệu thu được từ các bộ cảm biến của thiết bị thu nhận ảnh tồn tại sự tương quan đáng kể giữa các mẫu thu, đây chính là sự tương quan về phổ. • Có sự tương quan (dư thừa) thông tin về thời gian: Trong một chuỗi ảnh video, tồn tại sự tương quan giữa các điểm ảnh của các khung video (frame). Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 Sơ đồ của một hệ thống nén dữ liệu tổng quát như sau: Hình 2.1 Sơ đồ bộ khái quát hệ thống nén ảnh Trong hình 2.1, bộ mã hoá dữ liệu thực hiện quá trình nén bằng cách giảm kích thước dữ liệu ảnh gốc đến một mức phù hợp với việc lưu trữ và truyền dẫn trên kênh. Tốc độ bít đầu ra của bộ mã hoá được tính là số bít cho một mẫu (điểm ảnh). Bộ mã hoá kênh thực hiện việc chuyển đổi luồng bít đã được nén thành dạng tín hiệu phù hợp cả cho việc lưu trữ và truyền dẫn, thường bộ mã hoá kênh sử dụng các kỹ thuật: mã hoá có độ dài thay đổi – RLC (Run Length Coding)[4], mã hoá Huffman[4], mã hoá số học [4]. Bộ giải mã thực hiện quá trình ngược lại so với bộ mã hoá. Trong các hệ thống nén, tỉ số nén chính là tham số quan trọng đánh giá khả năng nén của hệ thống, công thức được tính như sau: Tỉ số nén = Kích thước dữ liệu gốc / Kích thước dữ liệu nén Đối với ảnh tĩnh, kích thước chính là số bít để biểu diễn toàn bộ bức ảnh. Đối với ảnh video, kích thước chính là số bít để biểu diễn một khung hình video (video frame). Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 2.2. Phân loại các kỹ thuật nén Các kỹ thuật nén chủ yếu được phân loại như sau: 2.2.1. Nén tổn hao và không tổn hao Trong các kỹ thuật nén không tổn hao (losses compression), ảnh khôi phục giống hoàn toàn so với ảnh gốc. Tuy nhiên, nén không tổn hao chỉ đạt được hiệu quả nén rất nhỏ. Trái lại, các kỹ thuật nén có tổn hao (lossy compression) có thể đạt được hiệu quả nén cao hơn rất nhiều mà ở điều kiện cảm nhận hình ảnh thông thường sự mất mát thông tin không cảm nhận được và vì thế vẫn đảm bảo chất lượng ảnh. Một số kỹ thuật nén có tổn hao gồm: điều xung mã vi sai – DPCM, điều xung mã – PCM, lượng tử hoá véctơ – VQ, mã hoá biến đổi và băng con. Ảnh khôi phục trong hệ thống nén có tổn hao luôn có sự suy giảm thông tin so với ảnh gốc bởi vì: phương pháp nén này đã loại bỏ những thông tin dư thừa không cần thiết. 2.2.2. Mã hoá dự đoán và mã hoá dựa trên phép biến đổi Đối với mã hoá dự đoán (predictive coding) các giá trị mang thông tin đã được gửi hay đang sẵn có sẽ được sử dụng để dự đoán các giá trị khác, và chỉ mã hoá sự sai lệch giữa chúng. Phương pháp này đơn giản và rất phù hợp với việc khai thác các đặc tính cục bộ của bức ảnh. Kỹ thuật DPCM chính là một ví dụ điển hình của phương pháp này. Trong khi đó, mã hoá dựa trên phép biến đổi (transform based coding) thì lại thực hiện như sau: trước tiên thực hiện phép biến đổi với ảnh để chuyển sự biểu diễn ảnh từ miền không gian sang một miền biểu diễn khác. Các phép biến đổi thường dùng là: DCT - biến đổi Cosine rời rạc, DWT - biến đổi Wavelet rời rạc, LT - biến đổi trồng (lapped) , tiếp đó thực hiện mã hoá đối với các hệ sộ biến đổi. Phương pháp này có hiệu suất nén cao hơn rất nhiều so với phương pháp nén dự đoán bởi vì chính các phép biến đổi (sử dụng các thuộc tính nén năng lượng của mình) đã gói gọn toàn bộ năng lượng bức ảnh chỉ bằng một số ít các hệ số, số lớn các hệ số còn lại ít có ý nghĩa hơn sẽ bị loại bỏ sau khi lượng tử hoá và như vậy lượng dữ liệu phải Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 truyền nhỏ đi rất nhiều. Trong phương pháp mã hoá dự đoán, sai lệch giữa ảnh gốc và ảnh dự đoán vẫn có ý nghĩa (còn sử dụng ở bước tiếp theo) sau khi lượng tử hoá, chính điều này làm cho phương pháp mã hoá dự đoán có nhiều dữ liệu được truyền đi hơn so với phương pháp mã hoá biến đổi. 2.2.3. Mã hoá băng con Bản chất của kỹ thuật mã hoá băng con (subband coding) là chia băng tần của tín hiệu (ảnh) thành nhiều băng con (subband). Để mã hoá cho mỗi băng con, chúng ta sử dụng một bộ mã hoá và một tốc độ bít tương ứng với tính chất thống kê của băng con. 2.3. Tiêu chuẩn đánh giá chất lượng mã hoá ảnh Để đánh giá chất lượng của bức ảnh (hay khung ảnh video) ở đầu ra của bộ mã hoá, người ta thường sử dụng hai tham số: Sai số bình phương trung bình – MSE (mean square error) và tỉ số tín hiệu trên nhiễu đỉnh – PSNR (peak to signal to noise ratio). MSE thường được gọi là phương sai lượng tử - σ q2 (quantization error variance). MSE giữa ảnh gốc và ảnh khôi phục được tính như sau: 1 ∑ ( f [ j , k ] - g [ j , k ]) 2 MSE = σ q = 2 (2.1) N j ,k Trong đó tổng lấy theo j, k tính cho tổng tất cả các điểm ảnh trong ảnh và N là số điểm ảnh trong ảnh. Còn PSNR giữa hai ảnh (b bít cho mỗi điểm ảnh, RMSE là căn bậc 2 của MSE) đước tính theo công thức dB như sau: RMSE PSNR = −20 log10 (2.2) 2b − 1 Thông thường, nếu PSNR ≥ 40dB thì hệ thống mắt người gần như không phân biệt được giữa ảnh gốc và ảnh khôi phục. Một tham số khác hay sử dụng trong các hệ thông viễn thông đó là tỉ số tín hiệu trên nhiễu - SNR , tuy vậy SNR sử dụng cho một hệ thống né ảnh cũng có công thức dB như sau: Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 Encoder input energy SNR = 10log10 (2.3) Noise energy 2.4.Các kỹ thuật nén có tổn hao Trong phần này, tác giả lựa chọn trình bày hai kỹ thuật nén tổn hao cho nén ảnh tĩnh và ảnh động đó là: mã hoá băng con (subband coding) và mã hoá sử dụng phép biến đổi (transform coding). Đây là hai kỹ thuật nén điển hình và cho hiểu quả nén cũng như chất lượng ảnh cao. 2.4.1. Kỹ thuật mã hoá băng con Tư tưởng chính của kỹ thuật mã hoá băng con là: các ảnh được lấy mẫu ở đầu vào được phân ly thành các băng tần khác nhau (gọi là các tín hiệu băng con). Yêu cầu của kỹ thuật này là làm thế nào các băng con không bị chồng chéo lên nhau. Để có thể phân ly tín hiệu ở bộ mã hoá (encoder) thành các băng con, ảnh được cho qua một bank lọc (filter bank) gọi là bank lọc phân tích và mỗi đầu ra của bank lọc băng con được lấy mẫu xuống hệ số 2. Các đầu ra băng con tần số được lẫy mẫu xuống sẽ lần lượt được: lượng tử hoá độc lập bằng các bộ lọc vô hướng khác nhau, mã hoá entropy, lưu trữ và truyền đi. Ở phía bộ giải mã (decoder), quá trình được thực hiện ngược lại: giải lượng tử băng con tần số, lấy mẫu lên với hệ số 2, cho đi qua bank lọc băng con tổng hợp rồi cộng tất cả các đầu ra của bộ lọc để khôi phục lại ảnh. Các bộ lọc băng con thường được thiết kế xấp xỉ thoả mãn tiêu chuẩn của các đáp ứng tần số không chồng chéo. Mục đích là để giải tương quan các hệ số tần số kết quả. Đây chính là tính chất quan trọng mà quá trình lọc băng con cố gắng đạt được. Các bộ lọc băng con được thiết kế để là các xấp xỉ với các bộ lọc chọn tần số lý tưởng, trong đó đáp ứng tổng hợp từ tất cả các bộ lọc bao trùm tất cả băng tần của ảnh. Tuy nhiên trong thực tế, sự tương quan tổng không bao giờ đạt được do những bộ lọc này chỉ xấp xỉ với các bộ lọc lý tưởng. Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 Hình 2.2 dưới đây là sơ đồ tổng quát giải thích kỹ thuật mã hoá băng con. Hình 2.2. Sơ đồ minh hoạ kỹ thuật mã hoá băng con – M băng con Các bộ lọc sử dụng trong mã hoá băng con là các bộ lọc gương tứ phương – QMF (quardrature mirror filters), do vậy chúng ta chỉ cần thiết kế các bộ lọc thông thấp có đáp ứng H(ω) còn đáp ứng của các bộ lọc thông cao là H(ω+π) chỉ là sự dịch pha 180o so với bộ lọc thông thấp. Sự chính xác của bộ lọc phụ thuộc vào số các hệ số của bộ lọc. Một trong các phương pháp mã hoá băng con đó là áp dụng sự phân ly cây bát phân để phân ly dữ liệu ảnh thành các băng tần khác nhau. Ý tưởng của phương pháp này là: trước tiên lọc và lược bỏ ảnh để phân ly ảnh thành các băng con tần số cao và thấp, sau đó tiếp tục phân ly nhưng chỉ áp dụng cho băng con tần số thấp để tạo thành các băng con tần số cao và thấp để tiếp tục lược bỏ. Kỹ thuật này rất phổ biến và cũng được Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 áp dụng trong các bộ mã sử dụng biến đổi Wavelet. Đầu ra của các băng con sau khi đã giản lược sẽ được lượng tử hoá và mã hoá độc lập. Mỗi băng con sẽ sử dụng bộ lượng tử hoá riêng và mỗi bộ lượng tử hoá này có tốc độ lấy mẫu riêng (bít/mẫu). Như vậy rõ ràng mã hoá băng con không đạt được sự nén, mà nó chỉ thực hiện việc giải tương quan dữ ảnh gốc và tập trung năng lượng của ảnh vào một số băng con. Nén chỉ đạt được là do sự lược bỏ ảnh (decimation) và do sự lượng tử hoá (quantization). Hình 2.3 Minh hoạ quá trình phân ly băng con cây bát phân Trong các hệ thống mã hoá băng con hai chiều thực tế, người ta chia miền tần số - không gian hai chiều của ảnh gốc thành các băng khác nhau ở bất kỳ mức nào. Hình 2.4 dưới đây minh hoạ việc phân ly 2 ảnh mẫu thành 4 băng con LL, HL, LH và HH ở mức đầu tiên. Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 Hình 2.4. Phân ly hai ảnh mẫu thành bốn băng con Nhược điểm của kỹ thuật mã hoá băng con: Một trong những vấn để chủ yếu của kỹ thuật mã hoá băng con đó là giải quyết bài toán cấp phát bít (là số bít cấp cho mỗi băng con) để đạt được hiệu suất cao nhất. Một trong những cách thực hiện là sử dụng ý tưởng cấp phát bít tối ưu cho mỗi đầu ra băng con đã được lượng tử hoá. Tuy nhiên cách này chủ yếu thích hợp cho trường hợp tốc độ cao (≥1bít/mẫu). Trước khi đi vào nghiên cứu kỹ thuật mã hoá dựa trên phép biến đổi, chúng ta sẽ tổng kết một số nhược điểm của kỹ thuật mã hoá băng con như sau: Kỹ thuật mã hoá băng con không xác định được hệ thống mã hoá tối ưu cho các ứng dụng tốc độ bít thấp. Việc cấp phát bít tối ưu sẽ thay đổi khi tốc độ bít tổng thay đổi, điều này làm quá trình mã hoá phải lặp lại hoàn toàn cho mỗi tốc độ bít xác định. Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 Không hoàn toàn giải tương quan cho tất cả các băng tần, đấy là do các bộ lọc không phải là lý tưởng và có sự chồng chéo nhỏ giữa các băng tần liền kề. Do vậy luôn luôn tồn tại một sự tương quan nhỏ giữa các băng tần kề nhau và dữ liệu sẽ không được nén hoàn toàn. Kỹ thuật mã hoá băng con không hiệu quả khi thực hiện bù chuyển động trong video vì rất khó để thực hiện đánh giá chuyển động ở các băng con (sai số dự đoán là rất lớn). 2.4.2. Kỹ thuật mã hoá dựa trên phép biến đổi Một phép biến đổi là một hàm toán học được sử dụng để biến đổi một tập các giá trị này thành một tập giá trị khác và tạo ra một cách biểu diễn mới cho cùng một nguồn tin. Tất cả các phép biến đổi mà chúng ta định trình bầy dưới đây đều là không tổn hao (lossless); với sự chính xác của các phép toán số học thì các phép biến đổi vẫn bảo tồn được độ chính xác ở bất kỳ mức độ nào. Nhưng hầu hết các kỹ thuật mã hoá đều có tổn hao ở bước lượng tử hoá do có sự làm tròn giá trị cho các hệ số phép biến đổi. Phần này chúng ta sẽ trình bầy các kỹ thuật mã hoá dựa trên phép biến đổi được sử dụng trong nén ảnh. (a) Kỹ thuật mã hoá dựa trên phép biến đổi cosine rời rạc – DCT (b) Kỹ thuật mã hoá dựa trên phép biến đổi chồng – LT (c) Kỹ thuật mã hoá dựa trên phép biến đổi DWT 2.4.2.1. Kỹ thuật mã hoá dựa trên phép biến đổi DCT Phép biến đổi cosine rời rạc – DCT (Discrete Cosine Transform) biến đổi thông tin ảnh từ miền không gian sang miền tần số để có thể biểu diễn dưới dạng gọn hơn. Tính chất của nó tương tự như biến đổi Fourier, coi ảnh đầu vào (tín hiệu audio hoặc video) là các tín hiệu ổn định bất Đỗ Ngọc Anh Luận văn cao học ĐTVT 2004 – 2006 biến theo thời gian. Để hiểu rõ kỹ thuật này trước hết ta cần tìm hiểu biến đổi Fourier. Biến đổi Fourier – FT Biến đổi Fourier – FT (Fourier Transform) là một phép biến đổi thuận nghịch, nó cho phép sự chuyển đổi thuận – nghịch giữa thông tin gốc (miền không gian hoặc thời gian) và tín hiệu được xử lý (được biến đổi). Tuy nhiên ở một thời điểm bất kỳ chỉ tồn tại một miền thông tin được thể hiện. Nghĩa là tín hiệu trong miền không gian không có sự xuất hiện thông tin về tần số và tín hiệu sau biến đổi Fourier không có sự xuất hiện thông tin về thời gian. FT cho biết thông tin tần số của tín hiệu, cho biết những tần số nào có trong tín hiệu, tuy nhiên nó không cho biết tần số đó xuất hiện khi nào trong tín hiệu. Nếu như tín hiệu là ổn định (stationary – có các thành phần tần số không thay đổi theo thời gian) thì việc xác định các thành phần tần số xuất hiện khi nào trong tín hiệu là không cần thiết. Phép biến đổi FT thuận và nghịch được định nghĩa như sau: ∞ ∫ x (t )e − 2 jπft X(f) = dt (2.4) −∞ ∞ ∫ X ( f )e 2 jπft x(t) = df (2.5) −∞ Phép biến đổi FT cũng có thể được áp dụng cho tín hiệu không ổn định (non-stationary) nếu như chúng ta chỉ quan tâm đến thành phần phổ nào có trong tín hiệu mà không quan tâm đến nó xuất hiện khi nào trong tín hiệu. Tuy nhiên, nếu thông tin về thời gian xuất hiện của phổ trong tín hiệu là cần thiết, thì phép biến đổi FT không có khả năng đáp ứng được yêu cầu này, đây cũng là hạn chế của phép biến đổi này. Để có biến đổi Fourier rời rạc –DFT (Discrete Fourier Transform) thì ở phép tích phân trong biểu thức toán học của biến đổi FT, ta thay bằng phép tổng và tính toán nó với các mẫu hữu hạn. Đỗ Ngọc Anh

Tải về miễn phí