logo

THU NHẬN ẢNH ( IMAGE REPRESENTATION AND MODELING )

Chương này giới thiệu quá trình thu nhận ảnh cũng như các thiết bị dùng trong hệ thống xử lý ảnh. Tiếp theo là quá trình lấy mẫu và lượng tử hoá ảnh. Đồng thời cũng giới thiệu một số phương pháp biểu diễn ảnh, các kiểu tệp và cấu trúc của chúng dùng trong lưu trữ ảnh như .IMG, .PCX,TIFF,...
Chương Hai: THU NHẬN ẢNH 2 THU NH ẬN ẢNH IMAGE REPRESENTATION AND MODELING Chương này giới thiệu quá trình thu nhận ảnh cũng như các thi ết b ị dùng trong hệ thống xử lý ảnh. Tiếp theo là quá trình lấy mẫu và l ượng t ử hoá ảnh. Đ ồng th ời cũng giới thiệu một số phương pháp biểu diễn ảnh, các kiểu tệp và cấu trúc c ủa chúng dùng trong lưu trữ ảnh như .IMG, .PCX,TIFF,.... Cuối cùng, trình bày nguyên t ắc tái hiện ảnh gồm các kỹ thuật Bayer Dithering, Rylander Pattern Matrix.... 2.1 CÁC THIẾT BỊ THU NHẬN ẢNH VÀ KỸ THUẬT PHÂN TÍCH MÀU 2.1.1 Thiết bị thu nhận ảnh Một hệ thống xử lý ảnh có thể trang bị kèm theo các hệ thống thông tin đ ịa lý - GIS (Geographical Information System) hay hệ MORPHO(giá khoảng7 đến 8 triệu USD) hoặc có thể là hệ thống máy tính cá. Các thi ết bị thu ảnh thông thường g ồm máy quay (camera) cộng với bộ chuyển đổi tương tự số AD(Analog to Digital) ho ặc máy quét (scanner) chuyên dụng. Các thiết bị thu nhận ảnh này có thể cho ảnh trắng đen B/W (Black & White) với mật độ từ 400 đến 1600 dpi (dot per inch) hoặc ảnh màu 600 dpi. Với ảnh B/W mức màu z là 0 hoặc 1. Với ảnh đa cấp xám, mức xám biến thiên t ừ 0 đ ến 255. Ảnh màu, mỗi điểm ảnh lưu trữ trong 3 bytes và do đó ta có 2 8x3 =2 24 màu (cỡ 16, 7 triệu màu). Khi dùng scanner, một dòng photodiot sẽ quét ngang ảnh (quét theo hàng) và cho ảnh với độ phân giải ngang khá tốt. Đầu ra của scanner là ảnh ma tr ận s ố mà ta quen gọi là bản đồ ảnh (ảnh Bitmap). Bộ số hoá (digitalizer) sẽ t ạo ảnh vector có hướng. Trong xử lý ảnh bằng máy tính, ta không thể không nói đến thi ết bị monitor (màn hình) để hiện ảnh. Monitor có nhiều loại khác nhau: NhËp m«n xö lý ¶nh sè - §HBK Hµ néi 10 Chương Hai: THU NHẬN ẢNH - CGA : 640 x 320 x 16 màu, - EGA : 640 x 350 x 16 màu, - VGA : 640 x 480 x 16 màu, - SVGA: 1024 x 768 x 256 màu. Với ảnh màu, có nhiều cách tổ hợp màu khác nhau. Theo lý thuyết màu do Thomas đưa ra từ năm 1802, mọi màu đều có thể tổ hợp t ừ 3 màu c ơ b ản: Red (đ ỏ), Green (lục) và Blue (lơ). Thiết bị ra ảnh có thể là máy in đen trắng, máy in màu hay máy vẽ (ploter). Máy vẽ cũng có nhiều loại: loại dùng bút, loại phun mực. Nhìn chung, các hệ thống thu nhận ảnh thực hiện 2 quá trình: - Cảm biến: biến đổi năng lượng quang học (ánh sáng) thành năng lượng đi ện. - Tổng hợp năng lượng điện thành ảnh. 2.1.2 Biểu diễn màu Ánh sáng màu là tổ hợp của ánh sáng đơn sắc. Mắt người ch ỉ có thể c ảm nhận được vài chục màu, song lại có thể phân biệt được t ới hàng ngàn màu. Có 3 thuộc tính chủ yếu trong cảm nhận màu: - Brightness: sắc màu, còn gọi là độ chói. - Hue : sắc lượng, còn gọi là sắc thái màu. - Saturation: độ bão hoà Với nguồn sáng đơn sắc, độ hue tương ứng với bước sóng λ. Độ bão hoà thay đổi nhanh nếu ta thêm lượng ánh sáng trắng. Hình 2.1 mô t ả mối liên quan gi ữa các đ ại lượng trên và 3 màu chủ yếu R, G và B. Với một điểm W* cố định, các kí hiệu G, R, B chỉ vị trí t ương đ ối c ủa các phổ màu đỏ, lục và lơ. Do sự tán sắc ánh sáng (ứng với khai triển Fourier) mà ta nhìn rõ màu. Theo Maxwell, trong võng mạc mắt có 3 loại t ế bào hình nón c ảm th ụ 3 màu cơ bản ứng với 3 phổ hấp thụ S1( λ), S2(λ) và S3(λ). Nhập môn xử lý ảnh số - ĐHBK Hà nội 11 Chương Hai: THU NHẬN ẢNH White - Một màu bất kỳ sẽ là một điểm lines of greys W* trên vòng tròn. Hue S - Nếu White và Black là như G S R nhau thì đường tròn là lớn nhất và R là điểm bão hoà. B - S thay đổi theo bán kính Saturation - H thay đổi theo góc θ - W* là sẵc màu Black Hình 2.1. Hệ toạ độ màu RGB λmin = 380 nm; λ max = 780 nm. S1(λ) S2(λ) S3(λ) 100 80 60 40 20 0 400 500 600 650 λ yellow green blue Nhập môn xử lý ảnh số - ĐHBK Hà nội 12 Chương Hai: THU NHẬN ẢNH Hình 2.2 Các đường cong cảm nhận S1, S2 và S3. Theo lý thuyết 3 màu, phân bố phổ năng lượng của một nguồn sáng màu ký hiệu là C(λ) và tổ hợp màu theo nguyên tắc 3 màu có thể mô t ả bằng hình 2.3 dưới đây: ∫s1(x)c(λ)dλ α1(C) c(λ) ∫ s2(x)c(λ)dλ α2(C) ∫ s3(x)c(λ)dλ α3(C) Hình 2.3. Nguyên tắc tổ hợp màu. λmax Do đó, αi(C) = ∫Si (λ)c(λ)dλ với i = 1, 2, 3. (2.1) λmin αi(C) gọi là đáp ứng phổ (spectral responses). Phương trình 2.1 gọi là phương trình biểu diễn màu. Nếu C 1(χ) và C2(χ) là hai phân bố phổ năng lượng tạo nên các đáp ứng phổ α1(C1) và α2(C2) mà αi(C1) = αi(C2), với i =1, 2, 3 thì hai màu C1 và C2 là như nhau (sánh được). 2.1.3 Tổng hợp màu và sánh màu Một trong các vấn đề cơ bản của lý thuyết biểu diễn màu là s ử d ụng một t ập các nguồn sáng (màu) để biểu diễn màu. Theo lý thuyết 3 màu c ủa Thomas, ng ười ta Nhập môn xử lý ảnh số - ĐHBK Hà nội 13 Chương Hai: THU NHẬN ẢNH hạn chế số màu còn 3 màu cơ bản: đỏ, lục và lơ. Giả sử r ằng ba ngu ồn sáng c ơ bản có phân phối phổ năng lượng là pk( χ) với k =1, 2, 3 và: χ min ∫ χ max pk( χ)dχ = 1 Để sánh một màu C(χ), giả sử rằng 3 màu cơ bản được tổ hợp theo tỉ lệ βk(χ), k =1, 2, 3, như vậy: 3 ∑ βk(χ)pk( χ) sẽ cho C(χ). Thay giá trị này vào phương trình 2.1 ta có: k =1 λmax 3 3 χ min αi(C) = ∫S λmin i (λ)[ ∑ βk(χ)pk( χ)] dλ = ∑ βk(χ) ∫ pk( χ)Si(χ)dχ k =1 k =1 χ max 3 χ min = ∑ βk(χ)ai,k với ai,k = ∫ pk( χ)Si(χ)dχ k =1 χ max Như vậy, có thể tổng hợp màu theo phép cộng: màu X = α1 đỏ + α2 xanh + α3 lơ với α1, α2 và α3 là các hệ số tổng hợp. Phương pháp này hay đ ược dùng trong các ảnh dân dụng. Lý thuyết tổng hợp màu trên cho phép đưa ra một số luật sánh màu sau: i) mọi màu có thể sánh bởi nhiều nhất 3 màu. ii) nguồn sáng của một màu tổng hợp bằng tổng nguồn sáng các màu thành phần. iii) nếu màu C1 sánh được với màu C1' và C2 sánh được với màu C2' thì: - α1 C1+ α2 C2 = α1C1'+ α2 C2' : luật cộng màu - nếu C1+ C2 = C1'+ C2' và C2 = C2' thì C1 = C2'. iv) luật bắc cầu: nếu C1 = C2 và C2 = C3 thì C1 = C3. dấu = ở trên có nghĩa là sánh được. 2.1.4 Hệ toạ độ màu Tổ chức quốc tế về chuẩn hoá màu CIE(Commision Internationale d'Eclairage) đưa ra một số các chuẩn để biểu diễn màu. Các hệ này có các chu ẩn riêng. Ở đây ch ỉ đ ề cập đến chuẩn màu CIE-RGB (hệ toạ độ dùng 3 màu cơ bản). Như đã nêu trên, một màu Nhập môn xử lý ảnh số - ĐHBK Hà nội 14 Chương Hai: THU NHẬN ẢNH là tổ hợp của các màu cơ bản theo một tỉ lệ nào đấy. Như vậy, một pixel ảnh màu kí hiệu Px được viết: red   Px = green    blue    Người ta dùng hệ toạ độ ba màu R-G-B(tương ứng với hệ toạ độ x-y-z) đ ể biểu diễn màu như sau: Blue (lơ) (0,0,1) l ơ (0,0,1) Tím xanh Tím (1,0,1) (1,1,1) vàng đ ậm (0,0,0) đen (0,1,0) lục Green (l ục) (1,0,0) đ ỏ (1,1,0) vàng Red (đỏ) Trong cách biểu diễn này ta có công thức: đỏ + l ục + lơ =1. Công th ức này g ọi là công thức Maxell. Trong hình vẽ trên, tam giác t ạo bởi ba đ ường đ ứt đo ạn g ọi là tam giác Maxell. Ta cũng có thể chuyển từ hệ toạ đ ộ 3 màu về h ệ toạ đ ộ x-y-z. 2.2 LẤY MẪU VÀ LƯỢNG TỬ HOÁ (IMAGE SAMPLING AND QUANTIZATION) Yêu cầu cơ bản nhất trong xử lý ảnh bằng máy tính là đưa ảnh v ề dạng bi ểu diễn s ố thích hợp, nghĩa là ảnh phải được biểu diễn bởi một ma trận h ữu hạn t ương ứng với việc lấy mẫuảnh trên một lưới rời rạc và mỗi pixel đ ược lượng hoá bởi một s ố hữu Nhập môn xử lý ảnh số - ĐHBK Hà nội 15 Chương Hai: THU NHẬN ẢNH hạn bit. ảnh số được lượng hoá có thể được xử lý hay chuyển qua b ước biến đ ổi s ố tương tự - DA(Digital to Analog) để tái hiện trên thiết bị hiện ảnh. 2.2.1 Quét ảnh (Image scanning) Phương pháp chung để lấy mẫu là quét ảnh theo hàng và mã hoá t ừng hàng. Về nguyên tắc, một đối tượng, phim hay giấy trong suốt sẽ đ ược chiếu sáng liên t ục để tạo nên một ảnh điện tử trên tấm cảm quang. Tuỳ theo các lo ại camera mà t ấm cảm quang này là chất quang dẫn hay quang truyền. Hệ thống camera ống s ử dụng phương pháp scan-out-digitalizer; còn hệ thống camera CCD(Charge Coup;ed Device) cho ảnh ma trận. Hiện f(x,y) Lấy Mẫu  f i(x,y) Lượng u(m,n) Máy u(m,n) Biến ảnh vào hoá tính đổi D->A Hình 2.4. Lấy mẫu và lượng hoá Camera CCD thực sự là thiết bị mẫu hoá tín hiệu 2 chiều và g ọi là ph ương pháp sefl- scanning matrix. Nguyên tắc của 2 phương pháp được minh hoạ qua hình 2-6 trang bên.  Lý thuyết mẫu hoá 2 chiều - Ảnh với dải giới hạn (Band limited Images) Một hàm f(x,y) gọi là dải giới hạn nếu khai triển Fourier F( ξ1, ξ2) của nó là 0 bên ngoài miền bao (hình 2.5). F(ξ1, ξ2) = 0 với ξ1 > ξx0 , ξ2 > ξy0 (2.2) Với ξx0 và ξy0 là dải giới hạn theo x và y của ảnh. Quá trình số hoá ảnh có thể hiểu như mô hình tín hiệu dải gi ới hạn. Một ảnh dải giới hạn f(x,y) thoả mãn phương trình 2.2 và đ ược lấy mẫu đ ều trên một l ưới hình chữ nhật với bước nhảy ∆x, ∆y có thể khôi phục lại không có sai sót dựa trên Nhập môn xử lý ảnh số - ĐHBK Hà nội 16 Chương Hai: THU NHẬN ẢNH các giá trị mẫu f(m ∆x,n∆y). Theo lý thuyết lấy mẫu trong xử tín hiệu, nếu tần số lấy mẫu theo x, y lớn hơn 2 lần dải giới hạn ξx0, ξy0 hay tương đương với: 1 1 = ξxs > 2 ξx 0, = ξys > 2 ξy0 ∆x ∆y thì có thể khôi phục được. Tỉ số này do Nyquist đề xuất và mang tên tỉ s ố Nyquist. F(ξ1, ξ2) ξ2 ξ20 - ξ10 ξ10 ξ1 ξx0 ξ1 -- ξy0 -ξy0 ξ2 Hình 2.5. Khai triển Fourier của hàm dải giới hạn. Nhập môn xử lý ảnh số - ĐHBK Hà nội 17 Chương Hai: THU NHẬN ẢNH camera Chiếu sáng (illumination) object/phim (đối tượng chiếu sáng) đích a) Phương pháp số hoá Scan-out ∆ Bộ Chuy ển Mạch Bộ điều khiển Lượng hoá) (Switch ∆ &logic u(m,n) control) b) Phương pháp Self-scanning array Hình 2.6. Phương pháp lấy mẫu & l ượng hoá ảnh Hơn nữa, việc khôi phục lại ảnh có thể nội suy theo công thức: ∞ sin( xξxs − x) π sin( yξys − n) π f(x,y) = ∑ m, n =−∞ f ( mx, ny)( ( xξxs − m) π ) )( ( yξys − m) π ) (2.3) Trong thực tế, nhiễu ngẫu nhiên luôn có mặt trong tín hiệu ảnh. Do đó, lý thuyết lấy mẫu ở trên phải được mở rộng với một số kỹ thuật khác như: lưới không vuông, lưới bát giác. Để đơn giản khi trình bày, những kỹ thuật này không nêu ở đây. Độc giả có quan tâm xin tham khảo tài liệu[1]. Nhập môn xử lý ảnh số - ĐHBK Hà nội 18 Chương Hai: THU NHẬN ẢNH 2.2.2 Lượng hoá ảnh (Image Quantization) 2.2.2.1 Khái niệm và nguyên tắc lượng hoá ảnh Lượng hoá ảnh là bước kế tiếp của việc lấymẫu, nhằm thực hiện một ánh xạ từ một biến liên tục u sang một biến rời r ạc u* với các giá tr ị thu ộc t ập h ữu h ạn {r1, r2, . . ., rL}. Ánh xạ này thường là một hàm bậc thang (hình 2.7) tuân theo nguyên tắc sau: Cho {tk, k=1, 2, . . . L+1} là một tập các bước d ịch chuy ển hay m ức đ ộ quy ết đ ịnh; t 1 là giá trị nhỏ nhất và tL+1 là giá trị lớn nhất của u. Cách đơn giản nhất là dùng lượng hoá đều. Theo phương pháp này, gi ả s ử đẩu ra của một bộ cảm biến ảnh nhận giá trị từ 0 đến 10.0. Nếu mẫu là l ượng hoá đều trên 256 mức, thì bước dịch chuyển tk và mức xây dựng lại rk được tính bởi: 10( k − 1) 5 tk = với k =1, 2,...,257; rk = tk - với k =1, 2,..., 256 256 256 Đại lượng q = t k - tk-1 = rk - rk-1 là hằng số với các giá trị k và gọi là khoảng lượng hoá. Trong phần này, ta chỉ xem xét các bộ lượng hoá không bộ nh ớ (zero memory quantizer), có nghĩa là đầu ra chỉ phụ thuộc duy nhất là đ ầu vào. Các b ộ l ượng hoá kiểu này rất có ích trong kỹ thuật mã hoá ảnh như mã hoá điều xung PCM (Pulse Code Modulation), PCM vi phân, chuyển mã, v...v. Chú ý r ằng, ánh xạ l ượng hoá này không thuận nghịch, nghĩa là với một đầu ra đã cho, đ ầu vào là không duy nh ất. Vì v ậy, ng ười ta đã nghiên cứu bổ xung nhiều kỹ thuật khác nhau để cực tiểu hoá biến dạng, tăng hiệu quả. Một kỹ thuật phổ dụng là trung bình bình phương cực tiểu (do Lloyd-max đề xuất) chúng ta sẽ mô tả dưới đây. Nhập môn xử lý ảnh số - ĐHBK Hà nội 19 Chương Hai: THU NHẬN ẢNH u* u Bộ u* đ ầu ra lượng hoá u lỗi lượng hoá Hình 2.7. Mô hình bộ lượng hoá. 2.2.2.2 Kỹ thuật lượng hoá trung bình bình phương cực ti ểu Kỹ thuật này nhằm cực tiểu hoá sai số trung bình bình phương đối v ới một s ố mức lượng hoá đã cho. Cho u là một biến thực ngẫu nhiên v ới hàm mật đ ộ liên t ục Pu(u). Mong muốn ở đây là tìm được mức độ quyết định t k và mức khôi phục lại r k với một bộ lượng hoá L mức sao cho sai số trung bình bình phương là nh ỏ nh ất. tL − 1 ∫ 2 Gọi ε = E[(u - u*) ] = ( u − u*) Pu( u)du 2 (2.4) t1 Nhiệm vụ là tìm min của ε. Viết lại (2.4) ta có: L ti + 1 ε= ∑ ∫ ( u − ri ) 2 Pu( u)du i=0, 1,. . ., L-1 (2.5) i =1 t1 Để tính rk, ta cần giải hệ phương trình (nhận được khi lấy vi phân 2.5): (tk -rk-1)2Pu(tk) - (tk - rk) 2Pu(tk) = 0 Nhập môn xử lý ảnh số - ĐHBK Hà nội 20 Chương Hai: THU NHẬN ẢNH tk +1 2 ∫ tk (u - rk)Pu(u)du =0 Lưu ý rằng tk ≥ tk-1, do đó giá trị của tk và rk cho bởi: tk = (rk - rk-1)/2 k = 1, 2, . . . L (2.6) tk + 1 tk ∫ upu( u)du và rk = tk +1 k = 0, 1, . . ., L-1 (2.7) tk ∫ pu( u)du Thông thường hệ phương trình (2.6), (2.7) là không tuyến tính. Kết quả trên chứng tỏ rằng mức dịch chuyển tối ưu nằm trên nửa đ ường c ủa các mức xkhôi phục lại. Các mức khôi phục lại tối ưu nằm t ại trọng tâm c ủa phân bố mật độ giữa các mức dịch chuyển. Giải hệ phương trình (2.6) & (2.7) ta thu đ ược các c ận t1 và tL+1. Trong thực tế, người ta hay áp dụng phương pháp Newton để giải phương trình trên. Khi s ố mức lượng hoá lớn, người ta dùng phương pháp xấp xỉ mật độ xác suất như một hàm h ằng khôn ngoan (picewise) pu(u) = pu(vi) với vi = (ti + ti+1); ti = u < ti+1. Thay giá trị mới của pu(u) vào 2.5 và tính cực tiểu hoá, ta có lời giải xấp xỉ cho mức quy ết đ ịnh t i+1[1]: tk + 1 A ∫ t1 [ pu( u)] −1/ 3 du ti+1 = ti +1 − t1 (2.8) ∫ [ p ( u)] ti u −1/ 3 du với A = tL+1 - t1 và rk = (k/L)A, k=1,2,...,L. Từ đó ta dễ dàng tính đ ược giá tr ị c ủa sai s ố e. (*) Các hàm mật độ thường dùng là hàm Gauss và hàm Laplace. Hàm Gauss có dạng: Nhập môn xử lý ảnh số - ĐHBK Hà nội 21 Chương Hai: THU NHẬN ẢNH 1 − ( u − µ) 2 Pu(u) = exp( ) (2.9) 2 πσ 2 2σ 2 Hàm Laplace có dạng: Pu(u) = a/2 * exp(-a³u-µ³) (2.10) trong đó: - µ là kỳ vọng toán học - s2 là hiệp biến với biến ngẫu nhiên u đối với hàm Gauss. Hiệp biến Laplace được tính bởi s2 =2/a. Trường hợp đặc biệt, nếu phân bố là đều thì hệ phương trình (2.6) & (2.7) là tuyến tính và sẽ cho ta các khoảng đều nhau giữa các mức dịch chuyển và mức khôi phục l ại. Do vậy, phép lượng hoá này có tên là lượng hoá tuyến tính. Giả sử hàm mật độ cho bởi công thức: 1/(t L+1 - t1) nếu ti = u = ti+1 p u(u) = 0 khác đi Từ phương trình (2.7) ta có: t 2 k + 1 − t 2 k ) tk + 1 − tk rk = = (2.11) 2 ( tk + 1 − tk ) 2 do đó tk = (tk+1 - tk)/2 ⇒ tk = tk-1 = tk+1 - tk = const = q. Cuối cùng ta có q = (tL+1 -t1)/L; tk = tk-1 + q; rk = tk - q/2 (2.12) Như vậy, mọi mức dịch chuyển và mức khôi phục lại đều cách đều. Sai s ố c ủa phép lượng hoá là u - u* sẽ phân phối đều trên kho ảng (-q/2 , q/2). Sai s ố trung bình bình phương sẽ là: q /2 1 q2 ∫ u du = 12 2 e = (2.13)* q −q /2 Lượng hoá đều như trên khá thuận tiện cho cài đặt. Tuy nhiên, trong thực t ế ta còn gặp nhiều loại phân bố không đều của các biến ngẫu nhiên. Độc gi ả quan tâm đ ến các biến đổi này cũng như so sánh kết quả giữa một số phương pháp xin tham kh ảo tài liệu [1]. 2.3 MỘT SỐ PHƯƠNG PHÁP BIỂU DIỄN ẢNH (IMAGE REPRESENTATION) Nhập môn xử lý ảnh số - ĐHBK Hà nội 22 Chương Hai: THU NHẬN ẢNH Sau bước số hoá, ảnh sẽ được lưu trữ hay chuyển sang giai đoạn phân tích. Trước khi đề cập đến vấn đề lưu trữ ảnh, ta cần xem xét ảnh sẽ được bi ểu di ễn ra sao trong bộ nhớ máy tính. Phần trên cũng đã nói đến các mô hình toán học đ ể bi ểu di ễn ảnh. Nếu lưu trữ trực tiếp ảnh thô theo kiểu bản đồ ảnh, dung lượng sẽ khá l ớn, t ốn kém mà nhiều khi không hiệu quả theo quan điểm ứng dụng. Thường người ta không bi ểu diễn toàn bộ ảnh thô mà tập trung đặc tả các đặc trưng của ảnh như: biên ảnh (Boundary) hay các vùng ảnh (Region). Các kỹ thuật phát hiện biên hay phân vùng ảnh sẽ được giới thiệu kỹ trong chương 5 và 6. Dưới đây giới thiệu một s ố ph ương pháp biểu diễn. Thường người ta dùng: - Biểu diễn mã loạt dài (Run - Length Code). - Biểu diễn mã xích (Chaine Code). - Biểu diễn mã tứ phân (Quad Tree Code). Ngoài ra cũng dùng mô hình thống kê . 2.3.1 Mã loạt dài Phương pháp này hay dùng biểu diễn cho vùng ảnh hay ảnh nhị phân. Một vùng ảnh R có thể biểu diễn đơn giản nhờ một ma trận nhị phân: u(m,n) = 1 n ếu (m,n) ∈ R 0 n ếu không Với cách biểu diễn trên, một vùng ảnh hay ảnh nhị phân đ ược xem như g ồm các chuỗi 0 hay 1 đan xen. Các chuỗi này gọi là một mạch (run). Theo ph ương pháp này, mỗi mạch sẽ được biểu diễn bởi địa chỉ bắt đầu của mạch và chiều dài mạch theo dạng: (, chiều dài). 0 1 2 3 4 0 ảnh đ ược bi ểu di ễn 1 (1,1) 1, (1,3) 2 2 (2,0) 4, (3,1) 2 Nhập môn xử lý ảnh số - ĐHBK Hà nội 23 Chương Hai: THU NHẬN ẢNH Hình 2.8 . Ảnh nhị phân và các biểu diễn mã loạt dài tương ứng. Nhiều dạng biến thể khác nhau khác nhau của phương pháp này sẽ đề c ập chi tiết trong Chương 8 (8.2.1). 2.3.2 Mã xích Mã xích thường được dùng để biểu diễn biên của ảnh. Thay vì l ưu trữ toàn b ộ ảnh, người ta lưu trữ dãy các điểm ảnh như A, B,..., M (hình 2.9). Theo ph ương pháp này, 8 hướng của véctơ nối 2 điểm biên liên tục đ ược mã hoá. Khi đó ảnh đ ược bi ểu diễn qua điểm ảnh bắt đầu A cùng với chuỗi các từ mã. Điều này đ ược minh ho ạ trong hình 2-9 dưới đây. Một biến thể của phương pháp này là tăng số hướng. Với biên cũng còn nhiều phương pháp khác (Chương 5). 2 A 7 3 1 M 1 B 6 0 1 E 0 F 2 J C D G 4 0 K 4J2 5 3 I 4 H 5 6 7 Hình 2-9. H ướng các đi ểm biên và mã t ương ứng. A 111 110 000 001 000 110 101 110 101 010 100 010 2.3.3 Mã tứ phân Theo phương pháp mã tứ phân, một vùng của coi như bao kín bởi một một hình chữ nhật. Vùng này được chia làm 4 vùng con (quadrant). Nếu một vùng con g ồm toàn điểm đen (1) hay toàn điểm trắng(0) thì không c ần chia tiếp. Trong tr ường h ợp ngược lại, vùng con gồm cả đen và trắng gọi là vùng xám l ại tiếp t ục đ ược chia làm 4 Nhập môn xử lý ảnh số - ĐHBK Hà nội 24 Chương Hai: THU NHẬN ẢNH vùng con tiếp. Quá trình chia dừng lại khi không thể chia tiếp đ ược nữa, có nghĩa là vùng con chỉ chứa thuần nhất điểm đen hay trắng. Như vậy, cây bi ểu diễn gồm một chuỗi các ký hiệu b(black), w (white) và g(grey) kèm theo ký hi ệu mã hoá 4 vùng con. Biểu diễn theo phương pháp này ưu việt hơn so với các phương pháp trên, nh ất là so với mã loạt dài. Tuy nhiên, để tính toán số đo các hình như chu vi, mô men là khá khó. 2.4 CÁC ĐỊNH DẠNG ẢNH CƠ BẢN TRONG XỬ LÝ ẢNH Ảnh thu được sau quá trình số hoá có nhiều loại khác nhau, phụ thuộc vào k ỹ thuật số hoá ảnh. Như đã nói ở phần trên , ta chia làm 2 lo ại: ảnh đen tr ắng và ảnh màu. Ảnh thu nhận được có thể lưu trữ trên tệp để phục vụ cho các b ước xử lý ti ếp theo. Dưới đây sẽ trình bày một số định dạng ảnh thông dụng hay dùng trong quá trình xử lý ảnh hiện nay. 2.4.1 Định dạng ảnh IMG Ảnh IMG là ảnh đen trắng. Phần đầu của ảnh IMG có 16 bytes ch ứa các thông tin cần thiết : + 6 bytes đầu: dùng để đánh dấu định dạng ảnh IMG. Giá trị c ủa 6 bytes này viết dưới dạng Hexa: 0x0001 0x0008 0x0001. + 2 bytes tiếp theo: chứa độ dài mẫu tin. Đó là đ ộ dài c ủa dãy các bytes k ề liền nhau mà dãy này sẽ được lặp lại một số lần nào đó. S ố lần l ặp này s ẽ đ ược l ưu trong byte đếm. Nhiều dãy giống nhau được lưu trong một byte. Đó là cách l ưu tr ữ nén sẽ được đề cập chi tiết trong chương 8. + 4 bytes tiếp: mô tả kích cỡ pixel + 2 bytes tiếp : số pixel trên một dòng ảnh + 2 bytes cuối: số dòng ảnh trong ảnh. Ảnh IMG được nén theo từng dòng. Mỗi dòng bao gồm các gói(pack). Các dòng giống nhau cũng được nén thành một gói. Có 4 loại gói sau:  Loại 1: Gói các dòng giống nhau Quy cách gói tin này như sau: 0x00 0x00 0xFF Count. Ba byte đ ầu cho bi ết s ố các dãy giống nhau; byte cuối cho biết số các dòng giống nhau. Nhập môn xử lý ảnh số - ĐHBK Hà nội 25 Chương Hai: THU NHẬN ẢNH  Loại 2: Gói các dãy giống nhau Quy cách gói tin này như sau: 0x00 Count. Byte thứ hai cho bi ết s ố các dãy giống nhau được nén trong gói. Độ dài của dãy ghi ở đầu tệp.  Loại 3 : Dãy các pixel không giống nhau, không lặp lại và không nén đ ược. Qui cách như sau: 0x80 Count. Byte thứ hai cho biết độ dài dãy các pixel không giống nhau không nén được.  Loại 4: Dãy các pixel giống nhau Tuỳ theo các bit cao của byte đầu đ ược bật hay t ắt. Nếu bit cao đ ược b ật (giá trị 1) thì đây là gói nén các bytes chỉ gồm bit 0, s ố các byte đ ược nén đ ược tính b ởi 7 bit thấp còn lại. Nếu bit cao tắt (giá trị 0) thì đây là gói nén các byte g ồm toàn bit 1. S ố các byte được nén được tính bởi 7 bit thấp còn lại. Các gói tin của file IMG phong phú như vậy là do ảnh IMG là ảnh đen tr ắng, do vậy chỉ cần 1 bit cho 1 pixel thay vì 4 hoặc 8 nh ư đã nói ở trên. Toàn b ộ ảnh ch ỉ có những điểm sáng và tối tương ứng với giá trị 1 hoặc giá trị 0. Tỷ lệ nén c ủa ki ểu đ ịnh dạng này là khá cao. 2.4.2 Định dạng ảnh PCX Định dạng ảnh PCX là một trong những định dạng ảnh cổ điển nhất. Nó s ử dụng phương pháp mã loạt dài RLE (Run-Length-Encoded) để nén dữ li ệu ảnh. Quá trình nén và giải nén được thực hiện trên từng dòng ảnh. Th ực t ế, ph ương pháp gi ải nén PCX kém hiệu quả hơn so với kiểu IMG. Tệp PCX g ồm 3 phần: đ ầu t ệp (header), dữ liệuảnh (image data) và bảng màu mở rộng(xem hình 2.10). Header của tệp PCX có kích thước cố định gồm 128 byte và đ ược phân b ố nh ư sau: + 1 byte : chỉ ra kiểu định dạng. Nếu là kiểu PCX/PCC nó luôn có giá tr ị là 0Ah. + 1 byte: chỉ ra version sử dụng để nén ảnh, có thể có các giá tr ị sau: - 0: version 2.5. - 2: version 2.8 với bảng màu. - 3: version 2.8 hay 3.0 không có bảng màu. Nhập môn xử lý ảnh số - ĐHBK Hà nội 26 Chương Hai: THU NHẬN ẢNH - 5: version 3.0 có bảng màu. + 1 byte: chỉ ra phương pháp mã hoá. Nếu là 0 thì mã hoá theo ph ương pháp BYTE PACKED, nếu không là phương pháp RLE. + 1 byte: số bit cho một điểm ảnh plane. + 1 word: toạ độ góc trái trên của ảnh. Với kiểu PCX nó có giá tr ị là (0,0); còn PCC thì khác (0,0). + 1 word: toạ độ góc phải dưới. + 1 word: kích thước bề rộng và bề cao ảnh. + 1 word: số điểm ảnh. + 1 word: độ phân giải màn hình. + 1 word. + 48 byte: chia thành 16 nhóm, mỗi nhóm 3 byte. Mỗi nhóm này ch ứa thông tin về một thanh ghi màu. Như vậy ta có 16 thanh ghi màu. + 1 byte: không dùng đến và luôn đặt là 0. +1 byte: số bit plane mà ảnh sử dụng. Với ảnh 16 màu, giá trị này là 4, v ới ảnh 256 màu (1 pixel/8 bit) thì số bit plane lại là 1. + 1 byte: số bytes cho một dòng quét ảnh. + 1 word: kiểu bảng màu. + 58 byte: không dùng. Tóm lại, định dạng ảnh PCX thường được dùng để lưu trữ ảnh vì thao tác đ ơn giản, cho phép nén và giải nén nhanh. Tuy nhiên vì c ấu trúc c ủa nó c ố đ ịnh, nên trong một số trường hợp nó làm tăng kích thước lưu trữ. Và cũng vì nh ược đi ểm này mà một số ứng dụng lại sử dụng một kiểu định dạng khác mềm dẻo hơn: định dạng TIFF (Targed Image File Format) sẽ mô tả dưới đây. 2.4.3 Định dạng ảnh TIFF Kiểu định dạng TIFF được thiết kế để làm nhẹ bớt các vấn đề liên quan đ ến việc mở rộng tệp ảnh cố định. Về cấu trúc, nó cũng gồm 3 phần chính: - Phần Header (IFH): có trong tất cả các tệp TIFF và gồm 8 byte: + 1 word: chỉ ra kiểu tạo tệp trên máy tính PC hay Macintosh. Hai lo ại này khác nhau rất lớn ở thứ tự các byte lưu trữ trong các số dài 2 hay 4 byte. N ếu Nhập môn xử lý ảnh số - ĐHBK Hà nội 27 Chương Hai: THU NHẬN ẢNH trường này có giá trị là 4D4Dh thì đó là ảnh cho máy Macintosh; nếu là 4949h là c ủa máy PC. + 1 word: version. Từ này luôn có giá trị là 42. Có thể coi đó là đ ặc trưng của file TIFF vì nó không thay đổi. Header 128 bytes Dữ liệu ảnh nén Bảng màu mở rộng Hình 2.10. Cấu trúc t ệp ảnh d ạng PCX. + 2 word: giá trị Offset theo byte tính t ừ đ ầu file t ới c ấu trúc IFD(Image File Directory) là cấu trúc thứ hai c ủa file. Th ứ t ự các byte ở đây ph ụ thuộc vào dấu hiệu trường đầu tiên. - Phần thứ 2 (IFD): Nó không ở ngay sau cấu trúc IFH mà vị trí c ủa nó đ ược xác định bởi trường Offset trong đầu tệp. Có thể có một hay nhi ều IFD cùng t ồn t ại trong file (nếu file có nhiều hơn 1 ảnh). Một IFD gồm: + 2 byte: chứa các DE (Directory Entry). + 12 byte là các DE xếp liên tiếp. Mỗi DE chi ếm 12 byte. + 4 byte : chứa Offset trỏ tới IFD tiếp theo. Nếu đây là IFD cu ối cùng thì trường này có giá trị là 0. - Cấu trúc phần dữ liệu thứ 3: các DE. Các DE có độ dài cố định gồm 12 byte và chia làm 4 ph ần: Nhập môn xử lý ảnh số - ĐHBK Hà nội 28 Chương Hai: THU NHẬN ẢNH + 2 byte: Chỉ ra dấu hiệu mà tệp ảnh đã được xây dựng. + 2 byte: kiểu dữ liệu của tham số ảnh. Có 5 kiểu tham s ố c ơ b ản: a) 1: BYTE (1 byte). b) 2: ASCII (1 byte). c) 3: SHORT (2 byte). d) 4: LONG (4 byte). e) 5: RATIONAL (8 byte). + 4 byte: trường độ dài (bộ đếm) chứa số lượng chỉ mục của kiểu dữ liệu đã chỉ ra . Nó không phải là tổng số byte c ần thiết đ ể lưu tr ữ. Đ ể có s ố li ệu này ta cần nhân số chỉ mục với kiểu dữ liệu đã dùng. + 4 byte: đó là Offset tới điểm bắt đầu dữ li ệu thực liên quan t ới dấu hiệu, tức là dữ liệu liên quan với DE không ph ải lưu tr ữ v ật lý cùng v ới nó nằm ở một vị trí nào đó trong file. Dữ liệu chứa trong tệp thường được tổ chức thành các nhóm dòng (c ột) quét của dữ liệu ảnh. Cách tổ chức này làm gi ảm bộ nh ớ c ần thi ết cho vi ệc đ ọc tệp. Việc giải nén được thực hiện theo bốn kiểu khác nhau được l ưu tr ữ trong byte dấu hiệu nén. Như đã nói ở trên, file ảnh TIFF là dùng để giải quyết vấn đ ề khó mở r ộng của file PCX. Tuy nhiên, với cùng một ảnh thì việc dùng file PCX chiếm ít không gian nhớ hơn. 2.4.4 Định dạng ảnh GIF(Graphics Interchanger Format) Cách lưu trữ kiểu PCX có lợi về không gian lưu trữ: với ảnh đen tr ắng kích thước tệp có thể nhỏ hơn bản gốc từ 5 đến7 lần. Với ảnh 16 màu, kích thước ảnh nhỏ hơn ảnh gốc 2-3 lần, có trường hợp có thể xấp xỉ ảnh gốc. Tuy nhiên, với ảnh 256 màu thì nó bộc lộ rõ khả năng nén rất kém. Điều này có thể lý gi ải nh ư sau: khi s ố màu tăng lên, các loạt dài xuất hiện ít hơn và vì thế, lưu tr ữ theo ki ểu PCX không còn lợi nữa. Hơn nữa, nếu ta muốn lưu trữ nhiều đ ối tượng trên một tệp ảnh nh ư kiểu định dạng TIFF, đòi hỏi có một định dạng khác thích hợp. Định dạng ảnh GIF do hãng ComputServer Incorporated (Mỹ) đ ề xu ất lần đ ầu tiên vào năm 1990. Với địng dạng GIF, những vướng mắc mà các đ ịnh d ạng khác gặp Nhập môn xử lý ảnh số - ĐHBK Hà nội 29
DMCA.com Protection Status Copyright by webtailieu.net