Chương Một: NHẬP MÔN XỬ LÝ ẢNH
1
NHẬP MÔN XỬ LÝ ẢNH
INTRODUCTION TO DIGITAL
IMAGE PROCESSING
1.1 TỔNG QUAN VỀ MỘT HỆ THỐNG XỬ LÝ ẢNH
Xử lý ảnh là một khoa học còn tương đối mới mẻ so với
nhiều ngành khoa học khác, nhất là trên qui mô công nghiệp, song
trong xử lý ảnh đã bắt đầu xuất hiện những máy tính chuyên
dụng. Để có thể hình dung cấu hình một hệ thống xử lý ảnh
chuyên dụng hay một hệ thống xử lý ảnh dùng trong nghiên cứu,
đào tạo, trước hết chúng ta sẽ xem xét các bước cần thiết trong
xử lý ảnh.
Trước hết là quá trình thu nhận ảnh. Ảnh có thể thu nhận
qua camera. Thường ảnh thu nhận qua camera là tín hiệu tương
tự (loại camera ống kiểu CCIR), nhưng cũng có thể là tín hiệu
số hoá (loại CCD - Charge Coupled Device).
Lưu trữ
CAMERA
Thu
nhận
Phân tích
Số hoá ảnh Nhận
ảnh
dạng
Nhập môn xử lý ảnh số - ĐHBK Hà nội 1
Chương Một: NHẬP MÔN XỬ LÝ ẢNH
SENSOR
Lưu trữ Hệ
Q.Định
Hình 1.1.a. Các giai đoạn chính trong xử lý ảnh
Ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng
(sensor), hay ảnh,
tranh được quét trên scanner. Chi tiết về quá trình thu nhận ảnh
sẽ được mô tả trong chương 2. Tiếp theo là quá trình số hoá
(Digitalizer) để biến đổi tín hiệu tương tự sang tín hiệu rời rạc
(lấy mẫu) và số hoá bằng lượng hoá, trước khi chuyển sang giai
đoạn xử lý, phân tích hay lưu trữ lại.
Qúa trình phân tích ảnh thực chất bao gồm nhiều công
đoạn nhỏ. Trước hết là công việc tăng cường ảnh để nâng cao
chất lượng ảnh. Do những nguyên nhân khác nhau: có thể do
chất lượng thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu,
ảnh có thể bị suy biến. Do vậy cần phải tăng cường và khôi
Nhập môn xử lý ảnh số - ĐHBK Hà nội 2
Chương Một: NHẬP MÔN XỬ LÝ ẢNH
phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay
làm cho ảnh gần giống nhất với trạng thái gốc- trạng thái trước
khi ảnh bị biến dạng. Giai đoạn tiếp theo là phát hiện các đặc
tính như biên, phân vùng ảnh, trích chọn các đặc tính, v.v...
Cuối cùng, tuỳ theo mục đích của ứng dụng, sẽ là giai
đoạn nhận dạng, phân lớp hay các quyết định khác. Các giai
đoạn chính của quá trình xử lý ảnh có thể mô tả ở hình 1.1.a.
Với các giai đoạn trên, một hệ thống xử lý ảnh (cấu trúc
phần cứng theo chức năng) gồm các thành phần tối thiểu như
hình 1.1.b.
h Đối với một hệ thống xử lý ảnh thu nhận qua camera-camera
như là con mắt của hệ thống. Có 2 loại camera: camera ống
loại CCIR và camera CCD. Loại camera ứng với chuẩn CCIR
quét ảnh với tần số 1/25 và mỗi ảnh gồm 625 dòng. Loại
CCD gồm các photo điốt và làm tương ứng một cường độ
sáng tại một điểm ảnh ứng với một phần tử ảnh (pixel). Như
vậy, ảnh là tập hợp các điểm ảnh. Số pixel tạo nên một ảnh
gọi là độ phân giải (resolution).
ả Bộ xử lý tương tự (analog processor). Bộ phận này thực
hiện các chức năng sau:
Nhập môn xử lý ảnh số - ĐHBK Hà nội 3
Chương Một: NHẬP MÔN XỬ LÝ ẢNH
- Chọn camera thích hợp nếu hệ thống có nhiều camera.
- Chọn màn hình hiển thị tín hiệu
- Thu nhận tín hiệu video thu nhận bởi bộ số
hoá(digitalizer). Thực hiện lấy mẫu và mã hoá.
- Tiền xử lý ảnh khi thu nhận: dùng kỹ thuật bảng tra
(Look Up Table - LUT).
Nhập môn xử lý ảnh số - ĐHBK Hà nội 4
Chương Một: NHẬP MÔN XỬ LÝ ẢNH
màn hình
đồ hoạ
camera Bộ xử lý
Bộ nhớ ảnh
tương tự
Bộ nhớ Máy chủ
Bộ xử lý
ngoài
ảnh số
Màn hình Bàn phím
Máy in
Hình 1.1.b. Các thành phần chính của hệ thống xử lý ảnh
Nhập môn xử lý ảnh số - ĐHBK Hà nội 5
Chương Một: NHẬP MÔN XỬ LÝ ẢNH
Ả Bộ xử lý ảnh số. Gồm nhiều bộ xử lý chuyên dụng: xử lý
lọc, trích chọn đường bao, nhị phân hoá ảnh. Các bộ xử lý này
làm việc với tốc độ 1/25 giây.
ộ Máy chủ. Đóng vai trò điều khiển các thành phần miêu tả ở
trên.
t Bộ nhớ ngoài: Dữ liệu ảnh cũng như các kiểu dữ liệu khác,
để có thể chuyển giao cho các quá trình khác, nó cần được
lưu trữ. Để có một ước lượng, xét thí dụ sau: một ảnh đen
trắng cỡ 512 x 512 với 256 mức xám chiếm 256K bytes. Với
một ảnh màu cùng kích thước dung lượng sẽ tăng gấp 3 lần.
1.2 CÁC VẤN ĐỀ CƠ BẢN TRONG XỬ LÝ ẢNH
Như đã đề cập trong phần giới thiệu, chúng ta đã thấy
được một cách khái quát các vấn đề chính trong xử lý ảnh. Để
hiểu chi tiết hơn, trước tiên ta xem xét hai khái niệm (thuật ngữ)
thường dùng trong xử lý ảnh đó là Pixel (phần tử ảnh) và grey
level (mức xám), tiếp theo là tóm tắt các vấn đề chính.
1.2.1 Một số khái niệm
ệ Pixel (Picture Element): phần tử ảnh
Ảnh trong thực tế là một ảnh liên tục về không gian và về
giá trị độ sáng. Để có thể xử lý ảnh bằng máy tính cần thiết
Nhập môn xử lý ảnh số - ĐHBK Hà nội 6
Chương Một: NHẬP MÔN XỬ LÝ ẢNH
phải tiến hành số hoá ảnh. Trong quá trình số hoá , người ta biến
đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy
mẫu (rời rạc hóa về không gian) và lượng hoá thành phần giá trị
mà thể về nguyên tắc bằng mắt thường không phân biệt được
hai điểm kề nhau. Trong quá trình này, người ta sử dụng khái
niệm Picture element mà ta quen gọi hay viết là Pixel - phần tử
ảnh. Ở đây cũng cần phân biệt khái niệm pixel hay đề cập đến
trong các hệ thống đồ hoạ máy tính. Để tránh nhầm lẫn ta tạm
gọi khái niệm pixel này là pixel thiết bị. Khái niệm pixel thiết bị
có thể xem xét như sau: khi ta quan sát màn hình (trong chế độ đồ
hoạ), màn hình không liên tục mà gồm nhiều điểm nhỏ, gọi là
pixel. Mỗi pixel gồm một cặp toạ độ x, y và màu.
Nhập môn xử lý ảnh số - ĐHBK Hà nội 7
Chương Một: NHẬP MÔN XỬ LÝ ẢNH
a)Ảnh với độ phân giải 128 x128 b)Ảnh với độ
phân giải 64 x 64
Hình 1.2. Biểu diễn ảnh với độ phân giải
khác nhau.
Cặp toạ độ x, y tạo nên độ phân giải (resolution). Như
màn hình máy tính có nhiều loại với độ phân giải khác nhau: màn
hình CGA có độ phân giải là 320 x 200; màn hình VGA là 640 x
350,...
Như vậy, một ảnh là một tập hợp các điểm ảnh. Khi
được số hoá, nó thường được biểu diễn bởi bảng hai chiều
I(n,p): n dòng và p cột. Ta nói ảnh gồm n x p pixels. Người ta
thường kí hiệu I(x,y) để chỉ một pixel. Thường giá trị của n chọn
bằng p và bằng 256. Hình 1.2 cho ta thấy việc biểu diễn một
ảnh với độ phân giải khác nhau. Một pixel có thể lưu trữ trên 1,
4, 8 hay 24 bit.
4 Gray level: Mức xám
Nhập môn xử lý ảnh số - ĐHBK Hà nội 8
Chương Một: NHẬP MÔN XỬ LÝ ẢNH
Mức xám là kết quả sự mã hoá tương ứng một cường độ
sáng của mỗi điểm ảnh với một giá trị số - kết quả của quá
trình lượng hoá. Cách mã hoá kinh điển thường dùng 16, 32 hay
64 mức. Mã hoá 256 mức là phổ dụng nhất do lý do kỹ thuật. Vì
28 = 256 (0, 1, ..., 255), nên với 256 mức, mỗi pixel sẽ được mã
hoá bởi 8 bit.
1.2.2 Biểu diễn ảnh
Trong biểu diễn ảnh, người ta thường dùng các phần tử
đặc trưng của ảnh là pixel. Nhìn chung có thể xem một hàm hai
biến chứa các thông tin như biểu diễn của một ảnh. Các mô hình
biểu diễn ảnh cho ta một mô tả lô gic hay định lượng các tính
chất của hàm này. Trong biểu diễn ảnh cần chú ý đến tính trung
thực của ảnh hoặc các tiêu chuẩn “thông minh” để đo chất
lượng ảnh hoặc tính hiệu quả của các kỹ thuật xử lý.
Việc xử lý ảnh số yêu cầu ảnh phải được mẫu hoá và
lượng tử hoá. Thí dụ một ảnh ma trận 512 dòng gồm khoảng
512 x 512 pixel. Việc lượng tử hoá ảnh là chuyển đổi tín hiệu
tương tự sang tín hiệu số (Analog Digital Convert) của một ảnh
đã lấy mẫu sang một số hữu hạn mức xám. Vấn đề này sẽ trình
bày chi tiết trong chương 2.
Nhập môn xử lý ảnh số - ĐHBK Hà nội 9
Chương Một: NHẬP MÔN XỬ LÝ ẢNH
Một số mô hình thường được dùng trong biểu diễn ảnh:
Mô hình toán, mô hình thống kê. Trong mô hình toán, ảnh hai
chiều được biểu diễn nhờ các hàm hai biến trực giao gọi là các
hàm cơ sở. Các biến đổi này sẽ trình bày kỹ trong chương 3. Với
mô hình thống kê, một ảnh được coi như một phần tử của một
tập hợp đặc trưng bởi các đại lượng như: kỳ vọng toán học,
hiệp biến, phương sai, moment.
1.2.3 Tăng cường ảnh - khôi phục ảnh
Tăng cường ảnh là bước quan trọng, tạo tiền đề cho xử
lý ảnh. Nó gồm một loạt
các kỹ thuậy như: lọc độ tương phản, khử nhiễu, nổi màu, v...v.
f(a,ß) g(x,y)
nhi
h(x,y; α,β) ễu
ß ảnh đầu H ệ ống
th ảnh ß
Thu nhận
đầu
vào f(α,β) ra g(x,y)
Hình 1.3 Ảnh biến dạng do nhiễu
Nhập môn xử lý ảnh số - ĐHBK Hà nội 10
Chương Một: NHẬP MÔN XỬ LÝ ẢNH
Hình 1.3 ở trên cho ta thí dụ về sự biến dạng của ảnh do
nhiễu.
Khôi phục ảnh là nhằm loại bỏ các suy giảm (degradation)
trong ảnh. Với một hệ thống tuyến tính, ảnh của một đối tượng
có thể biểu diễn bởi:
+∞ +∞
g(x,y) = ∫ ∫ h( x, y; α , β ) f (α , β )dαd ( β + η( x, y))
−∞ −∞
Trong đó:
- η(x,y) là hàm biểu diễn nhiễu cộng.
- f(a,ß) là hàm biểu diễn đối tượng.
- g(x,y) là ảnh thu nhận.
- h((x,y; a,ß) là hàm tán xạ điểm (Point Spread
Function - PSF).
Một vấn đề khôi phục ảnh tiêu biểu là tìm một xấp xỉ của f(a,ß)
khi PSF của nó có thể đo lường hay quan sát được, ảnh mờ và
các tính chất sác xuất của quá trình nhiễu.
1.2.4 Biến đổi ảnh
Thuật ngữ biến đổi ảnh (Image Transform) thường dùng
để nói tới một lớp các ma trận đơn vị và các kỹ thuật dùng để
biến đổi ảnh. Cũng như các tín hiệu một chiều được biểu diễn
Nhập môn xử lý ảnh số - ĐHBK Hà nội 11
Chương Một: NHẬP MÔN XỬ LÝ ẢNH
bởi một chuỗi các hàm cơ sở, ảnh cũng có thể được biểu diễn
bởi một chuỗi rời rạc các ma trận cơ sở gọi là ảnh cơ sở.
Phương trình ảnh cơ sở có dạng:
A*k,l = ak al*T, với ak là cột thứ k của ma trận A. A là ma trận đơn
vị. Có nghĩa là A A*T = I. Các A*k,l định nghĩa ở trên với k,l = 0,1,
..., N-1 là ảnh cơ sở. Có nhiều loại biến đổi được dùng như :
- Biến đổi Fourier, Sin, Cosin, Hadamard,. . .
- Tích Kronecker (*)
- Biến đổi KL (Karhumen Loeve): biến đổi này có nguồn
gốc từ khai triển của các quá trình ngẫu nhiên gọi là phương
pháp trích chọn các thành phần chính.
Do phải xử lý nhiều thông tin, các phép toán nhân và cộng
trong khai triển là khá lớn. Do vậy, các biến đổi trên nhằm làm
giảm thứ nguyên của ảnh để việc xử lý ảnh được hiệu quả hơn.
Các biến đổi này sẽ được mô tả chi tiết trong chương 3.
(*) Trong xử lý ảnh, việc phân tích có thể được đơn giản hơn
khá nhiều do làm việc với ma trận khối goị là tích Kronecker.
ị Ma trận khối là ma trận mà các phần tử của nó lại là một
ma trận.
Nhập môn xử lý ảnh số - ĐHBK Hà nội 12
Chương Một: NHẬP MÔN XỬ LÝ ẢNH
A 11 A 12 ... A 1, n
...
... ... ...
m1
A Am 2 ... A m n
Ma trận A
với Ai,j là ma trận m x n; i = 1, 2,...,m và j = 1, 2, ..., n.
ậ Tích Kronecker
Cho A là ma trận kích thước M1 x M2 và B ma trận kích
thước N1 x N2.
Tích Kronecker của A và B ký hiệu là A⊗ B là ma trận
khối được định nghĩa:
a1,1B a1,2B . . . . A1,M2B
A⊗ B = .....................
aM1,1B aM1,2B . . . AM1,M2B
với a i,j là các phần tử của ma trận A.
Thí dụ ma trận A ma trận B
1 2 1 1
3 4 1 − 1
1 2 1 2
thì A⊗ B = 3 4 3 4
Nhập môn xử lý ảnh số - ĐHBK Hà nội 13
Chương Một: NHẬP MÔN XỬ LÝ ẢNH
1 2 -1 -2
3 4 -3 -4
1.2.5 Phân tích ảnh
Phân tích ảnh liên quan đến việc xác định các độ đo định
lượng của một ảnh để đưa ra một mô tả đầy đủ về ảnh. Các kỹ
thuật được sử dụng ở đây nhằm mục đích xác định biên của
ảnh. Có nhiều kỹ thuật khác nhau như lọc vi phân hay dò theo
quy hoạch động. Vấn đề xác định biên cùng các kỹ thuật liên
quan sẽ được trình bày trong chương 5.
Người ta cũng dùng các kỹ thuật để phân vùng ảnh. Từ
ảnh thu được, người ta tiến hành kỹ thuật tách (split) hay hợp
(fusion) dựa theo các tiêu chuẩn đánh giá như: màu sắc, cường
độ, v...v. Các phương pháp được biết đến như Quad-Tree, mảnh
hoá biên, nhị phân hoá đường biên. Cuối cùng, phải kể đến cac
kỹ thuật phân lớp dựa theo cấu trúc. Vấn đề này được trình bày
trong chương 6.
1.2.6 Nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối
tượng mà người ta muốn đặc tả nó. Quá trình nhận dạng
Nhập môn xử lý ảnh số - ĐHBK Hà nội 14
Chương Một: NHẬP MÔN XỬ LÝ ẢNH
thường đi sau quá trình trích chọn các đặc tính chủ yếu của đối
tượng. Có hai kiểu mô tả đối
tượng:
- Mô tả tham số (nhận dạng theo tham số).
- Mô tả theo cấu trúc ( nhận dạng theo cấu trúc).
Trên thực tế, người ta đã áp dụng kỹ thuật nhận dạng khá thành
công với nhiều đối tượng khác nhau như: nhận dạng ảnh vân
tay, nhận dạng chữ (chữ cái, chữ số, chữ có dấu).
Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự
động hoá quá trình đọc tài liệu, tăng nhanh tốc độ và chất lượng
thu nhận thông tin từ máy tính.
Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau
về cách viết, kiểu chữ, v...,v ) phục vụ cho nhiều lĩnh vực.
Ngoài 2 kỹ thuật nhận dạng trên, hiện nay một kỹ thuật
nhận dạng mới dựa vào kỹ thuật mạng nơ ron đang được áp
dụng và cho kết quả khả quan. Một số khái niệm về mạng nơ
ron cũng như một ứng dụng mạng nơ ron trong nhận dạng ký tự
sẽ được đề cập đến trong chương 7.
1.2.7. Nén ảnh
Dữ liệu ảnh cũng như các dữ liệu khác cần phải lưu trữ
hay truyền đi trên mạng. Như đã nói ở trên, lượng thông tin để
Nhập môn xử lý ảnh số - ĐHBK Hà nội 15
Chương Một: NHẬP MÔN XỬ LÝ ẢNH
biểu diễn cho một ảnh là rất lớn. Trong phần 1.1 chúng ta đã
thấy một ảnh đen trắng cỡ 512 x 512 với 256 mức xám chiếm
256K bytes. Do đó làm giảm lượng thông tin hay nén dữ liệu là
một nhu cầu cần thiết. Nhiều phương pháp nén dữ liệu đã được
nghiên cứu và áp dụng cho loại dữ liệu đặc biệt này. Các kĩ
thuật nén ảnh sẽ được trình bày trong chương 8.
Bài tập chương I
Để có ảnh cho các phần sau, hãy tạo một ảnh bằng một
số phần mềm có sẵn (mhư Paint Brusch) hoặc xây dựng một
ảnh gồm một số hình chữ nhật theo thuật toán sau:
. Mỗi hình chữ nhật cho các toạ độ góc trên, góc dưới
cũng như mức xám tương ứng (số mức xám hoặc nhập vào hay
reo ngẫu nhiên một số từ 0 đến 255). Dữ liệu nhập vào từ bàn
phím.
- Quá trình dừng khi cho mức xám là -1
- Lưu ảnh lên tệp để cho các xử lý tiếp sau.
Chương trình viết trong bằng ngôn ngữ tự chọn
Nhập môn xử lý ảnh số - ĐHBK Hà nội 16