Top Ad unit 728 × 90

Latest news

recent

Standard Deviation (Độ lệch chuẩn)

Độ lệch chuẩn (Standard Deviation) là một khái niệm khá thông dụng trong quá trình khảo sát ảnh (Image Statistics). Một trong những tham số thống kê (statistical parameters) quan trọng được tính cùng với các giá trị trung bình (mean); phương sai (variance); giá trị và vị trí của pixel nhỏ nhất, lớn nhất; độ lệch (skewness), độ nhọn (kurtosis)...thông thường tính chung với histogram và cumulative histogram.

Phương pháp tính Standard Deviation từ một dãy n giá trị cho trước x1, x2,...xn:
  1. Tìm mean của dãy số đã cho (x1+x2+...+xn) / n
  2. với mỗi x trong dãy số đã cho, tính độ lệch (deviation) của nó so với mean bằng phép tính  (x - mean)
  3. Tính bình phương của các giá trị thu được ở bước 2.
  4. Tìm mean của các bình phương độ lệch tìm được ở bước 3. Giá trị này được biết đến như là phương sai (Variance) σ2.
  5. Tính căn bậc hai (square root) của phương sai (Variance) ta được kết quả cần tìm.
Chú ý giá trị trung bình (mean) có thể là trung bình số học (arithmetic mean) hoặc giá trị trung bình mang tính  xác suất (probability mean). Trong trường hợp ở trên chúng ta xét tới trung bình số học (arithmetic mean).

Sự khác nhau giữa histogram và cumulative histogram: trong khi histogram là mô hình thống kê số lần xuất hiện của các giá trị pixel trong hình khảo sát thì cumulative histogram cũng thực hiện công việc tương tự tuy nhiên có áp dụng thêm việc tính toán dồn giá trị thống kê được theo khoảng (ví dụ: lũy tiến tần số hay cộng dồn tần số của giá trị 4 sẻ là f(4) + f(3) + f(2) + f(1)...). Sau đây là một vài công thức mô hình các bước trên.


Công thức là như thế, còn ý nghĩa thực sự và ứng dụng của độ lệch chuẩn như thế nào? Đó có lẽ là điều mà hầu hết mọi người băng khoăn. Thực ra độ lệch chuẩn là một giá trị thể hiện mức độ hội tụ hay sức phân tán (Spread) của một tập dữ liệu. Nếu một tập dữ liệu có độ lệch chuẩn nhỏ điều đó chứng tỏ các phần tử dữ liệu nhìn trên phương diện tổng quát có sự tương đồng cao, ngược lại thì dữ liệu có vùng phân tán lớn, rời rạc, rải rác trong không gian giá trị của chúng. Trong tiếng anh nó được định nghĩa bằng một câu rất xúc tích “The average distance from the mean of the data set to a point”. Hình bên dưới thể hiện 2 tập dữ liệu với cùng giá trị trung bình nhưng có 2 độ lệch chuẩn khác nhau sẽ minh họa cho ý trên.

Thêm một ví dụ ứng dụng thực hành khác sẽ cho bạn thấy rỏ ràng hơn vấn đề:
Trong bài toán xác định bóng ngoài (cast shadow: bóng nằm ngoài đối tượng) của một đối tượng đang đi chuyển. Một trong những quy tắc người ta dựa vào đó là "tại vùng cast shadow, giá trị tỉ lệ giữa điểm ảnh của khung ảnh hiện hành (current frame) trong video với điểm ảnh tương ứng trên hình nền (background), của những điểm ảnh trong vùng  lân cận với điểm đang xét có độ tương tự cao". Trong trường hợp này, nếu bạn xét vùng cục bộ (local region) là cửa sổ 3x3 thì ứng với mỗi điểm ảnh đang xét bạn sẽ có tập hợp dữ liệu 9 phần tử tỉ lệ, từ đó để kiểm tra mức độ tương tự bạn chỉ cần tính độ lệch chuẩn của chúng. Từ độ lệch chuẩn đã có bạn so sánh với một giá trị ngưỡng (Threshold) để xác định điểm ảnh hiện đang xét có phải là bóng hay không. Đây chỉ là một ví dụ đơn giản để chỉ ra tại sao người ta cần độ lệch chuẩn. Chi tiết về các phương thức xác định bóng sẽ được trình bày rỏ hơn trong một chuyên đề sắp tới.


Binh Nguyen - Bioz
Standard Deviation (Độ lệch chuẩn) Reviewed by Bioz on 9:41:00 AM Rating: 5
All Rights Reserved by IEEV © 2009 - 2016
Powered By Blogger, Designed by Sweetheme

Contact Form

Name

Email *

Message *

Powered by Blogger.