Tạp chí Khoa học & Công nghệ, S. 01 (2010)

Cỡ chữ:  Nhỏ  Vừa  Lớn

PHÂN TÍCH THÀNH PHẦN CHÍNH - PHƯƠNG PHÁP TRÍCH RÚT ĐẶC TRƯNG HỮU HIỆU TRONG KHÔNG GIAN CÓ SỐ CHIỀU LỚN

Nguyễn Phương Nga

Tóm tắt


Khi xử lý các bài toán trong thực tế ta thường gặp tập mẫu có số chiều mô tả lớn. Hơn nữa, trong tập mẫu có thể chứa các thuộc tính chứa ít thông tin hữu dụng, các thuộc tính tương tác lẫn nhau. Điều đó làm cho việc xử lý gặp rất nhiều khó khăn. Vấn đề đặt ra là phải trích rút được các đặc trưng từ  tập thuộc tính mô tả tập dữ liệu mẫu đó,  phục vụ cho việc phát hiện tri thức. Trong bài báo này chúng tôi chỉ ra rằng phân tích thành phần chính (PCA-Principal Component Analysis) là một phương pháp hiệu quả, thực hiện công việc này trong trường hợp không gian bài toán lớn. Kết quả thực nghiệm với bài toán dự báo hoạt tính  sinh học dựa trên tập mẫu PDGFR (platelet derived growth factor receptor) Inhibitors đã chứng tỏ hiệu quả của phương pháp.


Toàn văn: PDF

Tạp chí Khoa học & Công nghệ / Journal of Science and Technology. ISSN 1859-3585. 

Giấy phép xuất bản: 1608/GP-BTTTT ngày 13/11/2009