Abstract:
|
- Trình bày tổng quan về kỹ thuật chống trùng lặp dữ liệu (Data Deduplication), tổng
quan về email và mỗi tương quan giữa email và Data Deduplication: Data Deduplication
là kỹ thuật mô tả chung về vấn đề loại bỏ các dữ liệu trùng lặp trong một tập các dữ liệu.
Trong khi đó, email là giải pháp thư điện tử đã trở nên phổ biến đối với người dùng
internet giúp thông tin trao đổi được nhanh chóng, chính xác. Vấn đề đặt ra là cần phải
có cơ chế loại bỏ dữ liệu trùng lặp trong hệ thống lưu trữ email.
- Trình bày các phương thức xử lý trùng lặp dữ liệu nói chung và đề xuất giải pháp cho
việc xử lý dữ liệu trùng lặp trong hệ thống email: Trong kỹ thuật chống trùng lặp dữ liệu
gồm nhiều yếu tố công nghệ khác nhau. Với mỗi ứng dụng cụ thể có thể có các kỹ thuật
khác nhau. Trong một hệ thống email, dữ liệu lưu trữ là các thông điệp thư điện tử. Do
đó, một giải pháp chống trùng lặp dữ liệu cần được đề xuất để phù hợp với dữ liệu lưu
trữ trong hệ thống email.- Luận văn đã lựa chọn một giải pháp email miễn phí là hMailServer để thực nghiệm.
Quá trình thực nghiệm đã tập trung vào việc tích hợp thêm tính năng loại bỏ dữ liệu
trùng lặp cho máy chủ hMailServer (tính năng này hiện chưa được tích hợp trong phiên
bản mới nhất của hMailServer). Sau khi tích hợp khả năng chống trùng lặp dữ liệu, Luận
văn đã tiến hành đánh giá và so sánh với hệ thống khi chưa được tích hợp khả năng
chống trùng lặp dữ liệu. |