dc.description.abstract |
Hiện nay, khối lượng thông tin được sinh ra trên mạng xã hội là vô cùng lớn. Các thông tin đó có thể tập trung cùng vào một chủ đề chẳng hạn như một vụ động đất hay một sự kiện thể thao, từ đó dẫn tới việc bùng nổ sự kiện. Bùng nổ sự kiện là một chủ đề thời sự cả về nghiên cứu và ứng dụng. Chủ đề này nhận được sự quan tâm của nhiều nhóm nghiên cứu trên thế giới như Jon Kleinberg và cộng sự, Theodoros Lappas và cộng sự, Jheser Guzman và cộng sự, Daehoon Kim và cộng sự. Phát hiện bùng nổ sự kiện không gian thời gian là một bài toán quan trọng trong khai phá dữ liệu với các ứng dụng có ý nghĩa như tìm kiếm tư liệu, lựa chọn tư liệu và phát hiện xu thế, hiện tượng. Dựa trên hai nghiên cứu là mô hình hai trạng thái của Kleinberg và cộng sự (2003) về từ khóa bùng nổ và công thức tính tỉ số bùng nổ của Daehoon Kim và cộng sự (2013), khóa luận đề xuất một mô hình để giải quyết bài toán phát hiện từ khóa bùng nổ trên mạng xã hội. Tiếp đó, khóa luận giới thiệu một chương trình cài đặt mô hình đã đề xuất ở trên. Khóa luận tiến hành thực nghiệm chương trình với đầu vào là 64 triệu bản ghi gồm nội dung của các bài đăng và các bình luận trên mạng xã hội facebook. Chương trình cho đầu ra là thông tin chi tiết về sự bùng nổ của các từ khóa bao gồm thời gian bùng nổ và tần suất. Khóa luận tiến hành thực nghiệm theo ba trường hợp với các tham số về khoảng thời gian bùng nổ và tỉ số bùng nổ khác nhau để so sánh. Kết quả cho thấy chương trình đã phát hiện được sự bùng nổ của một số từ khóa như “iphone 6s” với 9 lần bùng nổ trong ngày 30-09-2015, các kết quả thu được ở ba trường hợp thực nghiệm là khá tương đồng |
vi |