Chuỗi thời gian (CTG) là một kiểu dữ liệu mà giá trị của nó được lưu trữ theo thời gian như phút, giờ, ngày, tuần, tháng, năm, …Trong sự phát triển của nhiều các lĩnh vực, CTG thường được lưu trữ rất phổ biến, do đó nó được xem là loại dữ liệu quan trọng được rất nhiều nhà thống kê quan tâm (Cai, 2015; Phamtoan et al., 2022). Trong phân tích CTG, dự báo là một hướng nghiên cứu được xem là quan trọng nhất. Dự báo là nền tảng không thể thiếu cho các kế hoạch, chiến lược phát triển hợp lý của tất cả các lĩnh vực. Một dự báo đúng có thể mang lại nhiều lợi ích về nhiều mặt và một dự báo sai chắc chắn sẽ gây ra thiệt hại, đôi khi rất nghiêm trọng (Sulandari et al., 2020).
Để dự báo CTG, chúng ta thường sử dụng hai phương pháp chính: mô hình hồi quy và mô hình dành riêng cho kiểu dữ liệu này mà nó được gọi là mô hình CTG (Maia et al., 2008; Vovan, 2019). Để dự báo bằng mô hình hồi quy hiệu quả, chúng ta phải biết được khuynh hướng dạng đồ thị của nó. Thực tế chúng ta thường không có được điều này, nên kết quả dự báo bằng mô hình hồi quy không cao (Aabbasov & Mamedova, 2003). Để khắc phục điều này, mô hình CTG đã được đề xuất. Mô hình CTG được phát triển theo 2 hướng: mờ và không mờ. Mô hình không mờ cho CTG được ứng dụng rất phổ biến ngày nay với các mô hình như tự hồi quy, trung bình trượt, tự hồi quy trung bình trượt và tự hồi quy tích hợp trung bình trượt (ARIMA), trong đó ARIMA được áp dụng phổ biến nhất (Neto et al., 2008). Khi xây dựng mô hình CTG không mờ, chúng ta cũng phải giả sử những điều kiện như sai số là ổn trắng và chuỗi thời gian phải dừng (Vovan & Lethithu, 2022). Vì thực tế dữ liệu khó thoả điều kiện này nên hiệu quả dự báo của CTG không mờ không cao trong nhiều trường hợp. Khắc phục mô hình CTG không mờ, mô hình CTG mờ đã được đề xuất. Mô hình này xây dựng mối liên kết mờ giữa mỗi phần tử trong chuỗi và định lượng mối quan hệ mờ này để xây dựng nguyên tắc dự báo. Mô hình CTG mờ được đánh giá có nhiều ưu điểm hơn CTG không mờ vì không đòi những điều kiện của dữ liệu và không cần nhiều dữ liệu quá khứ (De et al., 2019; Pant & Kumar, 2022). Mô hình CTG mờ cũng được phát triển theo hai hướng (i) xây dựng mô hình dự báo trực tiếp cho tương lai và (ii) mờ hoá dữ liệu để tạo ra chuỗi mới có nhiều sự liên kết hơn, sau đó sử dụng các mô hình (i) để dự báo cho chuỗi mới được thiết lập. Theo hướng (i) không có nhiều mô hình được đề xuất. Những mô hình tiêu biểu theo hướng (i) được đề xuất bởi Abbasov and Mamedova (2003), Tinh (2020) và IFTS (Tai, 2019). Theo hướng (ii) có rất nhiều mô hình được đề xuất (Alyousifi et al., 2021; Pant & Kumar, 2022). Yếu điểm chung của các mô hình này chỉ mờ hoá số liệu quá khứ mà không dự báo được cho tương lai.
Tất cả các mô hình trên chỉ tập trung vào chuỗi thời gian điểm (PTS). Trong thực tế, chúng ta cũng lưu trữ nhiều dữ liệu bằng chuỗi thời gian khoảng (ITS), như các giá trị thấp nhất và cao nhất của nhiệt độ, độ ẩm, giá vàng, giá dầu và cổ phiếu trong mộtngày (Lethikim & Vovan, 2022). Khi chuỗi thời gian được ghi lại không chắc chắn về giá trị cụ thể của các điểm dữ liệu tại các thời điểm nhất định, việc sử dụng chuỗi khoảng là cần thiết để biểu diễn mức độ không chắc chắn này (Han et al., 2008; Phamtoan & Vovan, 2022). Do đó, trong một số trường hợp chuỗi thời gian khoảng thì cần thiết hơn chuỗi thời gian điểm. Từ phân tích trên, chúng ta thấy rằng thực tế đòi hỏi một mô hình dự báo cho ITS. Hướng nghiên cứu dự báo cho chuỗi thời gian khoảng hầu như chưa được quan tâm nhiều. Nghiên cứu này đề xuất mô hình dự báo cho chuỗi thời gian khoảng khi nó được tách thành hai chuỗi thời gian điểm và việc dự báo cho mỗi chuỗi điểm có sự cải tiến ở những giai đoạn quan trọng theo hướng mờ.
Qua quá trình nghiên cứu, có thể kết luận từ một chuỗi thời gian khoảng, nghiên cứu đã tách thành chuỗi thời gian tâm và chuỗi thời gian sai số. Do đó, việc dự báo cho chuỗi thời gian khoảng có thể được thực hiện thông qua hai chuỗi thời gian điểm. Với mỗi chuỗi thời gian điểm, nghiên cứu chọn tập nền là sự biến đổi phần trăm giữa hai giá trị liên tiếp. Tập nền này sau đó được chia thành các khoảng không bằng nhau với một số lượng thích hợp dựa vào mức độ biến đổi nhiều hay ít các phần tử trong chuỗi. Mỗi phần tử sau đó được thiết lập mối quan hệ mờ với khoảng được chia để từ đó xây dựng nguyên tắc dự báo. Kết hợp các vấn đề trên, một nguyên tắc dự báo cho chuỗi thời gian khoảng được đề nghị. Mô hình đề nghị đã được kiểm tra trên hai chuỗi thực tế: chỉ số VN30 và giá vàng SJC. Kết quả cho thấy mô hình đề nghị cho kết quả tốt hơn các mô hình phổ biến gần đây. |