Môi trường [ Đăng ngày (02/03/2025) ]
Dự báo năng lượng gió hướng tới phát triển bền vững
Biến đổi khí hậu trong những năm qua đã tạo ra những tác động ngày càng nghiêm trọng, đặc biệt qua các hiện tượng thời tiết cực đoan và tình trạng nước biển dâng, ảnh hưởng trực tiếp đến an ninh lương thực, an ninh nguồn nước, và sự phát triển bền vững. Hội nghị COP 26 nhấn mạnh rằng thế giới cần tiếp tục duy trì mục tiêu giữ mức tăng nhiệt độ trung bình toàn cầu dưới 1,50C so với thời kỳ tiền công nghiệp. Năng lượng tái tạo, đặc biệt là năng lượng gió, đóng vai trò then chốt trong việc giảm phụ thuộc vào nhiên liệu hóa thạch và giảm phát thải khí nhà kính, từ đó góp phần vào phát triển kinh tế bền vững và bảo vệ môi trường.

Trong những năm gần đây, năng lượng gió đã trở thành một trong những ngành năng lượng phát triển nhanh nhất thế giới do sở hữu nhiều ưu điểm, chẳng hạn như khả năng tái tạo, tiết kiệm chi phí, yêu cầu bảo trì thấp và chiếm tương đối ít không gian. Tuy nhiên, một trong những thách thức lớn nhất của năng lượng gió là dự báo chính xác sản lượng, vốn phụ thuộc vào điều kiện khí hậu và các yếu tố theo mùa. Sự bất ổn này làm giảm độ chính xác và độ tin cậy của các phương pháp dự báo, ảnh hưởng trực tiếp đến việc hoạch định và đầu tư vào năng lượng tái tạo.

Việc nghiên cứu và phát triển các phương pháp dự báo năng lượng gió có độ chính xác và tin cậy cao không chỉ góp phần tối ưu hóa tích hợp năng lượng gió vào lưới điện mà còn là yếu tố quan trọng trong việc giảm rủi ro tài chính và môi trường. Đặc biệt trong bối cảnh các tiêu chuẩn phát triển bền vững đang trở thành thước đo quan trọng đối với các nhà đầu tư, việc cải thiện khả năng dự báo sẽ hỗ trợ các doanh nghiệp tuân thủ yêu cầu về môi trường, nâng cao hiệu quả tài chính và giảm thiểu rủi ro phát sinh từ biến động khí hậu.

1. Nội dung nghiên cứu

1.1. Các mô hình dự báo

Trong các nghiên cứu dự báo năng lượng tái tạo nói chung và năng lượng gió nói riêng, các nhà nghiên cứu thường áp dụng ba mô hình chính: mô hình vật lý, mô hình thống kê và mô hình học máy.

1.1.1. Mô hình vật lý

Mô hình vật lý ước lượng tốc độ gió hoặc sản lượng điện trong tương lai dựa trên dữ liệu khí tượng và các yếu tố vật lý. Những dự đoán này được rút ra từ việc giải các phương trình toán học liên quan đến động lực học nhiệt và thủy động lực học. Các phương pháp này thường bao gồm việc phân tích dữ liệu lịch sử từ các trạm quan trắc khí tượng và sử dụng mô hình toán học để mô phỏng điều kiện gió trong tương lai. Tuy nhiên, mô hình vật lý gặp một số hạn chế trong việc nắm bắt các mối quan hệ phức tạp giữa các biến đầu vào và sản lượng điện, đặc biệt do tính không ổn định của nguồn gió.

1.1.2. Mô hình thống kê

Mô hình thống kê hồi quy được sử dụng để tìm ra mối quan hệ giữa các yếu tố đầu vào (như dữ liệu lịch sử về thời tiết) và kết quả đầu ra (dự báo sản lượng điện gió trong tương lai). Các mô hình này thường được áp dụng cho dự báo ngắn hạn, bao gồm phân tích chuỗi thời gian và bộ lọc Kalman. Phân tích chuỗi thời gian giúp phân tích và dự đoán các biến đổi theo thời gian, và nghiên cứu của Mahata về dữ liệu sản xuất điện và thời tiết dựa trên báo cáo từ Cơ quan Điện lực Trung ương (CEA), Ấn Độ đã chỉ ra rằng mô hình ARIMA (Autoregressive Integrated Moving Average - Tự hồi quy tích hợp trung bình trượt) hiệu quả hơn các mô hình tiên tiến khác trong việc dự báo dữ liệu phi tuyến tính.

Bộ lọc Kalman, một kỹ thuật dùng để ước lượng trạng thái của hệ thống động theo thời gian, đặc biệt hữu ích khi dữ liệu bị nhiễu, giúp tăng cường độ tin cậy của các dự báo.

2.1.3. Mô hình máy học

Trong những năm gần đây, các kỹ thuật dự báo dựa trên máy học đã đạt được những bước tiến lớn nhờ khả năng tự động học từ các mẫu dữ liệu phức tạp. Những phương pháp này ngày càng được coi là công cụ tin cậy và chính xác trong việc dự đoán sản lượng năng lượng gió. Một ví dụ điển hình là nghiên cứu của Pathak, tiến hành phân tích toàn diện nhiều mô hình máy học như K-Nearest Neighbor, Random Forest, các biến thể của Gradient Boosting Machines, và Extreme Gradient Boosting Machine (XGBoost). Sử dụng dữ liệu từ cuộc thi dự báo năng lượng toàn cầu GEFCom2014, nghiên cứu này chỉ ra rằng mô hình hồi quy XGBoost đạt hiệu suất tốt nhất trong số các mô hình được thử nghiệm. Đồng thời, nghiên cứu cũng nhấn mạnh tầm quan trọng của việc tái sản xuất kết quả nghiên cứu thông qua việc cung cấp các siêu tham số tối ưu bằng cách điều chỉnh và tối ưu hóa mô hình một cách kỹ lưỡng.

Ngoài ra, các mô hình học sâu (deep learning) cũng đã được ứng dụng rộng rãi trong dự báo năng lượng gió. Đặc biệt, Taoussi đã nghiên cứu mô hình dự báo năng lượng gió tại Tiểu bang El-Oued, Algeria nhằm tối ưu hóa việc sử dụng điện gió ngoài lưới điện và giảm thiểu rủi ro xói mòn do gió. Nghiên cứu này tập trung vào dự báo tốc độ gió ngắn hạn bằng cách kết hợp các phương pháp thống kê như ARIMA theo mùa và các kỹ thuật học sâu như LSTM (Long Short-term Memory - Bộ nhớ dài-ngắn hạn). Kết quả cho thấy mô hình LSTM đạt hiệu suất vượt trội hơn trên tập dữ liệu đã sử dụng, chứng minh tiềm năng lớn của học sâu trong lĩnh vực này.

1.1.4. Mô hình học tập kết hợp

Các mô hình dựa trên học tập kết hợp là sự tích hợp của nhiều mô hình dự đoán khác nhau, thường kết hợp với các công nghệ hiện có để đạt hiệu suất cao hơn so với các mô hình truyền thống. Cụ thể, Lang đã đề xuất phương pháp dự báo năng lượng gió ngắn hạn bằng cách kết hợp mô hình MGM (Minimal Gated Memory) và chiến lược điều chỉnh độ rộng khoảng cách cải tiến (Improved Interval Width Adaptive Adjustment Strategy) để nâng cao độ chính xác trong dự báo ngắn hạn về sản lượng điện gió. Nhìn chung, các phương pháp dự báo năng lượng tái tạo, từ mô hình vật lý đến học máy và học sâu, đều có vai trò quan trọng trong việc hỗ trợ các quyết định tài chính bền vững. Bằng cách cải thiện độ chính xác trong dự báo, các nhà đầu tư và doanh nghiệp có thể giảm thiểu rủi ro tài chính liên quan đến sự biến động của năng lượng tái tạo, đồng thời đảm bảo rằng các hoạt động đầu tư góp phần phát triển kinh tế bền vững.

1.2. Các phương pháp dự báo

Dữ liệu năng lượng gió có tính phức tạp và biến động cao. Do đó, chúng tôi sử dụng các phương pháp khác nhau để khai thác các đặc điểm này:

(i) Phương pháp tuyến tính (Hồi quy tuyến tính): Giúp nhận biết xu hướng tuyến tính trong dữ liệu.

(ii) Phương pháp phi tuyến (K-nearest neighbors, Cây quyết định, Adaboost, Mạng nơ-ron): Các phương pháp này xử lý tốt các mối quan hệ phi tuyến tính và tương tác phức tạp trong dữ liệu, phù hợp với bản chất phi tuyến của năng lượng gió.

(iii) Phương pháp học tập kết hợp (ensemble learning) để kết hợp nhiều mô hình dự báo khác nhau và xây dựng một hệ thống trọng số nhằm tạo ra dự đoán chính xác nhất.

Việc lựa chọn các phương pháp dự báo khác nhau giúp chúng tôi đạt được mục tiêu tăng tính linh hoạt và chính xác vì mỗi phương pháp đều khai thác những khía cạnh khác nhau của dữ liệu, giúp giảm sai số và tối ưu hóa dự báo. Bên cạnh đó, chúng tôi có thể so sánh và lựa chọn mô hình phù hợp nhất cho bài toán dự báo cụ thể. Trong phần này, chúng tôi sẽ trình bày tóm tắt về từng thuật toán dự báo được sử dụng, cùng với các tiêu chí đánh giá hiệu suất của từng thuật toán và quy trình thử nghiệm.

1.2.1. Hồi quy tuyến tính

Hồi quy tuyến tính là một trong những mô hình đơn giản nhất, trong đó biến phụ thuộc được mô hình hóa như một tổ hợp tuyến tính của các biến dự báo. Các hệ số của mô hình được ước tính bằng cách tối thiểu hóa tổng bình phương phần dư, thông qua phương pháp bình phương tối thiểu.

1.2.2. Thuật toán K láng giềng gần nhất

Thuật toán K láng giềng gần nhất (K-nearest neighbors) hoạt động bằng cách xác định k điểm dữ liệu gần nhất với điểm cần dự đoán trong không gian dữ liệu. Dựa trên các giá trị của những điểm lân cận này, thuật toán tính toán giá trị dự đoán cho điểm cần dự báo bằng cách lấy trung bình hoặc kết hợp các giá trị của các điểm lân cận. Thuật toán này không xây dựng mô hình dựa trên hình học cụ thể, mà dựa vào sự tương đồng trực tiếp giữa các điểm dữ liệu.

1.2.3. Thuật toán cây quyết định (Decision tree)

Cây quyết định là một mô hình dự đoán phổ biến, trong đó mỗi nút của cây biểu thị một điều kiện dựa trên giá trị của các biến đầu vào. Dữ liệu được phân chia thành các nhánh theo các điều kiện này, dẫn đến các lá chứa giá trị dự đoán cuối cùng. Mô hình này đặc biệt hữu ích trong việc mô hình hóa các mối quan hệ phi tuyến giữa các biến đầu vào và đầu ra.

1.2.4. Thuật toán tăng cường thích ứng (AdaBoost)

AdaBoost là một thuật toán dựa trên phương pháp Boosting nhằm cải thiện hiệu suất của mô hình dự báo. Bằng cách kết hợp nhiều mô hình yếu, thường là các cây quyết định nhỏ, AdaBoost tạo ra một mô hình mạnh mẽ hơn, giúp nâng cao độ chính xác tổng thể của dự báo.

1.2.5. Mạng nơ-ron (Artificial Neural Network)

Mạng nơ-ron nhân tạo (ANN) hoạt động bằng cách kết hợp các biến dự báo (features) thành các tổ hợp tuyến tính, sau đó áp dụng một hàm phi tuyến để mô hình hóa biến phụ thuộc. Trong nghiên cứu này, chúng tôi sử dụng mạng nơ-ron truyền thẳng đa lớp (Multilayer Perceptron), một dạng phổ biến của mạng nơ-ron trong các bài toán dự báo.

1.2.6. Học tập siêu kết hợp (Super learners)

Thuật toán siêu học (Super Learners) sử dụng phương pháp học tập kết hợp (ensemble learning) để kết hợp nhiều mô hình dự báo khác nhau và xây dựng một hệ thống trọng số nhằm tạo ra dự đoán chính xác nhất. Mục tiêu của Super Learners là cung cấp các dự đoán tốt bằng hoặc tốt hơn bất kỳ mô hình đơn lẻ nào. Thuật toán này là một ứng dụng của kỹ thuật tổng quát hóa xếp chồng (stacking), hay còn gọi là pha trộn (blending), kết hợp với phương pháp kiểm định chéo k lần. Trong quy trình này, tất cả các mô hình đều sử dụng cùng một tập chia k lần của dữ liệu, và một siêu mô hình (meta-model) được huấn luyện dựa trên các dự đoán ngoài mẫu của các mô hình cơ bản. Quy trình của thuật toán siêu học có thể được tóm tắt như sau:

(i) Triển khai kiểm định chéo k-fold trên tập dữ liệu huấn luyện.

(ii) Chọn m mô hình cơ bản (base-models).

(iii) Đối với mỗi mô hình cơ bản: a. Đánh giá mô hình bằng kiểm định chéo k lần. b. Lưu trữ tất cả các dự đoán. c. Huấn luyện mô hình trên toàn bộ tập dữ liệu huấn luyện và lưu trữ.

(iv) Huấn luyện một siêu mô hình (meta-model) trên các dự đoán ngoài mẫu.

(v) Đánh giá hiệu suất của siêu mô hình meta-model.

1.3. Dữ liệu nghiên cứu

Nghiên cứu này sử dụng dữ liệu từ các tuabin gió ở Thổ Nhĩ Kỳ . Bộ dữ liệu được lấy từ Kaggle, bao gồm các tham số liên quan đến gió và sản xuất điện, chẳng hạn như tốc độ gió (m/s), hướng gió tại độ cao trục tuabin (°), công suất lý thuyết do nhà sản xuất tuabin chỉ định (kilowatt-giờ, kWh), và sản lượng điện thực tế theo thời gian (kilowatt, kW). Tổng cộng có 50.530 điểm dữ liệu được thu thập từ ngày 1/1 đến 31/12/2018.

Việc tiêu thụ và sản xuất năng lượng thường phụ thuộc đến các yếu tố thời gian, đặc biệt là theo quy mô hàng ngày và hàng tháng. Bằng cách trích xuất các đặc trưng có ý nghĩa từ dữ liệu ngày/giờ, chúng tôi có thể giúp mô hình máy học khai thác tốt hơn những yếu tố này. Ví dụ, 13 giờ ngày 21 tháng 2 thì có tạo thành 3 đặc trưng lần lượt như giờ (13) ngày (21) và tháng (2).

Để làm sạch dữ liệu, chúng tôi áp dụng phương pháp khoảng tứ phân vị (Interquartile Range, IQR), một kỹ thuật thống kê phổ biến dùng để phát hiện và loại bỏ các giá trị ngoại lai. Cụ thể, các giá trị ngoại lại là các giá trị quan sát nằm dưới ngưỡng (Q1 − 1.5 IQR) hoặc trên ngưỡng (Q3 + 1.5 IQR). Trong đó, Q1 và Q3 lần lượt là tứ phân vị thứ nhất và thứ ba, và IQR = Q3 − Q1. Phương pháp này được áp dụng cho tất cả các biến sử dụng.

Sau khi dữ liệu được làm sạch, chúng tôi phân chia bộ dữ liệu thành hai tập con: tập huấn luyện (80%) và tập kiểm tra (20%) theo phương pháp ngẫu nhiên (random split). Chia ngẫu nhiên giúp đảm bảo rằng cả hai tập huấn luyện và tập kiểm tra đều có tính đại diện cao cho toàn bộ dữ liệu. Điều này giúp mô hình học được các đặc điểm chung mà không bị thiên lệch bởi các yếu tố thời gian cụ thể. Đây là cách phân chia tiêu chuẩn thường được sử dụng trong các nghiên cứu học thuật để đánh giá hiệu suất của các thuật toán.

Trong nghiên cứu này, các mô hình đều sử dụng các biến đầu vào chính bao gồm: hướng gió tại độ cao trục tuabin (°), công suất lý thuyết, tốc độ gió, ngày, tháng, giờ. Đầu ra của tất cả các mô hình là công suất gió dự báo. Khi sử dụng đầy đủ các biến như hướng gió, tốc độ gió, và thời gian, mô hình có khả năng nắm bắt được mối quan hệ phức tạp giữa các yếu tố này, từ đó đưa ra dự báo chính xác hơn.

2. Kết luận

Trong bài báo này, chúng tôi đã tập trung vào các phương pháp dự đoán năng lượng gió bằng cách sử dụng các phương pháp dự báo khác nhau như thống kê truyền thống, học máy, học tập kết hợp. Chúng tôi hy vọng rằng kết quả của nghiên cứu sẽ đóng góp vào việc phát triển các mô hình dự đoán năng lượng gió đáng tin cậy và hiệu quả hơn trong tương lai. Các phương pháp dự báo không chỉ có giá trị trong lĩnh vực năng lượng mà còn đóng góp vào các mục tiêu phát triển bền vững toàn cầu.

Việc cải thiện độ chính xác không chỉ mang lại lợi ích kỹ thuật cho hệ thống điện mà còn tạo điều kiện thuận lợi cho các nhà đầu tư giảm thiểu rủi ro tài chính và môi trường. Các mô hình dự báo này đóng vai trò quan trọng trong việc thúc đẩy tài chính bền vững và phát triển năng lượng tái tạo, giúp doanh nghiệp và nhà đầu tư đạt được mục tiêu phát triển bền vững.

dtnkhanh
Theo Tạp chí Khoa học và Công nghệ - Đại học Đà Nẵng (tập 22, số 11A - 2024)
In bài viết  
Bookmark
Ý kiến của bạn




© Copyright 2020 Trung tâm Thông tin Khoa học và Công nghệ - Sở Khoa học & Công nghệ TP. Cần Thơ
Địa chỉ: 118/3 Trần Phú - Phường Cái Khế - Quận Ninh Kiều - thành phố Cần Thơ
Giấy phép số: 05/ GP-TTĐT, do Sở Thông tin và Truyền Thông thành phố Cần Thơ cấp ngày 23/5/2017
Trưởng Ban biên tập: Ông Vũ Minh Hải - Giám Đốc Trung tâm Thông tin Khoa học và Công nghệ - Sở Khoa học & Công nghệ TP. Cần Thơ
Ghi rõ nguồn www.trithuckhoahoc.vn khi bạn sử dụng lại thông tin từ website này
-->