Việt Nam là nước có đường bờ biển dài 3.650 km, đa dạng về các loài thủy sản. Sản lượng khai thác thủy sản lên tới 8,4 triệu tấn vào năm 2020, tăng trung bình khoảng 8% mỗi năm trong những năm gần đây. Bên cạnh việc đánh bắt thì sản lượng nuôi trồng cũng được mở rộng với tổng sản lượng là 4,6 triệu tấn (năm 2020).
Thị trường cá và các sản phẩm chế biến từ cá trên thế giới đang tăng trưởng liên tục. Chất lượng và độ an toàn của cá chủ yếu bị ảnh hưởng bởi quá trình bảo quản, thời gian và nhiệt độ bảo quản. Các sản phẩm từ cá có chứa hàm lượng chất béo cao nên rất dễ bị oxy hóa gây mùi ôi thiu ở ngay nhiệt độ môi trường. Sự thay đổi về màu sắc, cấu trúc, độ đàn hồi và các đặc tính sinh hóa của cá cũng là yếu tố quan trọng ảnh hưởng đến tâm lý người tiêu dùng và quyết định hành vi mua hàng tiếp theo của họ.
Quang phổ NIR (Near Infrared Reflectance) là một kỹ thuật phân tích với khả năng phân tích nhanh, dễ sử dụng và đặc biệt là không cần phá hủy mẫu cũng như công đoạn chuẩn bị mẫu không phức tạp như các phương pháp hóa học thông thường [3], được sử dụng phổ biến trong những năm gần đây đối với ngành công nghệ thực phẩm. Tín hiệu quang phổ thu được từ máy đo quang phổ NIR đã được áp dụng để đánh giá cấu trúc hóa học trên một số loại hoa quả tươi. NIR cũng đã được nghiên cứu để áp dụng xác định độ tươi của cá, thành phần chất béo trên cá đông lạnh, độ ẩm và hàm lượng protein của cá. Các nghiên cứu đã cho thấy nhiều ưu điểm khi sử dụng quang phổ NIR để phân tích và xây dựng các phương pháp đánh giá thuộc tính của các sản phẩm nông sản, thuỷ hải sản.
PCR (Principal Component Regression) và PLS (Partial Least Square) là những phương pháp được sử dụng khi xử lý các dữ liệu đa chiều. Hai phương pháp này đều thực hiện giảm chiều dữ liệu và diễn tả được các quan sát trong một không gian mới được gọi là không gian biến tiềm ẩn. Trong PCR, việc chuyển dữ liệu sang không gian mới được thực hiện bằng cách chỉ sử dụng thông tin của các đặc trưng như thông tin về độ hấp thụ của các bước sóng quang phổ. Bên cạnh đó, hồi quy PLS có thể kết hợp thông tin về đặc trưng và quan sát, nghĩa là cả độ hấp thụ của các bước sóng và nồng độ đo được của quan sát đó. Một số nghiên cứu đã chỉ ra rằng phân tích theo PLS có thể cho mô hình hồi quy với kết quả tốt hơn phương pháp PCR ở dữ liệu phổ.
Trong hồi quy OLS (Original Least Square), các giá trị ước lượng được tính theo phương pháp tối thiểu hoá tổng bình phương khoảng cách giữa giá trị ước lượng và giá trị thực tế của điểm dữ liệu. Do vậy, để mô hình hồi quy OLS đạt được kết quả tốt nhất thì cần đảm bảo được sự tuyến tính của các hệ số hồi quy, các yếu tố dự báo phải không liên quan đến phần dư, các phần dư phải có phương sai không thay đổi. Một số nghiên cứu cũng đã chỉ ra rằng phương pháp OLS có hiệu quả thấp hơn so với phương pháp PLS khi áp dụng với bộ dữ liệu có kích thước mẫu nhỏ và các biến đặc trưng có xảy ra sự đa cộng tuyến.
Mục tiêu của nghiên cứu này là áp dụng mô hình hồi quy đa biến để phân tích dữ liệu quang phổ NIR nhằm xác định nhanh hàm lượng chất béo trong cá. Các phương pháp tiền xử lý dữ liệu bao gồm: SNV (Standard Normal Variate), MSC (Multipicative Scatter Correction) và đạo hàm đã được dùng để hiệu chỉnh dữ liệu NIR đo trên các mẫu cá. Mô hình hồi quy PLS được áp dụng để xác định mối tương quan giữa hàm lượng chất béo và dữ liệu quang phổ NIR. Các bước sóng quang phổ được khảo sát và lựa chọn nhằm tối ưu và nâng cao hiệu suất của mô hình. Hiệu suất của mô hình hồi quy được đánh giá theo hệ số tương quan (R2) và giá trị sai số trung bình bình phương (MSE - Mean Square Error) và của bộ dữ liệu dự đoán và tập dữ liệu xác thực chéo.
Mẫu cá nghiên cứu: Hai mươi lăm mẫu cá Nục (n = 25) được thu thập ngẫu nhiên trong tháng 12/2021, tại một số cảng cá thuộc các tỉnh phía Bắc. Các mẫu đã được thu thập theo TCVN 5276:1990, được làm lạnh đông trước khi vận chuyển về Trung tâm Đào tạo và Phát triển sản phẩm thực Phẩm - Viện Công nghệ Sinh học và Công nghệ Thực phẩm - Trường Đại học Bách Khoa Hà Nội. Các mẫu được bảo quản lạnh đông ở nhiệt độ -18 độ C để không làm ảnh hưởng đến chất lượng mẫu cho đến khi phân tích.

Các vùng vị trí đo quang phổ NIR trên mẫu cá Nục
Kết quả của nghiên cứu này đã cung cấp một phương pháp tiếp cận, xử lý và tối ưu hóa thuật toán hồi quy PLS để dự đoán nhanh hàm lượng chất béo trong cá thông qua phép đo quang phổ NIR. Mô hình hồi quy PLS kết hợp lựa chọn biến và phương pháp tiền xử lý dữ liệu SNV, áp dụng cho tập dữ liệu đo NIR ở vùng bụng dưới của cá, cho hệ số tương quan là 0,96 và sai số bình phương trung bình là 0,001 cho tập xác thực chéo. Điều này cho thấy phương pháp phân tích quang phổ NIR kết hợp hồi quy PLS để ước lượng hàm lượng chất béo có thể là một phương pháp nhanh chóng, dễ sử dụng và có độ chính xác tương đối lớn. |