Thông tin

Tin học [ Đăng ngày (29/03/2025) ]
Đánh giá các thuật toán lọc hiệu quả trong xử lý dữ liệu lớn

Nghiên cứu được thực hiện bởi nhóm tác giả Phan Thượng Cang, Trần Thị Tố Quyên và Triệu Thanh Ngoan thuộc Trường Công nghệ Thông tin và Truyền thông, Trường Đại học Cần Thơ. Nghiên cứu được đăng trên Tạp chí Khoa học Đại học Cần Thơ Tập 60, Số 5A (2024): 59-68.
Trong kỷ nguyên dữ liệu lớn, việc xử lý và phân tích dữ liệu nhanh chóng và hiệu quả là thách thức lớn. Khả năng lọc và truy xuất thông tin liên quan từ tập dữ liệu khổng lồ trở nên quan trọng trong nhiều ứng dụng như khai phá dữ liệu, học máy, phân tích thời gian thực và hỗ trợ ra quyết định. Vì vậy, nghiên cứu và tối ưu hóa các thuật toán lọc đã thu hút sự quan tâm lớn của cộng đồng khoa học và chuyên gia ngành. Các thuật toán lọc giúp cải thiện đáng kể hiệu suất xử lý dữ liệu lớn bằng cách loại bỏ dữ liệu không liên quan hoặc dư thừa, giảm chi phí tính toán và rút ngắn thời gian truy vấn. Hiệu quả của chúng tác động trực tiếp tới hiệu năng tổng thể và khả năng mở rộng của hệ thống xử lý dữ liệu lớn, khiến việc tối ưu hóa thuật toán lọc trở thành lĩnh vực nghiên cứu quan trọng Các thuật toán lọc phổ biến như Bloom Filter, Cuckoo Filter, Quotient Filter, Morton Filter và Vacuum Filter đều có ưu nhược điểm riêng về hiệu quả lưu trữ, tốc độ chèn và truy vấn, tỷ lệ dương tính giả và khả năng thích ứng với đặc tính dữ liệu khác nhau. Việc hiểu rõ sự đánh đổi của từng thuật toán và lựa chọn giải pháp phù hợp cho từng bài toán cụ thể là rất quan trọng để tối ưu hóa hiệu suất xử lý. Bên cạnh đó, sự phát triển của các framework tính toán phân tán như Apache Spark đã tạo ra cuộc cách mạng trong xử lý dữ liệu lớn thông qua việc cho phép thực thi song song và phân tán các thuật toán lọc trên cụm máy tính lớn. Tích hợp các thuật toán lọc với các framework này hứa hẹn tăng tốc đáng kể tốc độ xử lý và khả năng xử lý khối lượng dữ liệu ngày càng tăng. Tuy nhiên, việc đánh giá và phân tích hiệu năng của các thuật toán lọc trong môi trường phân tán là cần thiết do sự khác biệt với môi trường truyền thống. Nhiều nghiên cứu gần đây đã tập trung vào ứng dụng và cải tiến các bộ lọc cấu trúc dữ liệu xác suất trong nhiều lĩnh vực khác nhau. Maulana et al. (2023) đề xuất sử dụng bộ lọc Bloom, Xor và Cuckoo để tối ưu hóa truy vấn cơ sở dữ liệu cho doanh nghiệp vừa và nhỏ. Ezzaki et al. (2020) cung cấp tổng quan về các biến thể của bộ lọc Bloom. Burdakov et al. (2019) áp dụng Bloom Filter Cascade trên Spark để tối ưu truy vấn SQL. Một số nghiên cứu khác tập trung vào bài toán tìm kiếm và kết hợp tương đồng chuỗi sử dụng các phương pháp lọc. Các nghiên cứu này chỉ ra sự phát triển tích cực và tiềm năng ứng dụng rộng rãi của các phương pháp lọc dữ liệu. Nghiên cứu này nhằm giải quyết nhu cầu cấp thiết về đánh giá và so sánh toàn diện hiệu năng của các thuật toán lọc khác nhau trong bối cảnh xử lý dữ liệu lớn. Thông qua thử nghiệm và so sánh mở rộng, việc đánh giá ưu nhược điểm của từng thuật toán và sự phù hợp của chúng trong các tình huống cụ thể được thực hiện; đồng thời, nghiên cứu tác động của việc tích hợp các thuật toán này với Apache Spark, chỉ ra tiềm năng cải thiện hiệu suất đáng kể thông qua xử lý song song và phân tán. Qua quá trình nghiên cứu có thể kết luận như sau: các thuật toán lọc hiệu quả trong môi trường xử lý dữ liệu lớn như Bloom Filter, Cuckoo Filter, Quotient Filter, Morton Filter và Vacuum Filter được trình bày chi tiết và đánh giá hiệu suất. Kết quả thực nghiệm cho thấy Quotient Filter là thuật toán hiệu quả nhất về mặt lưu trữ và cân bằng tốt giữa các tiêu chí hiệu năng. Quotient Filter sử dụng ít không gian lưu trữ nhất cho mỗi phần tử và đạt tốc độ chèn, tìm kiếm, xóa ở mức cao và ổn định. Bên cạnh đó, các thuật toán khác cũng thể hiện những ưu điểm riêng phù hợp với các yêu cầu cụ thể. Bloom Filter có tốc độ tốt, thích hợp cho các ứng dụng yêu cầu chèn và tìm kiếm nhanh trên dữ liệu tĩnh. Morton Filter nổi trội về tốc độ tìm kiếm nhưng chậm hơn khi chèn dữ liệu mới, phù hợp khi ưu tiên tốc độ đọc. Vacuum Filter, mặc dù có thời gian chèn chậm nhất, nhưng cung cấp khả năng tìm kiếm và xóa nhanh, là một lựa chọn tốt cho các trường hợp yêu cầu tìm kiếm và xóa nhanh mà không cần chèn dữ liệu thường xuyên. Khi được triển khai trên nền tảng Spark với khả năng xử lý song song và phân tán, tốc độ xử lý của các thuật toán được cải thiện đáng kể. Đặc biệt, Quotient Filter đạt mức cải thiện vượt bậc, hơn 50% khi chạy trên cluster so với môi trường local. Điều này mở ra triển vọng ứng dụng hiệu quả các thuật toán lọc, đặc biệt là Quotient Filter, để xử lý dữ liệu lớn và phân tán.
nhahuy Theo Tạp chí Khoa học Đại học Cần Thơ Tập 60, Số 5A (2024): 59-68

In bài viết

Tin tiếp theo__

Giá trị khách hàng: Yếu tố quyết định thành công của doanh nghiệp khởi nghiệp

Trong môi trường kinh doanh đầy cạnh tranh, giá trị khách hàng (Customer Value) đóng vai trò cốt lõi trong mọi chiến lược kinh doanh. Hiểu rõ và tối ưu hóa giá trị này không chỉ giúp doanh nghiệp thu hút khách hàng mà còn củng cố lòng trung thành, tạo động lực cho sự tăng trưởng bền vững và duy trì lợi thế cạnh tranh lâu dài.

Giá trị khách hàng trong khởi nghiệp: Cách đo lường và tối ưu hóa hiệu quả

Trong bối cảnh khởi nghiệp đầy cạnh tranh, việc thu hút và giữ chân khách hàng là yếu tố quyết định sự thành bại của doanh nghiệp. Một sản phẩm hoặc dịch vụ không chỉ cần đáp ứng nhu cầu mà còn phải tạo ra giá trị vượt trội để chinh phục khách hàng. Hiểu và tối ưu hóa giá trị khách hàng giúp startup xây dựng lợi thế cạnh tranh bền vững, gia tăng sự hài lòng và thúc đẩy tăng trưởng doanh thu. Bài viết này sẽ giúp bạn hiểu rõ hơn về khái niệm giá trị khách hàng, cách đo lường và phương pháp tối ưu hóa để đạt hiệu quả kinh doanh cao nhất.

Giá trị khách hàng trong khởi nghiệp: Yếu tố then chốt để thành công

Giá trị khách hàng (Customer Value) là tổng hợp những lợi ích mà khách hàng nhận được từ một sản phẩm hoặc dịch vụ so với chi phí mà họ phải bỏ ra trong suốt hành trình mua hàng (Customer Journey).

Marketing xanh: Xu hướng tất yếu trong khởi nghiệp bền vững

Ngày nay, người tiêu dùng không chỉ quan tâm đến chất lượng sản phẩm mà còn đặc biệt chú trọng đến cách doanh nghiệp tác động đến môi trường và cộng đồng. Chính vì thế, Marketing xanh trở thành một chiến lược mạnh mẽ giúp doanh nghiệp xây dựng hình ảnh bền vững, nâng cao giá trị thương hiệu và tạo ra lợi thế cạnh tranh trên thị trường.

Lợi ích và thách thức của marketing xanh đối với doanh nghiệp khởi nghiệp

Trong bối cảnh biến đổi khí hậu và ô nhiễm môi trường ngày càng trở thành vấn đề cấp bách, các doanh nghiệp đang dần chuyển hướng sang các chiến lược bền vững để thích ứng và phát triển. Marketing xanh không chỉ giúp doanh nghiệp thể hiện trách nhiệm xã hội mà còn mở ra nhiều cơ hội kinh doanh mới. Việc áp dụng các chiến lược tiếp thị xanh không chỉ góp phần bảo vệ môi trường mà còn mang lại lợi ích kinh tế lâu dài, giúp doanh nghiệp nâng cao hình ảnh thương hiệu, thu hút khách hàng và tối ưu hóa chi phí. Tuy nhiên, bên cạnh những lợi ích, Marketing xanh cũng đi kèm với nhiều thách thức mà doanh nghiệp cần cân nhắc.

Marketing xanh trong khởi nghiệp: Yếu tố cốt lõi để phát triển bền vững

Marketing xanh đang trở thành một xu hướng quan trọng trong bối cảnh môi trường ngày càng bị đe dọa. Đây không chỉ là một chiến lược kinh doanh mà còn thể hiện trách nhiệm xã hội của doanh nghiệp. Việc áp dụng Marketing xanh giúp giảm thiểu tác động tiêu cực đến môi trường, đồng thời tạo lợi thế cạnh tranh và thu hút khách hàng có ý thức bền vững. Bài viết này sẽ phân tích các yếu tố quan trọng của Marketing xanh, bao gồm thiết kế xanh, hình ảnh thương hiệu xanh, chiến lược giá, logistics xanh và vòng đời sản phẩm bền vững.

Xem nhiều

Giải thưởng nhà nước cho công trình: “Nạn đói năm 1945 ở Việt Nam - Những chứng tích lịch sử”

Cần cách mạng “xanh” trong sản xuất nông nghiệp

Chính quyền thuộc địa ở Việt Nam trước cách mạng tháng Tám 1945 : Cơ sở lịch sử - xã hội Việt Nam thời kỳ thực dân Pháp thống trị

Bệnh viện Đa khoa Hoàn Mỹ Cửu Long tổ chức hội nghị khoa học phẫu thuật nội soi

Những mẫu USB hub thú vị và ấn tượng

Nga đề xuất bắn rơi tiểu hành tinh có tên 1999 RQ36

Kiểm tra tiến độ thực hiện đề tài “Đánh giá tải lượng chất ô nhiễm của một số loại hình công nghiệp chính. Đề xuất các biện pháp giảm thiểu và công nghệ xử lý các loại chất thải công nghiệp này tại th...

MobiFone khuyến cáo thuê bao tránh "dính" cước roaming ở vùng biên

Chương trình KH&CN đồng bằng sông Cửu Long: cần sự liên kết vùng

Bệnh viện Đa khoa TP Cần Thơ tổ chức hội nghị khoa học công nghệ - sáng kiến cải tiến kỹ thuật năm 2011

Sơ kết chương trình tam nông khu vực ĐBSCL

Chính thức hủy bỏ hai dự luật SOPA và PIPA

10 sự kiện môi trường Việt Nam nổi bật năm 2011

Israel gia nhập tổ chức nghiên cứu hạt nhân Châu Âu

Phó hiệu trưởng ĐH Cần Thơ đạt danh hiệu lãnh đạo CNTT tiêu biểu Đông Nam Á

Tiêu điểm

Microsoft cáo buộc nhóm tin tặc đứng sau mạng lưới Deepfake AI
Công nghệ lưu trữ lượng tử vừa đạt đột phá: Chứa 5.000 phim 4K trên một tinh thể bé hơn đầu ngón tay?
Sony tuyên bố hợp tác gây chấn động ngành game, mang tính năng độc quyền trên AMD RX 9000 đến PS5 Pro, vạch ra tương lai cho PS6
Startup xe điện Dat Bike đã không còn "trong tay” người Việt
Trung Quốc tự đẩy mình vào 'thời khắc sinh tử': 300 startup xe điện chỉ còn 7 hãng lớn có thể tồn tại, chiến trường xe điện khốc liệt hơn bất kỳ lúc nào
Chuyên gia Phạm Chi Lan chỉ ra 4 điểm yếu của các nhà sáng lập Việt: Nhiều startup cho rằng xuất khẩu được mới 'oai', trong khi thị trường nội còn khó hơn ngoại
Startup KAMEREO ‘ấm bụng’ trong ‘mùa đông gọi vốn’: Hoàn tất vòng Series B với 7,8 triệu USD từ 5 ‘đồng hương’ Nhật Bản
Founder - CEO Amslink: Kiến tạo tương lai Anh ngữ cho thế hệ trẻ Việt
CASTI Awards 2024 - Tôn vinh sản phẩm khoa học, công nghệ và đổi mới sáng tạo
Thông cáo báo chí Hội thảo “Phát triển hệ sinh thái số về nguồn tin khoa học, công nghệ và đổi mới sáng tạo phục vụ phát triển kinh tế - xã hội thành phố Cần Thơ”
Khai mạc Chợ công nghệ và thiết bị chuyên ngành Nông nghiệp Cần Thơ 2024 – Tech4Agri CanTho 2024
Lãnh đạo thành phố tham quan, trải nghiệm các công nghệ, thiết bị tại Tech4Agri CanTho 2024
Các ứng dụng AI trong nông nghiệp
Hành trình Tech4Agri CanTho 2024 – với chủ đề “Khoa học, công nghệ và đổi mới sáng tạo – Đánh thức nền nông nghiệp đa giá trị”
Gần 300 công nghệ, thiết bị và sản phẩm dự kiến trưng bày, giới thiệu tại Tech4Agri CanTho 2024

Siêu thị số

Thiết kế, chế tạo và thử nghiệm hệ thống cân đa đầu

Nghiên cứu được thực hiện bởi nhóm tác giả Trần Nhựt Thanh, Dương Công Thương, Nguyễn Phước Ân, Đái Tiến Trung và Nguyễn Hoàng Dũng thuộc Khoa Tự động hóa, Trường Bách Khoa, Trường Đại học Cần Thơ. Nghiên cứu được đăng trên Tạp chí Khoa học Đại học Cần Thơ Tập 60, Số Chuyên đề SDMD (2024): 305-315.

Ứng dụng trí tuệ nhân tạo trong phân loại nguy cơ ung thư dựa trên hình ảnh x-quang tuyến vú

TGTOXIC tấn công người dùng Android chỉ bằng một tin nhắn SMS

Công nghệ 4.0

AI có mô phỏng được cách viết của con người không?

Với sự phát triển của các mô hình ngôn ngữ lớn (LLMs) như ChatGPT và Llama, một câu hỏi luôn thường trực là liệu các mô hình này có thể mô phỏng được cách viết của con người hay không. Một nhóm các nhà nghiên cứu từ Đại học Carnegie Mellon đã tìm kiếm câu trả lời cho câu hỏi này và công bố kết quả nghiên cứu trên tạp chí Proceedings of the National Academy of Sciences (PNAS).

Đưa AI vào xây dựng, kiểm tra văn bản quy phạm pháp luật

AI trở thành yếu tố quyết định hiệu suất doanh nghiệp

Điện tử

Thiết kế bộ sạc pin điều khiển mờ tối ưu dùng giải thuật di truyền

Nguồn năng lượng pin đang là một trong những chủ đề nóng trong ngành công nghiệp tự động, từ bộ lưu điện (Uninterruptible Power Supply – UPS) đến cuộc đua xe điện của nhiều hãng xe lớn. Tuy vậy, thử thách lớn nhất trong sử dụng pin chính là thời gian sạc, nhiệt độ và tuổi thọ của pin.

Giải pháp giám sát thời gian vận hành của thiết bị điện

Công nghệ lưu trữ lượng tử vừa đạt đột phá: Chứa 5.000 phim 4K trên một tinh thể bé hơn đầu ngón tay?

Tin học

Thiết kế, chế tạo và thử nghiệm hệ thống cân đa đầu

Nghiên cứu được thực hiện bởi nhóm tác giả Trần Nhựt Thanh, Dương Công Thương, Nguyễn Phước Ân, Đái Tiến Trung và Nguyễn Hoàng Dũng thuộc Khoa Tự động hóa, Trường Bách Khoa, Trường Đại học Cần Thơ. Nghiên cứu được đăng trên Tạp chí Khoa học Đại học Cần Thơ Tập 60, Số Chuyên đề SDMD (2024): 305-315.

Ứng dụng trí tuệ nhân tạo trong phân loại nguy cơ ung thư dựa trên hình ảnh x-quang tuyến vú

TGTOXIC tấn công người dùng Android chỉ bằng một tin nhắn SMS

Nghiên cứu
Tự nhiên
Nông-Lâm-Ngư
Xã hội-Nhân văn

Công nghệ
Cơ khí chế tạo
Môi trường
Sức khỏe

Thông tin
Tin học
Điện tử
Truyền thông

Kinh tế - Xã hội
Đời sống
Pháp luật
Kinh doanh

Sở hữu trí tuệ
Hoạt động
Văn bản
SHTT và Cuộc sống

Năng lượng
Thành tựu mới
Văn bản
Sản phẩm xanh

Chợ công nghệ
Sự kiện
Chào bán
Tìm mua

Ứng dụng
Công nghiệp
Nông nghiệp
Xây dựng

Hợp tác
Trong nước
Quốc tế
Địa phương

Giải trí
Đố vui khoa học
Xe
Thể thao

Địa chỉ: 118/3 Trần Phú - Phường Cái Khế - Quận Ninh Kiều - thành phố Cần Thơ
Giấy phép số: 05/ GP-TTĐT, do Sở Thông tin và Truyền Thông thành phố Cần Thơ cấp ngày 23/5/2017
Trưởng Ban biên tập: Ông Vũ Minh Hải - Giám Đốc Trung tâm Thông tin Khoa học và Công nghệ - Sở Khoa học & Công nghệ TP. Cần Thơ
Ghi rõ nguồn www.trithuckhoahoc.vn khi bạn sử dụng lại thông tin từ website này

Lượt truy cập:

-->

Họ tên	(*) Vui lòng nhập họ tên
Đơn vị công tác
Email	(*) Vui lòng nhập địa chỉ email
Mã xác nhận	Nhập mã được hiển thị ở hộp dưới đây (*)
Nội dung	(*)
Chú ý: (*) bắt buộc nhập.

Nghiên cứu

Công nghệ

Thông tin

Xã hội

Ứng dụng

Vũ trụ

Sở hữu trí tuệ

Năng lượng

Hợp tác

Sức khỏe

Đời sống

Thiên nhiên

Giá trị khách hàng: Yếu tố quyết định thành công của doanh nghiệp khởi nghiệp

Giá trị khách hàng trong khởi nghiệp: Cách đo lường và tối ưu hóa hiệu quả

Giá trị khách hàng trong khởi nghiệp: Yếu tố then chốt để thành công

Giá trị khách hàng (Customer Value) là tổng hợp những lợi ích mà khách hàng nhận được từ một sản phẩm hoặc dịch vụ so với chi phí mà họ phải bỏ ra trong suốt hành trình mua hàng (Customer Journey).

Marketing xanh: Xu hướng tất yếu trong khởi nghiệp bền vững

Lợi ích và thách thức của marketing xanh đối với doanh nghiệp khởi nghiệp

Marketing xanh trong khởi nghiệp: Yếu tố cốt lõi để phát triển bền vững

Xem nhiều

Tiêu điểm

© Copyright 2020 Trung tâm Thông tin Khoa học và Công nghệ - Sở Khoa học & Công nghệ TP. Cần Thơ