Kết quả thu được là hơn 3 triệu dòng mã, phân bố trên hàng nghìn tệp, tạo thành một engine hiển thị viết bằng Rust. Trình duyệt này có khả năng phân tích HTML, xử lý CSS, xây dựng bố cục trang và vận hành một máy ảo JavaScript do AI tự phát triển. Dù CEO Cursor thừa nhận sản phẩm mới chỉ ở mức “chạy tạm được”, đây vẫn là thành quả đáng chú ý nếu so với quy mô và độ phức tạp của một trình duyệt hiện đại. Quan trọng hơn, toàn bộ quá trình được thực hiện gần như hoàn toàn tự động.
Ban đầu, nhóm thử nghiệm mô hình các tác nhân AI ngang hàng, cùng phối hợp thông qua một cơ chế chia sẻ nhiệm vụ. Cách làm này nhanh chóng bộc lộ hạn chế khi các tác nhân chờ đợi lẫn nhau, giữ khóa quá lâu hoặc né tránh những nhiệm vụ khó. Công việc bị đình trệ dù số lượng tác nhân rất lớn. Điều này cho thấy AI, giống con người, cần cấu trúc tổ chức rõ ràng để làm việc hiệu quả trong các dự án phức tạp.
Giải pháp cuối cùng là kiến trúc phân cấp, với các tác nhân lập kế hoạch, tác nhân thực thi và tác nhân giám sát được phân vai rõ ràng. Các tác nhân lập kế hoạch chịu trách nhiệm chia nhỏ công việc, trong khi tác nhân thực thi tập trung hoàn thành nhiệm vụ được giao, và hệ thống giám định đánh giá kết quả theo chu kỳ. Mô hình này tương tự cách vận hành của một công ty phần mềm, nhưng ở quy mô hàng trăm “nhân sự AI” làm việc song song. Nhờ đó, nhóm Cursor gần như không gặp xung đột mã trong suốt nhiều ngày.
Điểm đột phá lớn nhất không chỉ nằm ở trình duyệt được tạo ra, mà ở khả năng AI duy trì làm việc liên tục suốt 168 giờ với bộ nhớ và mục tiêu nhất quán. AI có thể tự đọc lỗi, tự sửa, tái cấu trúc mã và tiếp tục triển khai mà không cần con người can thiệp thường xuyên. Điều này cho thấy AI đang chuyển mình từ “trợ lý lập trình” sang “lao động kỹ thuật số”, có khả năng đảm nhiệm trọn vẹn các dự án phần mềm lớn. Trong tương lai, chi phí và thời gian phát triển phần mềm có thể tiếp tục giảm mạnh khi mô hình này được mở rộng.
|