Chip AMD 9511 (sản xuất năm 1979) được xem là "cộng tác viên" của bộ xử lý chính, tính toán dấu chấm động 32-bit, do CPU điều khiển. Nó được xem là bộ xử lý dấu chấm động đầu tiên.
Với màn hình máy tính làm tươi ở tần xuất khoảng từ 60 - 80 lần mỗi giây thì GPU cần chuyển một hình ảnh 3 chiều và chiếu nó lên màn hình bề mặt 2 chiều. Việc chuyển dịch này cần được thực hiện mức độ từng điểm ảnh. Chẳng hạn, ở màn hình độ phân giải 1280x1024 có hơn 1,3 triệu điểm ảnh, tương đương 104 triệu điểm ảnh mỗi giây, để xử lý điểm ảnh càng nhanh thì các chip đồ họa tận dụng một kiến trúc có đến hàng trăm nhân tính toán. Mỗi nhân tính toán hoạt động độc lập, chịu trách nhiệm xử lý từng điểm ảnh. Khi chạy song song, những luồng công việc xử lý hàng trăm điểm ảnh cùng lúc.
Nhiều ứng dụng nhúng có thể tận dụng năng lực xử lý song song để thực hiện các công thức tính toán dấu chấm động, số nguyên. Ví dụ, hệ thống tín hiệu ra-đa cần xử lý tính toán dấu chấm động rất lớn để nhận diện mục tiêu đang di chuyển. Khi đó, dữ liệu đầu vào của ra-đa lớn hơn nhiều so với đầu ra nên xử lý không kịp. Để cải thiện tốc độ, các nhà thiết kế ra-đa phải thêm nhiều CPU (hoặc nhân), hoặc tăng xung nhịp; tuy nhiên chúng lại đi ngược với yêu cầu nhỏ gọn trong thiết kế ra-da. Lấy các khả năng này và tích hợp chúng vào một CPU đơn (kiến trúc x86) - gọi là CPU tăng tốc APU (Accelerated Processing Unit), người ta có thể tăng tốc khả năng xử lý cho các ứng dụng mà các CPU thông thường không làm được.
Để có được năng lực tính toán mới, cần dùng CPU cực mạnh và tốn nhiều điện, hoặc thêm vào một chip DSP hoặc chip FPGA vào hệ thống. Những giải pháp mới hiện nay có thể giúp hệ thống đạt được năng lực tính toán đến 46 gigaflops trong một phép tính tính toán động, trong khi điện năng tiêu thụ ít hơn 4,5 W.
Tiềm năng của kiến trúc xử lý song song hiện nay của APU đang thu hút các nhà thiết kế công nghiệp, hàng không, quân đội, y khoa. |