Cloudian ra mắt trình kết nối PyTorch hỗ trợ RDMA, tăng tốc đột phá cho các workload AI
Ngày 15 tháng 7 năm 2025 — Cloudian, công ty dẫn đầu trong lĩnh vực giải pháp Object Storage chuẩn doanh nghiệp, vừa công bố trình kết nối PyTorch mới tích hợp Remote Direct Memory Access (RDMA), mang lại bước đột phá về hiệu năng dành cho các workload trí tuệ nhân tạo (AI) và học máy (ML).
Được xây dựng trên nền tảng NVIDIA GPUDirect Storage và tối ưu cho hạ tầng mạng NVIDIA Spectrum‑X, giải pháp tiên tiến này giúp tăng hiệu suất xử lý dữ liệu lên tới 74 %, đồng thời giảm 43 % mức sử dụng CPU, góp phần tăng tốc đáng kể các quy trình xử lý dữ liệu AI.
Kết quả thử nghiệm thực tế với TorchBench — bộ công cụ mã nguồn mở đo hiệu năng PyTorch — cho thấy trình kết nối mới hỗ trợ RDMA có thể xử lý tới 52 000 hình ảnh mỗi giây, so với 30 000 hình ảnh mỗi giây khi dùng trình kết nối S3 mặc định. Những con số này phản ánh rõ lợi ích: rút ngắn thời gian huấn luyện mô hình và giảm chi phí tính toán.
“Đây là một bước tiến mang tính nền tảng trong cách AI truy xuất và xử lý dữ liệu, được thúc đẩy bởi công nghệ mạng tăng tốc của NVIDIA,” ông Neil Stobart, Giám đốc Công nghệ Cloudian chia sẻ. “Bằng cách tận dụng GPUDirect Storage để loại bỏ các nút thắt cổ chai truyền thống, chúng tôi giúp nhà khoa học dữ liệu và kỹ sư AI đẩy nhanh tiến độ làm việc, đồng thời tối ưu chi phí hạ tầng qua kết nối trực tiếp giữa GPU và hệ thống lưu trữ.”
Nhờ RDMA, trình kết nối cho phép truyền dữ liệu trực tiếp từ bộ nhớ hệ thống lưu trữ đến GPU mà không qua CPU hoặc các giao thức mạng thông thường. Độ trễ giảm mạnh và hiệu năng nâng cao tối đa, đặc biệt khi chạy trên hạ tầng NVIDIA gồm switch Spectrum‑X và card mạng ConnectX SuperNIC.
Giải pháp được kiểm chứng trên Cloudian HyperStore 8.2.2 với sáu máy chủ Supermicro toàn flash tích hợp mạng NVIDIA — cấu hình phổ biến cho các workload AI hiệu năng cao.
PyTorch hiện phục vụ hàng triệu nhà phát triển, từ viện nghiên cứu đến doanh nghiệp quy mô lớn. Nhờ rút ngắn thời gian huấn luyện mô hình và giảm tải tài nguyên, trình kết nối mới của Cloudian hứa hẹn tạo khác biệt lớn cho các tổ chức đang triển khai ứng dụng thị giác máy tính, xử lý ngôn ngữ tự nhiên và học sâu trên nền tảng NVIDIA.
Việc tích hợp NVIDIA GPUDirect Storage loại bỏ sao chép dữ liệu không cần thiết và tối ưu luồng dữ liệu trực tiếp từ lưu trữ đến GPU, tạo đường truyền hiệu quả vượt trội trong các pipeline học máy tập trung GPU.
Trình kết nối PyTorch hỗ trợ RDMA của Cloudian hiện đã sẵn sàng để đăng ký trải nghiệm, giúp tổ chức đánh giá hiệu năng thực tế trong môi trường AI được tăng tốc bởi NVIDIA của riêng họ.