Giai đoạn 2 của DTI - Mô hình AI của IBM Data-Train-Inference
-
Người viết: Admin Sys
/
Đào tạo là giai đoạn của quy trình làm việc AI mà hầu hết các nhà khoa học không chuyên về dữ liệu xem xét khi họ nghe về khối lượng công việc AI. Đó không phải là một quan điểm hoàn toàn không chính xác. Đào tạo là nơi điều kỳ diệu của trí tuệ nhân tạo xuất hiện - nơi dữ liệu trở thành mô hình AI.
Nếu không đi sâu vào lý thuyết đằng sau học máy, học sâu và trí tuệ nhân tạo, đào tạo có thể được tóm tắt như một quá trình lặp đi lặp lại trong đó dữ liệu từ bước trước được sử dụng để tạo mô hình. Và những mô hình đó đưa ra những dự đoán trong tương lai về những dữ liệu tương tự trong thế giới thực. Chỉ trong 10 năm qua, người ta mới có thể giải quyết các vấn đề theo cách này, nhờ vào sự ra đời của đồ họa
Các máy chủ sử dụng cả bộ xử lý trung tâm (CPU) và các GPU mới này được coi là “tăng tốc”. Theo truyền thống
Các trung tâm dữ liệu tập trung vào CPU đang đảm nhận nhiều khối lượng công việc AI hơn, cần phải tăng cường trung tâm dữ liệu với các máy chủ dựa trên bộ tăng tốc. Máy tính mạnh hơn này cũng có chi phí tài nguyên cao hơn. Đó là lý do tại sao việc phân bổ chính xác các tài nguyên đắt tiền này là rất quan trọng. Phân bổ không chính xác có thể nhanh chóng hủy diệt dự án AI của bạn.
“Đào tạo là nơi điều kỳ diệu của trí tuệ nhân tạo xuất hiện — nơi dữ liệu trở thành mô hình AI”.
Ngay cả trong điều kiện lý tưởng, việc đào tạo chỉ một mô hình có thể mất vài ngày, vài tuần hoặc thậm chí vài tháng. Ngoài ra, các mô hình trung bình thường được đào tạo từ năm đến sáu lần trước khi được triển khai vào sản xuất. Việc tăng tốc hiệu suất để đào tạo một mô hình là vô giá, nhưng bạn cần sự kết hợp giữa tốc độ và độ chính xác để thúc đẩy giá trị quan trọng theo thời gian đưa ra thị trường.
Một trong những công việc tốn nhiều thời gian nhất trong quy trình đào tạo là thiết lập và đặt lại các siêu tham số cho các mô hình. Siêu tham số là giá trị mà nhà khoa học dữ liệu chọn cho mô hình trước khi bắt đầu đào tạo. Các mô hình hiện đại có thể có hàng trăm trong số chúng. Quá trình đặt lại và cài đặt lặp đi lặp lại có thể mất hàng giờ, ngay cả khi chạy mô hình bằng cách sử dụng tập dữ liệu mẫu. Tự động hóa các tìm kiếm siêu tham số và chạy song song các tìm kiếm này, có thể tiết kiệm cho các nhà khoa học dữ liệu của bạn hàng tuần hoặc thậm chí hàng tháng — đồng thời rút ngắn thời gian đưa ra kết quả và thời gian chính xác.
“Việc tăng tốc hiệu suất để đào tạo một mô hình là vô giá, nhưng bạn cần sự kết hợp giữa tốc độ và độ chính xác để thúc đẩy giá trị quan trọng theo thời gian đưa ra thị trường.”
Bạn có biết không?
Ngày, tuần hoặc tháng có thể bị lãng phí nếu nhà khoa học dữ liệu trên mô hình không thể xác định thành công ban đầu của các tham số mô hình.
Các công cụ như trực quan hóa đào tạo cho phép các nhà khoa học dữ liệu xem tiến trình đào tạo và cung cấp cảnh báo rằng đào tạo không hội tụ. Nhóm dữ liệu có thể dừng công việc, điều chỉnh lại các thông số và khởi động lại công việc trong vòng vài giờ đầu tiên của khóa đào tạo, thay vì đợi cho đến khi kết thúc để xem kết quả kém.
'Xung đột lâu đời'
Không giống như mã truyền thống, các mô hình AI trôi dạt khỏi dữ liệu cơ bản theo thời gian nếu chúng không được đào tạo lại trên dữ liệu mới. Do đó, bất kỳ mô hình hiện có nào đều phải được đào tạo lại một cách nhất quán để duy trì tính phù hợp và hữu ích của nó. Tuy nhiên, bạn cũng phải có khả năng nhanh chóng đưa và quảng bá các mô hình mới vào sản xuất.
Điều này đặt các nhà lãnh đạo CNTT vào trung tâm của một cuộc xung đột lâu đời xung quanh việc phân bổ nguồn lực. Một số khối lượng công việc hoặc người thuê quan trọng hơn những khối lượng công việc khác. Hoặc, họ phải tuân theo các thỏa thuận cấp độ dịch vụ (SLA) tích cực hơn. Điều này sẽ được phản ánh trong lớp lập lịch tài nguyên. Công cụ lập lịch nhanh hơn và hiệu quả hơn giúp bạn đạt được mức độ chính xác của mô hình phù hợp với doanh nghiệp nhanh hơn.
Không có nó, hỗn loạn xảy ra. Mỗi nhà khoa học dữ liệu hoặc dự án được giới hạn trong một hộp, cuối cùng tạo ra một silo máy tính. Điều này giới hạn người dùng trong một máy duy nhất mà anh ta không thể linh hoạt vượt ra ngoài.
Nó cũng lãng phí tài nguyên khi người dùng duy nhất đó không sử dụng máy. Chia sẻ công bằng và lập lịch dựa trên mức độ ưu tiên hỗ trợ chia sẻ động tài nguyên GPU giữa nhiều công việc đào tạo. Nó cũng cho phép khai thác trước và cải tạo GPU mà không giết chết bất kỳ công việc nào. Điều này giúp các nhóm khoa học dữ liệu đắt tiền của bạn làm việc hiệu quả; không ai bị chặn hoặc bỏ đói tài nguyên GPU.
Thay vào đó, bạn có thể tiếp tục thúc đẩy việc sử dụng để tối đa hóa việc sử dụng các tài nguyên tốn kém đó bởi vì chúng có tính đàn hồi để hoán đổi GPU từ khối lượng công việc sang khối lượng công việc. Lưu ý đến bản chất giá trị cao của các nguồn lực đào tạo và nỗ lực cần thiết để đảm bảo thành công trong giai đoạn này sẽ mang lại kết quả cuối cùng: Một mô hình tạo ra giá trị cho doanh nghiệp. Tuy nhiên, công việc không được thực hiện khi mô hình đã hoàn thành. Bây giờ nó phải được triển khai.
Viết bình luận