Các phương pháp hay nhất để triển khai trình điều khiển NNAPI

Trang này mô tả các phương pháp hay nhất để triển khai trình điều khiển Neural Networks API (NNAPI) nhằm cho phép nhà phát triển ứng dụng sử dụng rộng rãi NNAPI.

Rút ngắn thời gian khởi động

Nếu trình điều khiển của bạn biến đổi trọng số của một mô hình trong lần sử dụng đầu tiên, hãy đảm bảo trình điều khiển hỗ trợ lưu vào bộ nhớ đệm quá trình biên dịch, giúp giảm thời gian dùng để biên dịch khi ứng dụng khởi động. Điều này rất quan trọng vì các ứng dụng có thể tránh sử dụng tính năng tăng tốc phần cứng nếu thời gian khởi động quá lâu. Ví dụ: một số ứng dụng có trọng số hơn 100 MB và việc chuyển đổi các trọng số này mỗi khi ứng dụng khởi chạy sẽ gây lãng phí.

Giảm độ trễ tối thiểu

Để đảm bảo rằng các mô hình sử dụng tính năng tăng tốc phần cứng, bạn cần giảm độ trễ tối thiểu trong trình điều khiển. Nhiều ứng dụng sử dụng các mô hình nhỏ được thực thi nhiều lần và nếu độ trễ tối thiểu để thực thi khối lượng công việc quá cao, chẳng hạn như vài mili giây, thì các mô hình có thể chạy khối lượng công việc trên CPU, chỉ mất một hoặc hai mili giây thay vì sử dụng tính năng tăng tốc phần cứng. Hãy cẩn thận với việc đồng bộ hoá luồng tốn kém.

Sử dụng nhóm NN HAL SchedTune

Từ Android 11 trở lên, AOSP bao gồm một nhóm SchedTune HAL NN chuyên dụng cho phép các quy trình HAL NN giữa các quy trình sử dụng các nhân lớn, tương tự như việc triển khai cùng một quy trình trong cgroup top-app được xác định trước. Việc sử dụng nhóm SchedTune này sẽ làm giảm hao tổn trình điều khiển, đặc biệt là đối với các mô hình nhỏ.

Để sử dụng nhóm SchedTune, hãy thêm dòng sau vào tệp init.rc của quy trình NN HAL:

writepid /dev/stune/nnapi-hal/tasks