Thông tin tài liệu
| Nhan đề : |
| Micro-kernels for portable and efficient matrix multiplication in deep learning |
| Tác giả : |
| Guillermo, Alaejos Adrián, Castelló Héctor, Martínez |
| Năm xuất bản : |
| 2023 |
| Nhà xuất bản : |
| Springer |
| Tóm tắt : |
| Our work exposes the structure of the template-based micro-kernels for ARM Neon (128-bit SIMD), ARM SVE (variable-length SIMD) and Intel AVX512 (512-bit SIMD), showing considerable performance for an NVIDIA Carmel processor (ARM Neon), a Fujitsu A64FX processor (ARM SVE) and on an AMD EPYC 7282 processor (256-bit SIMD). |
| Mô tả: |
| CC BY |
| URI: |
| https://link.springer.com/article/10.1007/s11227-022-05003-3 https://dlib.phenikaa-uni.edu.vn/handle/PNK/7328 |
| Bộ sưu tập |
| OER - Công nghệ thông tin |
XEM MÔ TẢ
100
XEM TOÀN VĂN
132
Danh sách tệp tin đính kèm:
