Thông tin tài liệu


Nhan đề : 
Micro-kernels for portable and efficient matrix multiplication in deep learning
Tác giả : 
Guillermo, Alaejos
Adrián, Castelló
Héctor, Martínez
Năm xuất bản : 
2023
Nhà xuất bản : 
Springer
Tóm tắt : 
Our work exposes the structure of the template-based micro-kernels for ARM Neon (128-bit SIMD), ARM SVE (variable-length SIMD) and Intel AVX512 (512-bit SIMD), showing considerable performance for an NVIDIA Carmel processor (ARM Neon), a Fujitsu A64FX processor (ARM SVE) and on an AMD EPYC 7282 processor (256-bit SIMD).
Mô tả: 
CC BY
URI: 
https://link.springer.com/article/10.1007/s11227-022-05003-3
https://dlib.phenikaa-uni.edu.vn/handle/PNK/7328
Appears in Collections
OER - Công nghệ thông tin
ABSTRACTS VIEWS

31

FULLTEXT VIEWS

92

Files in This Item: