Ученые PyTorch представили оптимизированное ядро TK-GEMM для умножения матриц с использованием параллелизации SplitK.

PyTorch Researchers Introduce an Optimized Triton FP8 GEMM (General Matrix-Matrix Multiply) Kernel TK-GEMM that Leverages SplitK Parallelization

Ученые PyTorch представили оптимизированное ядро TK-GEMM для умножения матриц с использованием параллелизации SplitK.