Использование разреженности активации в больших языковых моделях

ReLU Strikes Back: Exploiting Activation Sparsity in Large Language Models

Использование разреженности активации в больших языковых моделях