ainergy
/

CodeLlama-SDSAT_L7_13B

Text Generation

text-generation-inference

Model card Files Files and versions

Model Card for Model ID

The 13B model of "SDSAT: Accelerating LLM Inference through Speculative Decoding with Semantic Adaptive Tokens"

Model Details

Model Description

Developed by: ainergy
Language(s) (NLP): Code
Finetuned from model: CodeLlama-13B

Model Sources

Repository: https://github.com/ainergy-ml/SDSAT
Paper: https://arxiv.org/abs/2403.18647

Evaluation

Results

Walltime improvement

Downloads last month: 2

Safetensors

Model size

13B params

Tensor type

BF16

·

Model tree for ainergy/CodeLlama-SDSAT_L7_13B

Quantizations

1 model

Paper for ainergy/CodeLlama-SDSAT_L7_13B

SDSAT: Accelerating LLM Inference through Speculative Decoding with Semantic Adaptive Tokens

Paper • 2403.18647 • Published Mar 27, 2024