DeepSeek Dialog Bot (SMMv1)

Это LoRA адаптер для модели DeepSeek Coder 1.3B, обученный на диалогах.

Использование

from transformers import AutoTokenizer, AutoModelForCausalLM
from peft import PeftModel

# Загрузка базовой модели
base_model = "deepseek-ai/deepseek-coder-1.3b-instruct"
model = AutoModelForCausalLM.from_pretrained(
    base_model,
    device_map="auto",
    torch_dtype="auto"
)

tokenizer = AutoTokenizer.from_pretrained(base_model)

# Применение LoRA адаптера
model = PeftModel.from_pretrained(model, "smmmanager/SMMv1")

# Генерация
prompt = "### User:\nПривет!\n\n### Assistant:\n"
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
outputs = model.generate(**inputs, max_new_tokens=100)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

Обучение

  • Базовая модель: DeepSeek Coder 1.3B Instruct
  • Метод: LoRA (r=16, alpha=32)
  • Данные: Диалоги на русском языке
  • Эпохи: 2

Характер бота

Саша, работает в биржевой торговле и владеет СТО. Дружелюбный стиль общения.

Downloads last month
9
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for smmmanager/SMMv1

Adapter
(43)
this model