onnx quantized file for arm64

by wkpark - opened Aug 24, 2025

base: refs/heads/main

←

from: refs/pr/7

Discussion Files changed

-0

wkpark

Aug 24, 2025

•

edited Aug 24, 2025

# under mac osx m1
from sentence_transformers import SentenceTransformer, export_dynamic_quantized_onnx_model
model_id = "dragonkue/BGE-m3-ko"

#output_dir = "models/BGE-m3-ko" # locally saved out_dir.
#onnx_model = SentenceTransformer(model_id)
#onnx_model.save(output_dir)

onnx_model = SentenceTransformer(model_id, backend="onnx", model_kwargs={'provider':'CPUExecutionProvider'})
#onnx_model = SentenceTransformer(model_id, backend="onnx", model_kwargs={"file_name": "onnx/model_qint8_arm64.onnx", 'provider':'CPUExecutionProvider'})


export_dynamic_quantized_onnx_model(
    onnx_model,
    quantization_config="arm64",
    model_name_or_path="models/BGE-m3-ko",
)

you can get onnx quantized model named model_qint8_arm64.onnx in the models/KURE-v1/onnx/

onnx quantized file for arm6466d8be84

wkpark changed pull request status to open Aug 24, 2025

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

Ready to merge

This branch is ready to get merged automatically.

· Sign up or log in to comment