cisco-ai
/

SecureBERT2.0-biencoder

Sentence Similarity

sentence-transformers

feature-extraction

Generated from Trainer

dataset_size:35705

loss:MultipleNegativesRankingLoss

text-embeddings-inference

Model card Files Files and versions

cisco-ehsan commited on Oct 13

Commit

9ac79be

·

verified ·

1 Parent(s): bf4e99b

Update README.md

Files changed (1) hide show

README.md +8 -25

README.md CHANGED Viewed

@@ -49,11 +49,6 @@ It independently encodes queries and documents into a shared vector space for **
 - **License:** Apache-2.0
 - **Finetuned from:** [CiscoAITeam/SecureBERT2.0-base](https://huggingface.co/CiscoAITeam/SecureBERT2.0-base)
-### Model Sources
-- **Repository:** [https://huggingface.co/CiscoAITeam/SecureBERT2.0-biencoder](https://huggingface.co/CiscoAITeam/SecureBERT2.0-biencoder)
-- **Paper:** [arXiv:2510.00240](https://arxiv.org/abs/2510.00240)
 ---
 ## Uses
@@ -137,19 +132,14 @@ print(similarity)
 ## Framework Versions
-Python: 3.10.10
-Sentence Transformers: 5.0.0
-Transformers: 4.52.4
-PyTorch: 2.7.0 + cu128
-Accelerate: 1.9.0
-Datasets: 3.6.0
-Tokenizers: 0.21.1
 ## Training Details
@@ -161,13 +151,6 @@ The model was fine-tuned on cybersecurity-specific paired-sentence data for docu
 - **Dataset Size:** 35,705 samples
 - **Columns:** `sentence_0`, `sentence_1`, `label`
-#### Statistics (first 1000 samples)
-| Field | Type | Mean Tokens | Min | Max |
-|:------|:-----|:-----------:|:---:|:---:|
-| sentence_0 | string | 20.14 | 9 | 103 |
-| sentence_1 | string | 293.14 | 3 | 934 |
-| label | float | 1.0 | 1.0 | 1.0 |
 #### Example Schema

 - **License:** Apache-2.0
 - **Finetuned from:** [CiscoAITeam/SecureBERT2.0-base](https://huggingface.co/CiscoAITeam/SecureBERT2.0-base)
 ---
 ## Uses
 ## Framework Versions
+* python: 3.10.10
+* sentence_transformers: 5.0.0
+* transformers: 4.52.4
+* PyTorch: 2.7.0+cu128
+* accelerate: 1.9.0
+* datasets: 3.6.0
+---
 ## Training Details
 - **Dataset Size:** 35,705 samples
 - **Columns:** `sentence_0`, `sentence_1`, `label`
 #### Example Schema