Instructions to use Hugo991/SQLBuilder with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- Transformers
How to use Hugo991/SQLBuilder with Transformers:
# Use a pipeline as a high-level helper from transformers import pipeline pipe = pipeline("text-generation", model="Hugo991/SQLBuilder") messages = [ {"role": "user", "content": "Who are you?"}, ] pipe(messages)# Load model directly from transformers import AutoTokenizer, AutoModelForMultimodalLM tokenizer = AutoTokenizer.from_pretrained("Hugo991/SQLBuilder") model = AutoModelForMultimodalLM.from_pretrained("Hugo991/SQLBuilder") messages = [ {"role": "user", "content": "Who are you?"}, ] inputs = tokenizer.apply_chat_template( messages, add_generation_prompt=True, tokenize=True, return_dict=True, return_tensors="pt", ).to(model.device) outputs = model.generate(**inputs, max_new_tokens=40) print(tokenizer.decode(outputs[0][inputs["input_ids"].shape[-1]:])) - Notebooks
- Google Colab
- Kaggle
- Local Apps Settings
- vLLM
How to use Hugo991/SQLBuilder with vLLM:
Install from pip and serve model
# Install vLLM from pip: pip install vllm # Start the vLLM server: vllm serve "Hugo991/SQLBuilder" # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:8000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "Hugo991/SQLBuilder", "messages": [ { "role": "user", "content": "What is the capital of France?" } ] }'Use Docker
docker model run hf.co/Hugo991/SQLBuilder
- SGLang
How to use Hugo991/SQLBuilder with SGLang:
Install from pip and serve model
# Install SGLang from pip: pip install sglang # Start the SGLang server: python3 -m sglang.launch_server \ --model-path "Hugo991/SQLBuilder" \ --host 0.0.0.0 \ --port 30000 # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:30000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "Hugo991/SQLBuilder", "messages": [ { "role": "user", "content": "What is the capital of France?" } ] }'Use Docker images
docker run --gpus all \ --shm-size 32g \ -p 30000:30000 \ -v ~/.cache/huggingface:/root/.cache/huggingface \ --env "HF_TOKEN=<secret>" \ --ipc=host \ lmsysorg/sglang:latest \ python3 -m sglang.launch_server \ --model-path "Hugo991/SQLBuilder" \ --host 0.0.0.0 \ --port 30000 # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:30000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "Hugo991/SQLBuilder", "messages": [ { "role": "user", "content": "What is the capital of France?" } ] }' - Docker Model Runner
How to use Hugo991/SQLBuilder with Docker Model Runner:
docker model run hf.co/Hugo991/SQLBuilder
| library_name: transformers | |
| license: apache-2.0 | |
| base_model: | |
| - Ellbendls/Qwen-3-4b-Text_to_SQL | |
| pipeline_tag: text-generation | |
| datasets: | |
| - gretelai/synthetic_text_to_sql | |
| language: | |
| - fra | |
| - eng | |
| - zho | |
| - spa | |
| - por | |
| - deu | |
| - ita | |
| - rus | |
| - jpn | |
| - kor | |
| - vie | |
| - tha | |
| - ara | |
| # Modèle Text-to-SQL – Version Strict + Fine-Tuning Personnalisé | |
| Ce modèle est une version améliorée de **Ellbendls/Qwen-3-4b-Text_to_SQL** (Apache-2.0). | |
| Il inclut : | |
| ### ✔ un pré-prompt intégré “Discipline SQL”, | |
| ### ✔ un léger fine-tuning sur un dataset interne spécialisé, | |
| ### ✔ un packaging propre pour un usage en production. | |
| L’objectif est de fournir une génération SQL **fiable, stricte, reproductible et mieux alignée** sur les besoins métier spécifiques du cas d’usage ciblé. | |
| --- | |
| ## 🧠 Description du modèle | |
| Ce modèle transforme des instructions en langage naturel en requêtes SQL standardisées. | |
| La version originale a été améliorée sur deux axes : | |
| ### **1) Discipline SQL intégrée dans le `generation_config.json`** | |
| Elle impose : | |
| - sortie **UNIQUEMENT SQL** | |
| - format propre et cohérent | |
| - alias systématiques dans les jointures | |
| - liste explicite des colonnes | |
| - **sélection de toutes les colonnes seulement si l’utilisateur le demande explicitement** | |
| - pas d’invention de tables ou colonnes | |
| ### **2) Fine-tuning léger basé sur un dataset interne** | |
| Ce fine-tuning ajoute : | |
| - de nouveaux schémas de base de données | |
| - des requêtes métiers typiques | |
| - un style de SQL homogène | |
| - de meilleures performances sur un domaine précis | |
| Ce fine-tuning (LoRA ou QLoRA) permet d’adapter finement le comportement du modèle sans nécessiter un entraînement complet. | |
| --- | |
| ## 🔍 Caractéristiques clés | |
| ### **✔ Conversion texte → SQL fiable** | |
| Génération de requêtes SQL propres, correctes et adaptées aux schémas ciblés. | |
| ### **✔ Standardisation stricte, mais flexible** | |
| Le modèle évite `SELECT *` **à moins que l’utilisateur demande explicitement “toutes les colonnes”**. | |
| ### **✔ Aligné sur ton domaine métier** | |
| Grâce au fine-tune interne, les requêtes sont plus pertinentes et contextualisées. | |
| ### **✔ Multilingue** | |
| Fonctionne en français, anglais, espagnol, portugais, allemand, chinois, etc. | |
| ### **✔ Fenêtre de contexte étendue** | |
| Adapté aux grandes bases, requêtes complexes, longues définitions de tables. | |
| --- | |
| ## 🧩 Exemple de prompt interne intégré | |
| Le pré-prompt utilisé dans cette version : | |
| You are a strict SQL generation engine. | |
| Your only task is to convert natural language instructions into valid SQL queries. | |
| Rules: | |
| 1. Output ONLY SQL. No explanations, no comments. | |
| 2. Always generate syntactically correct SQL. | |
| 3. Never invent tables or columns. | |
| 4. Avoid SELECT * unless the user explicitly requests all columns. | |
| 5. Use explicit column lists by default. | |
| 6. Use clear table aliases when joins are present. | |
| 7. Keep formatting clean and standardized. | |
| --- | |
| ## 🚀 Exemple d’utilisation | |
| ```python | |
| from transformers import AutoTokenizer, AutoModelForCausalLM | |
| model_name = "Hugo991/SQLBuilder" | |
| tokenizer = AutoTokenizer.from_pretrained(model_name) | |
| model = AutoModelForCausalLM.from_pretrained(model_name) | |
| user_input = "Montre-moi tous les départements avec leur identifiant." | |
| # On récupère le template intégré dans le generation_config | |
| template = tokenizer.generation_config.prompt_template | |
| prompt = template.replace("{input}", user_input) | |
| inputs = tokenizer(prompt, return_tensors="pt") | |
| outputs = model.generate(**inputs, max_new_tokens=256) | |
| print(tokenizer.decode(outputs[0], skip_special_tokens=True)) |