Instructions to use Finisha-F-scratch/Lamina-suite-pretrain with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- Transformers
How to use Finisha-F-scratch/Lamina-suite-pretrain with Transformers:
# Use a pipeline as a high-level helper from transformers import pipeline pipe = pipeline("text-generation", model="Finisha-F-scratch/Lamina-suite-pretrain")# Load model directly from transformers import AutoTokenizer, AutoModelForCausalLM tokenizer = AutoTokenizer.from_pretrained("Finisha-F-scratch/Lamina-suite-pretrain") model = AutoModelForCausalLM.from_pretrained("Finisha-F-scratch/Lamina-suite-pretrain") - Notebooks
- Google Colab
- Kaggle
- Local Apps
- vLLM
How to use Finisha-F-scratch/Lamina-suite-pretrain with vLLM:
Install from pip and serve model
# Install vLLM from pip: pip install vllm # Start the vLLM server: vllm serve "Finisha-F-scratch/Lamina-suite-pretrain" # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:8000/v1/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "Finisha-F-scratch/Lamina-suite-pretrain", "prompt": "Once upon a time,", "max_tokens": 512, "temperature": 0.5 }'Use Docker
docker model run hf.co/Finisha-F-scratch/Lamina-suite-pretrain
- SGLang
How to use Finisha-F-scratch/Lamina-suite-pretrain with SGLang:
Install from pip and serve model
# Install SGLang from pip: pip install sglang # Start the SGLang server: python3 -m sglang.launch_server \ --model-path "Finisha-F-scratch/Lamina-suite-pretrain" \ --host 0.0.0.0 \ --port 30000 # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:30000/v1/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "Finisha-F-scratch/Lamina-suite-pretrain", "prompt": "Once upon a time,", "max_tokens": 512, "temperature": 0.5 }'Use Docker images
docker run --gpus all \ --shm-size 32g \ -p 30000:30000 \ -v ~/.cache/huggingface:/root/.cache/huggingface \ --env "HF_TOKEN=<secret>" \ --ipc=host \ lmsysorg/sglang:latest \ python3 -m sglang.launch_server \ --model-path "Finisha-F-scratch/Lamina-suite-pretrain" \ --host 0.0.0.0 \ --port 30000 # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:30000/v1/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "Finisha-F-scratch/Lamina-suite-pretrain", "prompt": "Once upon a time,", "max_tokens": 512, "temperature": 0.5 }' - Docker Model Runner
How to use Finisha-F-scratch/Lamina-suite-pretrain with Docker Model Runner:
docker model run hf.co/Finisha-F-scratch/Lamina-suite-pretrain
📚 Documentation du Modèle : Lamina-suite-prétrain
Par Clemylia, Développeuse IA (18 ans)
Bienvenue dans l'univers de Lamina-suite-prétrain ! Ce modèle est votre nouvelle base de départ idéale pour tout projet de Lamining en français !
🌟 Aperçu et Objectif du Modèle
| Caractéristique | Détail |
|---|---|
| Nom du Modèle | Lamina-suite-prétrain |
| Créatrice | Clemylia (Développeuse IA, 18 ans) |
| Objectif Principal | Modèle pré-entraîné servant de base solide (blank) pour le Fine-Tuning. |
| Domaine | Lamining en Français (Français uniquement). |
| Taille | 714 Millions de Paramètres. |
| Nombre de Modèles Créés par l'Autrice | Plus de 35. |
🎯 La Philosophie de Lamina-suite-prétrain
Lamina-suite-prétrain est la concrétisation d'un besoin : ne plus repartir de zéro pour enseigner la grammaire et la logique de construction des phrases en français à un petit modèle pour la tâche du Lamining (un concept que j'ai Moi même explorer et inventé ;))
Ce modèle a été méticuleusement pré-entraîné pour maîtriser la structure interne de la langue française. Il est conçu pour :
- Comprendre la Grammaire 🧐 (accords, conjugaisons, pronoms, temps : futur, passé, etc.).
- Assimiler la Logique de Construction 🏗️ (sujet-verbe-complément, ordre des mots).
- Assurer une Orthographe de Base Solide ✔️.
⚠️ IMPORTANT : Lamina-suite-prétrain est un modèle blank (vierge) de génération. Il ne peut pas converser, répondre à des questions complexes, ni effectuer une tâche spécifique (résumé, classification, etc.) tel quel. Son rôle est d'être la fondation intelligente que vous construirez.
💾 Détails de l'Entraînement
🧠 Architecture et Pré-Entraînement
- Architecture : Modèle de Génération de Texte (Type Transformer, spécifique à la génération).
- Taille : 714 Millions de Paramètres.
- Approche : Totalement from scratch (conception et entraînement initial par l'autrice).
📖 Datasets d'Entraînement
Le modèle a été exclusivement entraîné sur trois datasets propriétaires (appartenant à Clemylia), garantissant un contrôle total sur la qualité et la structure des données linguistiques :
- Clemylia/training-fr-base 🇫🇷 : Contient 50 000 exemples focalisés sur la construction de phrases : usage des sujets, des pronoms définis, des temps (futur, passé, etc.). Ce dataset est la clé de la maîtrise grammaticale du modèle.
- Clemylia/lamina-chatbot-dataset : Contient 136 exemples de questions/réponses pour apprendre a lamina-suite-prétrain de construire des phrases avec une logique plus naturellle
- Clem27sey/Nacid : environ 236 exemples supplémentaires pour lamina-suite-prétrain
❤️ : Le Lamining est expliqué dans le fichier : lamining.md de ce dépôt ! allez le voir!
les datasets : Clem27sey/Nacid et Clemylia/lamina-chatbot-dataset sont d'excellentes datasets d'exemples de comment doit être structurer votre propre dataset pour le lamining :) 🩷🌸
Grâce à cet entraînement ciblé, le modèle a internalisé les règles fondamentales de la langue.
🛠️ Utilisation et Fine-Tuning (La Vraie Magie !)
Lamina-suite-prétrain est destiné à être la première étape de votre pipeline de développement.
🚀 Scénarios d'Utilisation Recommandés
Ce modèle est idéal pour servir de base pour la création de vos propres modèles personnalisés uniques de Lamining
voir notre fichier : Lamining.md 🌸
💬 Contacter l'Autrice
Pour toute question, suggestion ou collaboration, n'hésitez pas à me contacter !
- Hugging Face : Clemylia
Un grand merci à la communauté pour l'utilisation de mes modèles ! Hâte de voir ce que vous allez construire sur cette base ! 💖
♥️Conseil pour votre lamining et l'entraînement de votre SLM basé sur lamina-suite-pretrain : Si vous visez un SLM performant et créatif dans un domaine de prédilection, nous vous recommandons d'utiliser une dataset contenant des données (questions/reponses), uniquement dans le domaine en question.
- Downloads last month
- 4
