YAML Metadata
Warning:
empty or missing yaml metadata in repo card
(https://huggingface.co/docs/hub/model-cards#model-card-metadata)
📝 Feedback Prize - English Language Learning (Basitleştirilmiş Versiyon)
Bu proje, Kaggle'daki "Feedback Prize - English Language Learning" yarışmasına basitleştirilmiş bir çözüm sunar. Öğrenci kompozisyonlarından 6 dil becerisi tahmin edilir:
- Cohesion
- Syntax
- Vocabulary
- Phraseology
- Grammar
- Conventions
📁 Kullanılan Veri Seti
train.csv: Öğrenci yazıları ve puanlartest.csv: Tahmin yapılacak yazılarsample_submission.csv: Örnek çıktı formatı
Veriler Kaggle yarışma sayfasından indirilebilir.
🔧 Kullanılan Yöntemler
- TF-IDF ile metin vektörleştirme
- Ridge Regression ile çoklu puan tahmini
MultiOutputRegressorile 6 hedefin aynı anda öğrenilmesi- Basit ve etkili yaklaşım (RMSE ≈ 0.56)
💻 Streamlit Uygulaması
streamlit run app.py
📦 Kurulum
pip install -r requirements.txt
🧠 Model ve Vektörleştirici
ridge_model.pkl: Eğitilmiş regresyon modeli
tfidf_vectorizer.pkl: TF-IDF ile kelime temsilleri
📤 Kaggle Submission
Model, test.csv üzerinde tahmin yaparak submission.csv dosyasını üretir. Bu dosya doğrudan Kaggle'a yüklenebilir.📌 Geliştirilebilirlik
Daha güçlü NLP modelleri (BERT, DeBERTa)
Ensemble yaklaşımlar
Tokenizer bazlı embedding’ler
LSTM/Transformer tabanlı derin modeller
🧑🎓 Amaç
Bu proje, gerçek bir yarışmanın sadeleştirilmiş bir çözümünü anlamak, NLP modelleme sürecini öğrenmek ve üretilebilir bir prototip oluşturmak amacıyla geliştirilmiştir.
🏷️ Lisans
MIT License
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
🙋
Ask for provider support