YAML Metadata Warning: empty or missing yaml metadata in repo card (https://huggingface.co/docs/hub/model-cards#model-card-metadata)

📝 Feedback Prize - English Language Learning (Basitleştirilmiş Versiyon)

Bu proje, Kaggle'daki "Feedback Prize - English Language Learning" yarışmasına basitleştirilmiş bir çözüm sunar. Öğrenci kompozisyonlarından 6 dil becerisi tahmin edilir:

  • Cohesion
  • Syntax
  • Vocabulary
  • Phraseology
  • Grammar
  • Conventions

📁 Kullanılan Veri Seti

  • train.csv: Öğrenci yazıları ve puanlar
  • test.csv: Tahmin yapılacak yazılar
  • sample_submission.csv: Örnek çıktı formatı

Veriler Kaggle yarışma sayfasından indirilebilir.


🔧 Kullanılan Yöntemler

  • TF-IDF ile metin vektörleştirme
  • Ridge Regression ile çoklu puan tahmini
  • MultiOutputRegressor ile 6 hedefin aynı anda öğrenilmesi
  • Basit ve etkili yaklaşım (RMSE ≈ 0.56)

💻 Streamlit Uygulaması

streamlit run app.py

📦 Kurulum

pip install -r requirements.txt



🧠 Model ve Vektörleştirici
ridge_model.pkl: Eğitilmiş regresyon modeli

tfidf_vectorizer.pkl: TF-IDF ile kelime temsilleri


📤 Kaggle Submission
Model, test.csv üzerinde tahmin yaparak submission.csv dosyasını üretir. Bu dosya doğrudan Kaggle'a yüklenebilir.📌 Geliştirilebilirlik
Daha güçlü NLP modelleri (BERT, DeBERTa)

Ensemble yaklaşımlar

Tokenizer bazlı embedding’ler

LSTM/Transformer tabanlı derin modeller



🧑‍🎓 Amaç
Bu proje, gerçek bir yarışmanın sadeleştirilmiş bir çözümünü anlamak, NLP modelleme sürecini öğrenmek ve üretilebilir bir prototip oluşturmak amacıyla geliştirilmiştir.


🏷️ Lisans
MIT License
Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support