Test
adrest5 – Türkçe Adres Düzeltme Modeli
Model Type: FLAN-T5 Small (Seq2Seq) Author: @cagrigungor Use Case: Bozuk veya eksik yazılmış Türkçe adresleri standart forma dönüştürme Language: Turkish (tr-TR) License: Apache-2.0
Model Hakkında
adrest5 modeli, FLAN-T5 Small tabanlı olup bozuk veya eksik Türkçe adresleri düzeltmek amacıyla fine-tune edilmiştir. Model, mahalle/cadde/sokak türlerini doğru formata dönüştürür, eksik parçaları tamamlar ve okunabilir bir adres oluşturur.
Mimari
- Base Model: google/flan-t5-small
- Parametre: ~80M
- Eğitim Tipi: Supervised Seq2Seq
- Max Length: 64
- Loss: Cross Entropy
- Tokenizer: T5 FastTokenizer
Eğitim Verisi
Bu model, kullanıcıya ait özel bir adres veri kümesi ile eğitilmiştir. Dataset HuggingFace’e yüklenmemiştir. Veri örneği:
- eksik: bozuk adres
- adres: doğru formatlanmış adres
Kullanım
Python örneği:
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
import torch
model_name = "cagrigungor/adrest5"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
device = "cuda" if torch.cuda.is_available() else "cpu"
model.to(device)
def duzelt(adres):
encoded = tokenizer(adres, return_tensors="pt").to(device)
with torch.no_grad():
output = model.generate(**encoded, max_length=64)
return tokenizer.decode(output[0], skip_special_tokens=True)
print(duzelt("atatrk cad ,cafega mahs , num 18 kadikıoy"))
Örnek Çıktı
Girdi: atatrk cad ,cafega mahs , num 18 kadikıoy
Çıktı: Caferağa Mahallesi Atatürk Caddesi No:18, Kadıköy / İstanbul
Türkçe Karakter Notu
T5 tokenizer bazı Unicode normalizasyonları nedeniyle "ı" ve "İ" harflerini dönüştürebilir. Bu modelde post-processing ile düzeltilmiştir.
Sınırlamalar
- Adresi doğrulamaz, sadece düzeltir.
- Çok uzun adreslerde kırpma olabilir.
İletişim
Developed by @cagrigungor
Destanları ancak kahramanlar yazar. Çünkü onlar, vazifenin bittiği yerde, ölümü göze alarak çalışmaya devam ettikleri için birer kahraman olmuşlardır ...
Ömer Fahreddin Paşa Anısına...
- Downloads last month
- 45
Model tree for cagrigungor/adrest5
Base model
google/flan-t5-small