Test

Canlı Dene


adrest5 – Türkçe Adres Düzeltme Modeli

Model Type: FLAN-T5 Small (Seq2Seq) Author: @cagrigungor Use Case: Bozuk veya eksik yazılmış Türkçe adresleri standart forma dönüştürme Language: Turkish (tr-TR) License: Apache-2.0

Model Hakkında

adrest5 modeli, FLAN-T5 Small tabanlı olup bozuk veya eksik Türkçe adresleri düzeltmek amacıyla fine-tune edilmiştir. Model, mahalle/cadde/sokak türlerini doğru formata dönüştürür, eksik parçaları tamamlar ve okunabilir bir adres oluşturur.

Mimari

  • Base Model: google/flan-t5-small
  • Parametre: ~80M
  • Eğitim Tipi: Supervised Seq2Seq
  • Max Length: 64
  • Loss: Cross Entropy
  • Tokenizer: T5 FastTokenizer

Eğitim Verisi

Bu model, kullanıcıya ait özel bir adres veri kümesi ile eğitilmiştir. Dataset HuggingFace’e yüklenmemiştir. Veri örneği:

  • eksik: bozuk adres
  • adres: doğru formatlanmış adres

Kullanım

Python örneği:

from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
import torch

model_name = "cagrigungor/adrest5"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)

device = "cuda" if torch.cuda.is_available() else "cpu"
model.to(device)

def duzelt(adres):
    encoded = tokenizer(adres, return_tensors="pt").to(device)
    with torch.no_grad():
        output = model.generate(**encoded, max_length=64)
    return tokenizer.decode(output[0], skip_special_tokens=True)

print(duzelt("atatrk cad  ,cafega mahs , num 18 kadikıoy"))

Örnek Çıktı

Girdi: atatrk cad ,cafega mahs , num 18 kadikıoy

Çıktı: Caferağa Mahallesi Atatürk Caddesi No:18, Kadıköy / İstanbul

Türkçe Karakter Notu

T5 tokenizer bazı Unicode normalizasyonları nedeniyle "ı" ve "İ" harflerini dönüştürebilir. Bu modelde post-processing ile düzeltilmiştir.

Sınırlamalar

  • Adresi doğrulamaz, sadece düzeltir.
  • Çok uzun adreslerde kırpma olabilir.

İletişim

Developed by @cagrigungor

Destanları ancak kahramanlar yazar. Çünkü onlar, vazifenin bittiği yerde, ölümü göze alarak çalışmaya devam ettikleri için birer kahraman olmuşlardır ...

Ömer Fahreddin Paşa Anısına...
Downloads last month
45
Safetensors
Model size
0.2B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for cagrigungor/adrest5

Finetuned
(455)
this model

Space using cagrigungor/adrest5 1