shaheerzk
/

text_to_sql

Text Generation

text-generation-inference

8-bit precision

Model card Files Files and versions

text_to_sql / handler.py

shaheerzk's picture

Update handler.py

2e53d8a verified over 1 year ago

History Blame Contribute Delete

842 Bytes

	import torch
	from transformers import AutoModelForSeq2SeqLM, AutoTokenizer

	class ModelHandler:
	def __init__(self):
	self.device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
	self.model = AutoModelForSeq2SeqLM.from_pretrained("shaheerzk/text_to_sql")
	self.tokenizer = AutoTokenizer.from_pretrained("shaheerzk/text_to_sql")
	self.model.to(self.device)

	def handle(self, inputs):
	# Preprocess input
	text = inputs.get("text", "")
	inputs = self.tokenizer(text, return_tensors="pt").to(self.device)

	# Inference
	with torch.no_grad():
	outputs = self.model.generate(**inputs)

	# Post-process output
	generated_text = self.tokenizer.decode(outputs[0], skip_special_tokens=True)
	return {"generated_text": generated_text}