tomas.helmfridsson commited on
Commit
324c351
·
1 Parent(s): ea64562
Files changed (1) hide show
  1. app.py +2 -2
app.py CHANGED
@@ -22,7 +22,7 @@ LLM_MODEL = "TinyLlama/TinyLlama-1.1B-Chat-v1.0"
22
  CHUNK_SIZE = 400
23
  CHUNK_OVERLAP = 40
24
  CTX_TOK_MAX = 750 # sparar marginal till fråga + svar
25
- MAX_NEW_TOKENS = 256
26
  K = 5
27
  DEFAULT_TEMP = 0.8
28
  GEN_TIMEOUT = 180 # Timeout för generering i sekunder
@@ -165,7 +165,7 @@ with gr.Blocks() as demo:
165
  with gr.Row():
166
  q_in = gr.Textbox(label="Fråga", placeholder="Ex: Vad är förvaltningsöverlämnande?")
167
  temp = gr.Slider(0, 1, value=DEFAULT_TEMP, step=0.05, label="Temperatur")
168
- max_new_tokens = gr.Slider(32, 256, value=MAX_NEW_TOKENS, step=8, label="Max svarslängd (tokens)")
169
  k = gr.Slider(1, 10, value=K, step=1, label="Antal chunkar (K)")
170
  ctx_tok_max = gr.Slider(100, 2000, value=CTX_TOK_MAX, step=50, label="Max kontexttokens")
171
  b_send = gr.Button("Skicka")
 
22
  CHUNK_SIZE = 400
23
  CHUNK_OVERLAP = 40
24
  CTX_TOK_MAX = 750 # sparar marginal till fråga + svar
25
+ MAX_NEW_TOKENS = 512
26
  K = 5
27
  DEFAULT_TEMP = 0.8
28
  GEN_TIMEOUT = 180 # Timeout för generering i sekunder
 
165
  with gr.Row():
166
  q_in = gr.Textbox(label="Fråga", placeholder="Ex: Vad är förvaltningsöverlämnande?")
167
  temp = gr.Slider(0, 1, value=DEFAULT_TEMP, step=0.05, label="Temperatur")
168
+ max_new_tokens = gr.Slider(32, 1024, value=MAX_NEW_TOKENS, step=8, label="Max svarslängd (tokens)")
169
  k = gr.Slider(1, 10, value=K, step=1, label="Antal chunkar (K)")
170
  ctx_tok_max = gr.Slider(100, 2000, value=CTX_TOK_MAX, step=50, label="Max kontexttokens")
171
  b_send = gr.Button("Skicka")