Spaces:

teixeiramg
/

Teste

Sleeping

teixeiramg commited on Nov 5, 2024

Commit

cab5133

verified ·

1 Parent(s): ed6732f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -45,7 +45,7 @@ def answer_question(question, max_length=200, temperature=0.7, top_k=50, top_p=0
     try:
         if not pdf_content:
             return "Por favor, carregue um PDF primeiro.", ""
         # Limitar o tamanho do conteúdo do PDF para evitar exceder o número máximo de tokens
         max_tokens = 1024  # O número máximo de tokens permitido para o GPT-2 é geralmente 1024
         truncated_content = pdf_content[:max_tokens]
@@ -57,18 +57,21 @@ def answer_question(question, max_length=200, temperature=0.7, top_k=50, top_p=0
         # Tokenizando o prompt
         inputs = tokenizer(prompt, return_tensors="pt")
-        print(f"Tokens de entrada: {inputs.input_ids.shape[1]} tokens")  # Verifica o número de tokens
-        # Gerar a resposta
         outputs = model.generate(
             inputs.input_ids,
-            max_length=max_length,
-            temperature=temperature,
-            top_k=top_k,
-            top_p=top_p,
-            num_return_sequences=1
         )
         response = tokenizer.decode(outputs[0], skip_special_tokens=True)
         return response, prompt
     except Exception as e:

     try:
         if not pdf_content:
             return "Por favor, carregue um PDF primeiro.", ""
         # Limitar o tamanho do conteúdo do PDF para evitar exceder o número máximo de tokens
         max_tokens = 1024  # O número máximo de tokens permitido para o GPT-2 é geralmente 1024
         truncated_content = pdf_content[:max_tokens]
         # Tokenizando o prompt
         inputs = tokenizer(prompt, return_tensors="pt")
+        num_tokens = inputs.input_ids.shape[1]
+        print(f"Tokens de entrada: {num_tokens} tokens")  # Verifica o número de tokens
+        if num_tokens > 1024:
+            return "Erro: O prompt gerado ultrapassou o limite de tokens do modelo. Tente um PDF menor.", prompt
+        # Gerar a resposta com configurações simples
         outputs = model.generate(
             inputs.input_ids,
+            max_length=200,  # Limite de tamanho da resposta
+            temperature=0.7,  # Usando temperatura mais baixa para evitar respostas incoerentes
+            num_return_sequences=1,
         )
+        # Decodificando a resposta
         response = tokenizer.decode(outputs[0], skip_special_tokens=True)
         return response, prompt
     except Exception as e: