# Parámetros de Generación en Skyone Studio

### Introducción

Los **Modelos de Lenguaje a Gran Escala (LLMs, por sus siglas en inglés)** son sistemas de inteligencia artificial capaces de comprender y generar texto de una manera que se asemeja a la comunicación humana. Están entrenados con miles de millones de palabras y ejemplos de lenguaje para predecir la siguiente palabra en una oración.

En **Skyone Studio**, los LLMs pueden ajustarse finamente mediante **parámetros de configuración**. Estos parámetros funcionan como palancas de control: permiten al usuario decidir si desea respuestas más cortas o más largas, más creativas o más precisas, más variadas o más objetivas.

Este documento explica en detalle los principales parámetros de generación de texto disponibles, ayudando tanto a profesionales técnicos como a usuarios de negocio a comprender y utilizar la herramienta de manera más efectiva.

***

### Términos Clave (Glosario)

* **LLM (Large Language Model):** Modelo de lenguaje a gran escala entrenado para comprender y generar texto.
* **Token:** Unidad mínima de texto utilizada por el modelo (puede ser una palabra completa, parte de una palabra o incluso un símbolo).
* **Prompt:** Texto o instrucción proporcionada por el usuario para que el modelo genere una respuesta.
* **Max\_tokens:** Número máximo de *tokens* que el modelo puede generar en una salida.
* **Temperature:** Parámetro que controla el nivel de creatividad/aleatoriedad en el texto.
* **Top\_p (Muestreo por Núcleo):** Define el porcentaje acumulado de los *tokens* más probables a considerar.
* **Top\_k:** Limita la cantidad de *tokens* posibles en cada paso de generación.
* **Presence\_penalty:** Penaliza repeticiones y fomenta la variedad en el texto.
* **Stop:** Define palabras o símbolos que interrumpen la generación de texto.

***

### Parámetros de Generación

#### Max\_tokens

**Descripción:** Establece el número máximo de *tokens* que el modelo puede generar.

**Ejemplo práctico:**

* `max_tokens = 15` → respuesta corta.
* `max_tokens = 100` → respuesta larga y detallada.

**Analogía:** Es como elegir el tamaño de la hoja de papel en la que el modelo puede escribir.

<figure><img src="/files/0goD8wlfh9OjwfggPCSX" alt=""><figcaption></figcaption></figure>

***

#### Temperature

**Descripción:** Controla la creatividad y aleatoriedad de la respuesta.

* Temperatura baja → respuestas objetivas y predecibles.
* Temperatura alta → respuestas creativas y variadas.

**Analogía:** Es como la “temperatura” de una conversación: fría (directa) o cálida (diversa y llena de ideas).

<figure><img src="/files/fJD65TdOq97NMpZl2N4K" alt=""><figcaption></figcaption></figure>

***

#### Top\_p

**Descripción:** Define el porcentaje acumulado de los *tokens* más probables a considerar.

**Ejemplo:**

* `top_p = 0.1` → solo el 10% más probable de los *tokens*.
* `top_p = 0.9` → incluye palabras menos comunes.

**Analogía:** Es como usar un colador: cuanto más fino, menos opciones pasan.

<figure><img src="/files/J85kAty7b9TkRFYgA0qq" alt=""><figcaption></figcaption></figure>

***

#### Top\_k

**Descripción:** Restringe la generación a los **k** *tokens* más probables.

**Ejemplo:**

* `top_k = 2` → opciones muy limitadas.
* `top_k = 40` → opciones más amplias.

**Analogía:** Es como un menú: puede ser pequeño (pocas opciones) o grande (más variedad).

<figure><img src="/files/CV7vjqpUTTglo7oQHWWV" alt=""><figcaption></figcaption></figure>

***

#### Presence\_penalty

**Descripción:** Penaliza repeticiones y anima al modelo a explorar nuevas palabras e ideas.

**Ejemplo:**

* Sin penalización: *“Le gusta correr, correr y correr...”*
* Con penalización: *“Le gusta correr, hacer deporte y mantenerse activo.”*

**Analogía:** Es como pedirle a alguien que no repita la misma historia una y otra vez en una conversación.

<figure><img src="/files/Y9bR3vfsXDiNYa2tudUO" alt=""><figcaption></figcaption></figure>

***

### **Frequency\_penalty**

**Descripción:** Penaliza los tokens según la frecuencia con la que ya han sido utilizados. Cuanto más se repite una palabra, menor es la probabilidad de que vuelva a aparecer.

**Ejemplo:**

* **Sin penalización:** “Las estrellas brillan, las estrellas iluminan, las estrellas encantan…”
* **Con penalización:** “Las estrellas brillan, la luna ilumina y el firmamento encanta…”

**Analogía:** Es como un profesor que pide variar el vocabulario en una redacción, evitando repetir siempre las mismas palabras.

***

#### Stop

**Descripción:** Lista de palabras o símbolos que determinan dónde debe detenerse el modelo.

**Ejemplo:**

* `stop = ["end"]` → la respuesta se detiene inmediatamente después de esta palabra.

**Analogía:** Es como presionar el botón de “pausa” en el momento adecuado.

***

### Mejores Prácticas

* Ajustar **max\_tokens** según la longitud esperada de la respuesta.
* Usar **temperatura baja** para respuestas técnicas y **alta** para tareas creativas.
* Combinar **top\_p** y **top\_k** para equilibrar diversidad y predictibilidad.
* Aplicar **presence\_penalty** para evitar redundancia.
* Usar **stop** para asegurar que la salida termine en el punto deseado.
* Registrar siempre los parámetros utilizados para poder reproducir resultados en el futuro.

### FAQ

<details>

<summary><strong>¿Qué es un token?</strong> </summary>

Un token es una unidad de texto que puede ser una palabra completa, una parte de ella o incluso un símbolo.

</details>

<details>

<summary>¿Cuál es la diferencia entre Top_p y Top_k?</summary>

* **Top\_k** define un número fijo de palabras posibles.
* **Top\_p** utiliza un porcentaje acumulado de probabilidad.

</details>

<details>

<summary>¿Cuándo debo usar una temperatura alta?</summary>

En tareas creativas, como lluvia de ideas, generación de historias o redacción libre.

</details>

<details>

<summary>¿El <em>presence_penalty</em> puede perjudicar?</summary>

Sí. Si es demasiado alto, puede afectar la coherencia al forzar una variedad excesiva.

</details>

<details>

<summary>¿Debo definir siempre todos los parámetros?</summary>

No. Muchos valores predeterminados funcionan bien en la mayoría de los casos, pero ajustarlos manualmente puede ayudar a obtener resultados más precisos.

</details>

<details>

<summary>¿Cuál es la diferencia entre <em>presence_penalty</em> y <em>frequency_penalty</em>?</summary>

* **Presence\_penalty:** penaliza la mera aparición de un token, incluso si solo ha aparecido una vez.
* **Frequency\_penalty:** aumenta la penalización proporcionalmente al número de veces que el token ya ha aparecido.

</details>


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.skyone.cloud/espanol/skyone-studio/how-to/parametros-de-generacion-en-skyone-studio.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.