Vertex AI
Categoría: Cognitive
Descripción: Este módulo de extensión permite generar respuestas basadas en la IA generativa de Google y paralelamente evalúa cognitivamente sobre el motor cognitivo definido por defecto en el tenant. Vertex AI ofrece acceso a Gemini, un modelo multimodal de Google DeepMind, capaz de comprender prácticamente cualquier entrada, combinar diferentes tipos de información y generar casi cualquier resultado.
Funcionalidad: Utilice este módulo de extensión para crear respuestas basadas en la IA generativa de Google y paralelamente evalúa cognitivamente sobre el motor cognitivo definido por defecto en el tenant. Vertex AI ofrece acceso a Gemini, un modelo multimodal de Google DeepMind, capaz de comprender prácticamente cualquier entrada, combinar diferentes tipos de información y generar casi cualquier resultado.
Requisitos previos
-
Crear una Cuenta en Google
- Si aún no tienes una cuenta de Google (Gmail), crea una en Gmail.
- Accede a Google Cloud, una vez que tengas tu cuenta de Google, ve a Google Cloud Console (Si es la primera vez que accedes, deberás aceptar los términos y condiciones).
- En la Google Cloud Console, selecciona o crea un nuevo proyecto. Para hacerlo, haz clic en el menú desplegable del proyecto en la parte superior de la página y selecciona "Nuevo Proyecto".
-
Habilitar Vertex AI:
- Dentro del proyecto, habilita la API de Vertex AI. Ve al menú de navegación, selecciona "API y Servicios" > "Biblioteca" y busca "Vertex AI", Haz clic en "Habilitar".
-
Entrenar un motor cognitivo
- Consulte la documentación del Motor cognitivo seleccionado o intente recuperar una respuesta válida para ajustar las consultas durante la fase de diseño de su flujo.
Nota 📑: Acceda a la Documentación de Vertex AI, para obtener mayor información
Implementación
Random dialog type action to continue the conversation: Campo de tipo lista que despliega diálogos creados en el tenant, que permite iniciar la interaccion.
Expresión que define el prompt de entrenamiento: Campo donde debe ingresar una expresión que segun el texto permite generar una respuesta del modelo. Las instrucciones pueden incluir predicado, preguntas, sugerencias, instrucciones o ejemplos.
LOCATION_ID: Campo que permite identificar de forma única la región o zona específica en la que se ejecutarán las operaciones de Vertex AI. Este campo es importante para definir la localización geográfica de los recursos de IA, lo que puede afectar la latencia, el cumplimiento normativo y otros aspectos operacionales. Ejemplos de valores de LOCATION_ID incluyen us-central1, europe-west1, entre otros.
PUBLISHER: Campo que indica la entidad o proveedor que ha desarrollado y publicado el modelo de IA utilizado. Esto puede ser una empresa, una organización de investigación, o un equipo de desarrollo dentro de Google Cloud.
MODEL: Expresión de tipo string que especifica el modelo de IA que se utilizará para la validación del texto. Cada modelo tiene un identificador único que debe ser indicado en este campo. Por ejemplo, text-bison@001 para un modelo específico de procesamiento de lenguaje natural.
Nota 📑: La lista completa de modelos disponibles y sus identificadores se puede consultar en la documentación oficial de Vertex AI.
Temperatura: Campo de tipo float y controla la creatividad de las respuestas generadas por el modelo de IA. Un valor más alto (como 0.9) hace que el modelo genere respuestas más diversas y creativas, mientras que un valor más bajo (como 0) produce respuestas más precisas y definidas. Ajustar este valor permite balancear entre creatividad y precisión según el contexto del uso.
MAX OUTPUT TOKENS: Campo que determina la cantidad máxima de tokens (palabras, partes de palabras o símbolos) que pueden ser generados en la salida de texto del modelo. Un valor más bajo generará respuestas más cortas y concisas, mientras que un valor más alto permitirá respuestas más extensas y detalladas.
TOP P: Controla la diversidad de las respuestas del modelo. Un valor alto (cerca de 1) permite mayor diversidad al considerar más opciones posibles. Un valor bajo (cerca de 0) limita las opciones a las más probables, resultando en respuestas más coherentes y menos creativas.
Por ejemplo, si los tokens A, B y C tienen una probabilidad de 0.3, 0.2 y 0.1, y el valor P superior es 0.5, entonces el modelo seleccionará A o B como el siguiente token (con temperatura) y no lo hará T considera C. El valor predeterminado de P superior es 0.95.
TOP K: El campo TOP K controla la cantidad de opciones de tokens más probables que el modelo considerará en cada paso de generación de texto. Un valor más alto permitirá que el modelo considere una mayor cantidad de opciones posibles, mientras que un valor más bajo limitará las opciones a las más probables.
Certeza (1-100) con la que se identifica la intención.: Campo que permite ingresar un porcentaje de aceptación que determina la certeza con la que se identifica una intención en particular. El valor debe estar en un rango de 1 a 100, donde un valor más alto indica una mayor certeza de que la intención identificada es correcta. Este campo se utiliza para establecer un umbral de confianza en la identificación de intenciones.
Si se alcanza el máximo de intentos fallidos, el flujo de acción se interrumpirá y la descripción del error se pasará a la intención seleccionada con el nombre: 'vertexAi_Error': Caja de selección donde se visualizarán listado de intenciones en donde debe seleccionar la que se activara en caso de presentarse un error.
PROJECT ID: Parámetro correspondiente a la configuración de la cuenta de Servicio de Google. El PROJECT ID es un identificador único para tu proyecto en Google Cloud. Este ID se utiliza para asociar todos los recursos y servicios en Google Cloud con tu proyecto específico.
PRIVATE KEY ID: Parámetro correspondiente a la configuración de la cuenta de Servicio de Google. El PRIVATE KEY ID es un identificador único para la clave privada utilizada en la autenticación y autorización de la cuenta de servicio de Google. Este campo es esencial para la seguridad y el acceso seguro a los recursos de Google Cloud.
PRIVATE KEY: Parámetro correspondiente a la configuración de la cuenta de Servicio de Google. La PRIVATE KEY es una clave privada utilizada para autenticar y autorizar la cuenta de servicio de Google. Esta clave debe mantenerse segura y se utiliza junto con el PRIVATE KEY ID para asegurar el acceso a los servicios y recursos de Google Cloud.
CLIENT EMAIL: Parámetro correspondiente a la configuración de la cuenta de Servicio de Google. El CLIENT EMAIL es el correo electrónico asociado con la cuenta de servicio de Google. Este correo electrónico identifica la cuenta de servicio y se utiliza en el proceso de autenticación y autorización.
CLIENT_ID: Parámetro correspondiente a la configuración de la cuenta de Servicio de Google. El CLIENT_ID es un identificador único para la cuenta de servicio de Google. Este ID se utiliza junto con otros parámetros de configuración para autenticar y autorizar la cuenta de servicio en Google Cloud.
Ejemplo de implementación
En el siguiente ejemplo se describe la configuración requerida que permite generar respuestas basadas en la IA de Google
Campo | Valor |
---|---|
Nombre | PruebaVertex |
Random dialog type action to continue the conversation | d_askVertex ----> '¿En que te puedo ayudar? ' |
Expresión que define el prompt de entrenamiento | 'responde las siguientes preguntas en base a la pagina https://resources.lynn.cx/' |
LOCATION_ID | us-central1 |
PUBLISHER | |
MODEL | text-bison@001 |
Temperatura | 0.7 |
MAX OUTPUT TOKENS | 150 |
TOP P | 0.95 |
TOP K | 40 |
Certeza (1-100) con la que se identifica la intención | 85 |
[Si se alcanza el máximo de intentos fallidos, el flujo de acción se interrumpirá y la descripción del error se pasará a la intención seleccionada con el nombre: 'vertexAi_Error'] | Error_Handler |
[PROJECT ID] | my-gcp-project |
[PRIVATE KEY ID] | abcdef123456 |
[PRIVATE KEY] | nMIIEvAIBADANBgkqhki |
[CLIENT EMAIL] | my-service-account@my-gcp-project.iam.gserviceaccount.com |
[CLIENT_ID] | 12345678901234567890 |
Salida:
1. La intención de inicio ejecuta inmediatamente la configuración realizada en el módulo de extensión VertexAI.
2. La evaluación cognitiva cumple con las condiciones para ejecutar la intención configurada en el entrenamiento de la intención.
3. Si la certeza configurada no supera el umbral Vertex seguirá generando respuestas a las consultas del usuario.