Introducción del afinamiento visual
OpenAI ha anunciado la incorporación del afinamiento visual en su API de GPT-4o, permitiendo a los desarrolladores personalizar el modelo no solo con texto, sino también con imágenes. Esta nueva funcionalidad potencia la comprensión visual del modelo, facilitando aplicaciones avanzadas como búsquedas visuales mejoradas, detección de objetos en vehículos autónomos y análisis más preciso de imágenes médicas.
¿Cómo funciona el afinamiento visual?
El proceso de afinamiento visual es similar al afinamiento basado en texto. Los desarrolladores preparan sus conjuntos de datos de imágenes siguiendo el formato requerido y los suben a la plataforma de OpenAI. Con tan solo 100 imágenes, es posible mejorar significativamente el desempeño de GPT-4o en tareas visuales, y obtener mejores resultados al aumentar la cantidad de datos de texto e imagen utilizados en el entrenamiento.
Casos de uso destacados
Empresas como Grab, Automat y Coframe ya están aprovechando el afinamiento visual. Grab ha mejorado la detección de señales de tráfico y el conteo de carriles, Automat ha incrementado la tasa de éxito de sus bots para automatizar procesos empresariales, y Coframe ha optimizado la creación de contenido digital consistente. Estas implementaciones demuestran el impacto positivo del afinamiento visual en diversas aplicaciones reales.
Seguridad y privacidad
OpenAI garantiza la seguridad y privacidad de los datos utilizados en el afinamiento visual. Los modelos afinados están bajo el control total de los desarrolladores, quienes poseen la propiedad completa de sus datos empresariales. Además, OpenAI no entrena sus modelos con los datos de entrada o salida sin el permiso explícito de los usuarios, asegurando el cumplimiento de las políticas de uso y los compromisos de privacidad empresarial.
Disponibilidad y precios
El afinamiento visual ya está disponible para todos los desarrolladores en los niveles de pago de OpenAI. Actualmente, se ofrece un millón de tokens de entrenamiento diarios de forma gratuita hasta el 31 de octubre de 2024. Posteriormente, el costo será de $25 por millón de tokens de entrenamiento y $3.75 por millón de tokens de entrada, además de $15 por millón de tokens de salida. Para comenzar, los desarrolladores pueden acceder al panel de afinamiento y seguir las guías proporcionadas por OpenAI.
Expansión de ChatGPT en español
La introducción del afinamiento visual fortalece las capacidades de ChatGPT en español, permitiendo a los desarrolladores hispanohablantes crear aplicaciones más sofisticadas y adaptadas a las necesidades del mercado mexicano. Esta mejora facilita la integración de inteligencia artificial avanzada en diversas industrias locales, promoviendo la innovación tecnológica y el crecimiento en la región de habla hispana.