Inteligencia Artificial: Creación de contenido periodístico a partir de imágenes

En este proyecto integro GPT-4 Vision (GPT-4V) en el editor Gutenberg como un bloque que permite generar un informe, nota o artículo periodístico a partir de una imagen.

Para esta propuesta  de visión por computadora se programó un complemento (Plugin) de Wordpress que se enlaza a la Interfaz de Programación de Aplicaciones (API) de GPT-4V.

Esta conexión entre GPT con Visión y Wordpress es posible por la puesta a disposición de OpenAI del API de GPT-4 with Vision, desde el 06 de noviembre del 2023, por supuesto, hay que pagar tarifa por los token consumidos.

Las capacidades de visión por computadora de GPT-4V se precisa como una herramienta flexible y útil para el periodista al engranarse en el flujo natural del proceso de redacción.

Vídeo Demostrativo

En una segunda parte de este proyecto vamos a habilitar de procesamiento de varias imágenes a la vez.

Hay que señalar que a la fecha de este artículo, no es posible realizar un ajuste fino, es decir, no se puede modificar, por ejemplo, la temperatura. Sin embargo si se puede limitar el número de tokens.

Ventajas para la Redacción

Esto significa más tiempo para el análisis profundo y menos para la redacción básica. La velocidad trae consigo retos como la verificación y la ética, dos cuestiones que hacen la diferencia entre el periodista profesional y un aficionado. Se necesita un ojo humano para discernir matices, confrontar fuentes y asegurar la precisión.




Entradas más populares de este blog

Visión por Computadora: Contador de rostros

Captura de Emociones en tiempo real con Inteligencia Artificial