Este artículo explora la integración de inteligencia artificial (IA) en el Archivo de RTVE para generar automáticamente metadatos y mejorar la accesibilidad de contenidos audiovisuales. La IA se ha implementado para optimizar la catalogación y recuperación de colecciones filmadas, especialmente los fondos más antiguos de RTVE. Desde las primeras pruebas en 2017 hasta la implementación de servicios en 2021 y 2023, se han mejorado 16.000 horas de contenido mediante tecnologías avanzadas de IA, como Whisper de OpenAI y GPT-3.5. Se describe la arquitectura del sistema, el flujo de archivos y los procesos de validación, abarcando tareas como transcripción automática, identificación de hablantes, reconocimiento facial y de caracteres, detección de objetos y logos, y descripción de imágenes. Se analizan resultados y desafíos futuros, destacando la importancia de casos de uso específicos para RTVE. La IA ha mejorado la infraestructura tecnológica del archivo, optimizando el metadatado y recuperación de contenidos. Se subraya la importancia de una comunicación transparente, formación continua del personal y la supervisión humana de la IA. A largo plazo, la combinación de IA y estrategias puede mejorar la preservación y accesibilidad de contenidos históricos valiosos.
This article explores the integration of artificial intelligence (AI) in the RTVE Archive for automatic metadata generation and improved accessibility of audiovisual content. AI has been implemented to optimize cataloging and content retrieval, particularly for RTVE’s oldest filmed collections. From initial tests in 2017 to the implementation of services in 2021 and 2023, 16,000 hours of content have been enhanced using advanced AI technologies like OpenAI’s Whisper and GPT-3.5. The system’s architecture, file workflow, and validation processes are described, covering tasks such as automatic transcription, speaker identification, facial and optical character recognition, object and logo detection, and natural language image description. Results and future challenges are analyzed, emphasizing the importance of specific use cases for RTVE. AI has improved the technological infrastructure of the archive, optimizing metadata and content retrieval. The importance of transparent communication, continuous staff training, and human supervision of AI is highlighted. In the long term, combining AI with strategic actions can enhance the preservation and accessibility of valuable historical content.