Leer Novelas
  • Completado
  • Top
    • 👁️ Top Más Vistas
    • ⭐ Top Valoradas
    • 🆕 Top Nuevas
    • 📈 Top en Tendencia
Avanzado
Iniciar sesión Registrarse
  • Completado
  • Top
    • 👁️ Top Más Vistas
    • ⭐ Top Valoradas
    • 🆕 Top Nuevas
    • 📈 Top en Tendencia
  • Configuración de usuario
Iniciar sesión Registrarse
Anterior
Siguiente

Giro de la Suerte: Programación Divina - Capítulo 113

  1. Inicio
  2. Giro de la Suerte: Programación Divina
  3. Capítulo 113 - 113 Capítulo 113 Añadir nuevas funciones
Anterior
Siguiente
Configuración
Tamaño de Fuente
A A 16px
Tipo de Fuente
Color de Fondo

113: Capítulo 113: Añadir nuevas funciones 113: Capítulo 113: Añadir nuevas funciones Ya solo en la habitación, Jeff decidió que era el momento perfecto para mejorar su tecnología actual.

Su atención se centró en RAZi.

Planeaba mejorarla añadiendo generación de imágenes, síntesis de voz y creación de video.

La interfaz gráfica ya era asombrosa y tenía un aspecto de alta tecnología, lo que la hacía fluida y limpia.

Con todo listo, comenzó su trabajo.

Empezó abriendo la carpeta de plugins de RAZi y creando un nuevo archivo llamado razi_plugins/imagegen.py.

Dentro del archivo, definió una función llamada generate_image(prompt).

Esta función procesaba una instrucción de texto y usaba el motor de Diffusión Estable para generar una imagen, devolviendo la ruta al archivo creado.

Para conectarlo con la interfaz de usuario, actualizó interface.py introduciendo una nueva ruta, lo que permitía a los usuarios introducir una instrucción directamente y recibir una salida visual del sistema.

Definió una ruta en la aplicación para gestionar las solicitudes de generación de imágenes, aceptando específicamente solicitudes POST para procesar una instrucción de texto y devolver la imagen generada.

Esto permite que las instrucciones del front-end se envíen a la función generate_image().

En el front-end, creó una sección HTML llamada «Generador de Imágenes», que incluía un formulario con un campo de entrada para que los usuarios escribieran sus instrucciones y un botón de envío para mandar estas instrucciones a RAZi.

Además, añadió un área de vista previa de la imagen para mostrar la imagen generada tras recibirla del back-end.

Con esta configuración, RAZi ahora era capaz de transformar descripciones textuales en representaciones visuales, desde personajes de anime hasta intrincados mundos de fantasía, todo con una sola línea de texto.

Una vez terminado, pasó a lo siguiente: abrió el directorio de plugins y creó un nuevo archivo: razi_plugins/voicegen.py.

Dentro de él, definió una función que convertía texto en voz usando un motor de texto a voz instalado localmente, permitiendo la selección de diferentes perfiles de voz a través del parámetro de voz.

Configuró el motor para que usara una voz femenina suave y tranquilizadora, ajustando la configuración de tono, velocidad y acento hasta que sonó natural y elegante, como una asistente digital con calidez.

Luego, en interface.py, añadió una nueva ruta.

Esta ruta se configura en la aplicación para procesar solicitudes POST, tomando la respuesta de la IA y dirigiéndola a la función speak_text para crear un archivo de audio.

En el front-end, justo debajo de cada respuesta, añadió una nueva línea donde se incrusta el reproductor de audio para permitir a los usuarios oír las respuestas habladas de RAZi.

Le añadió un botón de [Reproducir Voz] que, al ser presionado, activaba la reproducción instantánea del audio, permitiendo a los usuarios oír la salida de voz.

Cuando hizo la prueba y pulsó el botón de reproducir, RAZi respondió con una suave voz femenina.

—Hola, dueño.

¿Qué te gustaría crear hoy?

Jeff hizo una pausa, escuchando la impecable dicción, mientras asentía con satisfacción.

—Eso está mejor.

Por fin tienes una voz.

Esto le hizo pensar en una película del universo Marvel.

En comparación con esas IA de ficción de alta gama, sentía que a su creación todavía le quedaba un largo camino por recorrer.

Así que decidió ir más allá.

Ahora que la generación de voz funcionaba a la perfección, era el momento de mejorarla un poco.

Abrió un nuevo archivo y lo llamó razi_plugins voiceassistant.py.

Este serviría como la base para convertir a RAZi en una verdadera asistente controlada por voz.

Dentro de él, creó la función base para procesar entradas y proporcionar respuestas dinámicamente, convirtiéndola en una parte clave de las capacidades interactivas del sistema.

Esta nueva función activaba el micrófono, permitiéndole escuchar la voz de Jeff y convertir su habla en texto mediante reconocimiento de voz.

Luego lo pasaría al cerebro de RAZi para su procesamiento y después verbalizaría la respuesta con una voz femenina.

Integró una biblioteca de reconocimiento de voz que capturaba la entrada en tiempo real y la conectó directamente al módulo de texto a voz existente, creando un sistema de interacción por voz fluido y receptivo.

En la interfaz de Flask, añadió una nueva función con un botón de activación que etiquetó como:
[Modo de Voz ENCENDIDO/APAGADO]
Esto permite a RAZi operar en modo de escucha pasiva, así que, internamente, cuando el Modo de Voz está activo, el oyente esperará la frase de activación.

Una vez activado, grabará su pregunta, la convertirá en texto y luego la enviará a través de RAZi.reply().

La respuesta se sintetiza y reproduce inmediatamente.

Con eso, comenzó a probarlo.

[Jeff: Oye, RAZi, ¿qué tiempo hace en Tokio?]
[RAZi: Según los últimos datos, en Tokio hay actualmente 27 grados con lluvia ligera.]
Por un momento se detuvo y luego volvió a hablar.

[RAZi: ¿Quieres que te ponga un recordatorio para el paraguas mañana?]
[Jeff: No, gracias.]
[RAZi: Entendido.]
No pudo evitar sonreír mientras veía a RAZi responder.

Ahora tenía la capacidad de pensar y hablar por sí misma.

—Tarde o temprano, te convertirás en Jarvis —susurró con un toque de orgullo en su voz.

Con eso, apagó el modo de voz.

Si no lo hacía, RAZi seguiría escuchando continuamente, y eso era algo que quería evitar por ahora.

No lo graba todo, pero mantiene un hilo de micrófono ligero funcionando en segundo plano, escaneando continuamente su patrón de voz.

En cuanto detecta la forma de onda, el tono o la frase clave correctos, se activa.

Así que, aunque esté programando, comiendo o tumbado en la cama, RAZi sigue ahí, esperando su respuesta.

Una vez hecho eso, abrió un nuevo archivo llamado videogen.py dentro de la carpeta de plugins de RAZi.

Lo que pretendía construir estaba inspirado en el famoso generador de video de su mundo, «SORA».

Su objetivo era entrenar a RAZi para crear videos completos desde cero, dando vida a las escenas usando nada más que lenguaje puro.

Al igual que SORA, quería que RAZi transformara las palabras en movimiento, convirtiendo la imaginación en una realidad vívida y animada.

Ya no se trataba de la presentación, se trataba de dar a RAZi el poder de la visión, el movimiento y la narrativa.

Comenzó definiendo una función llamada generate_video(prompt), que permitía al sistema procesar texto descriptivo y descomponerlo en escenas visuales.

Esta función se vinculaba directamente a su motor de texto a video, un modelo de difusión que entrenó usando clips cinematográficos cortos, transiciones y patrones de movimiento de fotogramas.

Aprendió a animar la niebla a la deriva, las luces parpadeantes, personajes caminando o incluso una cámara desplazándose lentamente por un paisaje urbano.

Al interpretar cada instrucción como un plano de escena, RAZi ahora podía generar movimiento dinámico en lugar de imágenes planas.

Para hacerlo totalmente inmersivo, Jeff también integró la narración de voz en el video usando el módulo de generación de voz que había escrito antes.

Añadió una opción para que los usuarios eligieran su tipo de voz preferido, como masculina, femenina o robótica, y luego superpuso el audio hablado directamente sobre la secuencia animada.

El resultado ya no era un clip con música de fondo o subtítulos, sino un cortometraje narrado y autocontenido, completo con sincronización, emoción y presencia de cámara.

Añadió esto a la interfaz como una nueva pestaña llamada [Generador de Video], completa con entrada de instrucciones y panel de vista previa.

Jeff no hizo esto solo para aparentar, sino porque creía que la interacción con una IA debería sentirse viva y no estática.

Ya fuera para contar historias, explicaciones educativas, simulaciones visuales o pura creatividad, RAZi ahora podía convertir los pensamientos en imágenes en movimiento.

Imaginó a estudiantes usándola para crear presentaciones escolares, a autores visualizando escenas de historias y a desarrolladores creando prototipos de secuencias cinematográficas, todo con una sola frase.

Con esto, RAZi había ido más allá de ser una herramienta; se había convertido en una directora, una narradora y una soñadora.

—Caray, ahora me siento mal por todos los animadores y artistas que vuelcan su talento en crear arte.

Si esto alguna vez se hace público, perderán sus trabajos, igual que en mi primer mundo —siseó por lo bajo.

Aunque el sistema principal ya era funcional, volvió a la primera función que había terminado.

Ahora que la base estaba completa, todo lo que quedaba era refinar y mejorar, así que necesitaba pulir cada parte hasta alcanzar la perfección.

Con eso, pasó muchas horas sin salir de su habitación, programando y mejorando a RAZi.

…

…

1.º: ¡Un agradecimiento especial a «Essos👑», la CABRA del mes, tanto por los generosos regalos como por los boletos dorados!

¡Mucho amor, hermano!

2.º: ¡Muchas gracias a «Pat_funding👑» por el apoyo incondicional desde el comienzo de mi viaje y por los boletos dorados y los regalos!

3.º: ¡Una mención especial para «Devon1234👑», la misma CABRA de este mes, por todos los increíbles regalos!

¡Eres absolutamente GENIAL!

Fuente: Webnovel.com, actualizado en Leernovelas.com

Anterior
Siguiente
  • Inicio
  • Acerca de
  • Contacto
  • Política de privacidad

© 2025 LeerNovelas. Todos los derechos reservados

Iniciar sesión

¿Perdiste tu contraseña?

← Volver aLeer Novelas

Registrarse

Regístrate en este sitio.

Iniciar sesión | ¿Perdiste tu contraseña?

← Volver aLeer Novelas

¿Perdiste tu contraseña?

Por favor, introduce tu nombre de usuario o dirección de correo electrónico. Recibirás un enlace para crear una nueva contraseña por correo electrónico.

← Volver aLeer Novelas

Reportar capítulo