AXYZ design personas 3D, modelos 4D escaneados y Software de animación

Autor:AXYZ DESIGN
Fecha:20-09-2023

EXPLORANDO EL IMPACTO DE LA IA

¿LA IA ESTÁ CAMBIANDO LOS FLUJOS DE TRABAJO DE VISUALIZACIÓN ARQUITECTÓNICA?

ENTREVISTA A FRANCESCO TESTA DE PROMPT

Imagen realizada por Prompt Studio, utilizando Midjourney AI.

Todos los días somos testigos de avances notables en el campo de la inteligencia artificial, con soluciones cada vez más impresionantes que a veces evocan admiración y, en ocasiones, generan preocupación.

En AXYZ, como desarrolladores de software, y ustedes, en su rol de artistas, es natural preguntarse cómo podemos aprovechar al máximo estas nuevas tecnologías. ¿De qué manera podrían enriquecer nuestras tareas diarias? ¿Podrían estas tecnologías contribuir a mejorar nuestras imágenes y productos? Y, en definitiva, ¿son accesibles para todos?

Para arrojar luz sobre estas cuestiones, hemos tenido el privilegio de entrevistar a Francesco Testa, fundador y mente creativa detrás del estudio catalán Prompt. Este estudio creativo es ampliamente reconocido por su capacidad de dar vida a proyectos arquitectónicos a través de visualizaciones cautivadoras, animaciones y experiencias de recorridos virtuales de 360°.

Antes de continuar, permítame expresarle nuestro más sincero agradecimiento por brindarnos la valiosa oportunidad de profundizar en los proyectos y trabajos realizados en su estudio. Además, estamos encantados de que haya aceptado participar en esta breve entrevista.

El año pasado, el tema de conversación predominante fue el Metaverso, pero un año después, parece que la Inteligencia Artificial (IA) ha tomado protagonismo. ¿Considera que esto es un fenómeno pasajero o una tendencia genuina?

Es perfectamente comprensible hacer una comparación entre el Metaverso y la inteligencia artificial, ya que ambos recibieron mucha atención y cobertura en los medios. Sin embargo, creemos que son dos conceptos diametralmente opuestos, y ahí es donde radica la longevidad de uno sobre el otro, al menos por ahora. El Metaverso es un concepto que transforma nuestro espacio físico en digital, creando la sensación de salvar distancias e intentar humanizar las relaciones digitales a través de proyecciones "optimistas" de nosotros mismos, conocidas como avatares. La necesidad de crear este nuevo mundo digital se vio fuertemente impulsada por la sensación de aislamiento provocada por la pandemia de COVID-19, impulsada por importantes intereses económicos que buscaban replicar las "necesidades" existentes en el mundo real en el ámbito digital. Para sorpresa de muchos, tanto particulares como empresas, la reacción predominante tras la pandemia fue volver al contacto físico humano y disfrutar nuevamente de los espacios naturales que habían estado restringidos durante ese período, en lugar de sumergirse en un mundo digital observado. a través de gafas. Esto marcó el comienzo del declive del Metaverso. Las grandes empresas tuvieron que absorber pérdidas multimillonarias en inversiones relacionadas con Metaverse, y surgió el escepticismo sobre el concepto en sí hasta el punto de que el principal promotor se vio obligado a silenciarlo. Justo en ese momento, casi sin previo aviso, surgió la IA y relegó al Metaverso al olvido. La IA surgió como resultado de muchos años de investigación y, por razones que aún no podemos catalogar como positivas o negativas, se volvió accesible al público en general incluso en su fase de desarrollo, generando una enorme cantidad de datos que llevaron a un crecimiento exponencial. Una diferencia significativa entre la IA y el Metaverso es que, a pesar de que algunas empresas importantes le atribuyen su éxito, la base de la IA es el código abierto, lo que permite a cualquiera utilizar diferentes modelos de IA libremente. Esta misma característica también permite a los usuarios mejorar y crear nuevos modelos, brindando una velocidad y libertad que el Metaverso nunca tuvo.

En otras palabras, si el Metaverso continuara desarrollándose, probablemente dependería de herramientas de inteligencia artificial. En esencia, la base tecnológica de gran parte del nuevo software será creada y respaldada por la IA. No creemos que esto sea una moda pasajera; más bien ha venido para quedarse. Puede compararse con lo que fue la revolución industrial para el mundo en su época. Actualmente tenemos la oportunidad de vivir la revolución tecnológica, que probablemente cambiará nuestra forma de vivir. En muy poco tiempo se han producido avances importantes en diversos campos como la medicina, la física, la educación, etc., generando numerosas cuestiones relacionadas con el empleo, la economía y la ética.

¿Habéis realizado pruebas específicas utilizando estas nuevas tecnologías?

Sí, impulsados principalmente por la curiosidad y la necesidad de comprender cómo estas nuevas herramientas podrían ayudarnos en nuestro trabajo, comenzamos a utilizar Dall-e casi de inmediato para crear reconstrucciones de partes de ciudades en imágenes fijas. Esta fue una tarea que nos habría llevado mucho más tiempo en Photoshop. Poco después surgió Midjourney y comenzamos a utilizarlo para realizar visualizaciones iniciales de las ideas de nuestros clientes. Estas imágenes les ayudaron a guiarnos sobre la dirección que debe tomar cada imagen. También comenzamos a desarrollar breves introducciones a las animaciones para algunos proyectos en Midjourney utilizando imágenes fijas, que luego animamos en After Effects. Paralelamente, seguimos aprendiendo a utilizar, a través de prueba y error, la herramienta que sin duda es la más poderosa para nuestro tipo de trabajo: Difusión Estable. Con él, pasamos de experimentos de animación a realizar correcciones complejas en imágenes fijas, mejorar texturas, agregar detalles orgánicos a las imágenes e incluso crear personajes aún más realistas basados en recursos de personas AXYZ anima® PRO / ALL 3D y 4D. También utilizamos modelos de generación de voz para crear borradores iniciales de animación con locuciones, lo que nos permitió perfeccionarlos con el cliente y el guionista antes de contratar a un actor de doblaje profesional.

¿Qué tipo de resultados has obtenido hasta ahora? ¿Son resultados puramente experimentales o habéis tenido la oportunidad de aplicarlos en proyectos o servicios concretos?

Dado que estas herramientas evolucionan continuamente, todavía no hay mucha información sobre cómo usarlas de manera efectiva, por lo que requiere mucho ensayo y error. Gracias a que una parte del estudio todavía estaba involucrada en la producción del proyecto en curso, otra parte pudo dedicar algo de tiempo a la investigación. Ahora hemos llegado a un punto en el que podemos compartir e implementar este aprendizaje en todo el estudio. Sin embargo, nos sorprendió gratamente la rapidez con la que pudimos integrar estas herramientas de IA en proyectos reales. Todos sabemos que en nuestra industria a menudo trabajamos con plazos ajustados y no hay mucho margen de error, y mucho menos para la experimentación. Aquí es donde radica la importancia de estas nuevas herramientas, ya que agilizan los procesos y nos brindan ideas y soluciones que quizás nunca antes hubiéramos considerado, todo a una velocidad impresionante.

Sin embargo, no ha estado exento de desafíos. Por ejemplo, creamos un vídeo que incorporaba un nuevo enfoque narrativo para la introducción de un proyecto, pero el cliente nos pidió que descartáramos toda la introducción que se generó utilizando imágenes de Midjourney. Dudaban en mostrar imágenes de aspecto tan artificial y, al final, no pudimos determinar si se trataba de una preferencia personal o simplemente de una falta de comprensión de la herramienta y sus capacidades. Tuvimos que reemplazar todas las imágenes de calidad FullHD que habíamos creado con videos de archivo pixelados. Por eso entendemos que todo esto es parte de un proceso, tanto de enseñanza como de aprendizaje, similar a cómo AutoCAD inicialmente encontró resistencia en el mundo del dibujo arquitectónico 2D. Al principio mucha gente estaba en contra del dibujo asistido por ordenador, pero ahora, más de 20 años después, es una de las herramientas de dibujo más populares.

¿Podrías hablarnos de alguno de ellos?

Recientemente, uno de nuestros clientes estaba desarrollando un proyecto en una isla del Mar Rojo y quería que el vídeo de presentación del proyecto fuera algo más que arquitectónico; querían que tuviera un fuerte componente narrativo. Nos escribieron:

Para la introducción del vídeo, necesitamos contar la historia de los peregrinos durante la migración (hégira 620 d.C.) que, mientras cruzaban el Mar Rojo en sus característicos Dhows (barcos), naufragaron en una isla prácticamente desierta. La poca madera que logran rescatar de las embarcaciones la utilizan para quemar y crear señales de humo, pero nunca son rescatados, por lo que deciden instalarse en la isla, desarrollando una arquitectura a base de coral, algas, estuco y troncos piramidales. formas. Después de unos años, el único manantial de la isla se seca y con él la pequeña civilización desaparece, dejando sólo los restos de esta arquitectura única. Necesitamos crear una transición genial para transmitir que han pasado 1400 años y que estamos en el presente, viendo nuestra propuesta de proyecto, que incorpora muchas características de la arquitectura de la isla.

Todo esto justo un mes antes de la fecha límite, produciendo 16 imágenes y una animación 3D de 2 minutos del propio proyecto... Hace un año, la respuesta habría sido: "Es imposible hacer esto, o costará proporcionalmente a tanto como hacer 'Avatar: El sentido del agua'". Pero, afortunadamente, pudimos proporcionar una solución viable. Lo que hicimos primero fue crear un chat específico en GPT-4 sobre el período Hégira, preguntando cómo podían vestirse los peregrinos, sus costumbres, cómo eran sus dhows, qué herramientas utilizaban, etc. Reunimos mucha información que nos ayudaría a crear una representación imaginaria de ese período. Luego, copiamos y pegamos las instrucciones de Midjourney sobre las indicaciones de texto que deberían usarse para generar imágenes. También le dimos a GPT-4 varios ejemplos de indicaciones que habían generado imágenes fotorrealistas. Con toda esta información, comenzamos a pedirle a GPT-4 que escribiera indicaciones para generar imágenes para cada parte del script proporcionado por nuestro cliente. De esta manera, creamos una narrativa a través de imágenes, generando literalmente cientos de imágenes antes de encontrar una que funcionara bien y, gradualmente, la narrativa se fue conformando. Luego, hicimos algunos ajustes a las imágenes con Photoshop Beta (usando también sus nuevas herramientas de IA), y en After Effects animamos algunos elementos y agregamos un efecto de paralaje. Con música, sonido y algunos otros efectos, pudimos lograr un fuerte componente narrativo, tal como el cliente quería.

¿Cuál es su visión para el futuro? ¿Cómo crees que estas herramientas están transformando o transformarán el trabajo de un artista, si aún no lo han hecho?

Creemos firmemente que los artistas no deberían sentirse amenazados por esta tecnología. Su papel, no como artesanos sino como artistas, debería ser crear más allá de las herramientas, discernir cuál de las 100 imágenes generadas en minutos es la correcta, la que funciona con las demás. Los artistas deberían tener la capacidad de aceptar la cantidad; La cantidad se ha convertido en un elemento más del proceso creativo. Olvidemos el debate entre "cantidad versus calidad". Perdamos el miedo a que nuestro estilo nos pertenece y que esta tecnología nos lo robe para que otros lo utilicen sin sentido. Se nos ofrece un mundo infinito de estilos que crearán otros estilos, y recordemos que probablemente así es como llegamos a nuestro estilo en primer lugar. Somos especialistas en herramientas de creación de imágenes, y esta es sólo una herramienta más. Convirtámonos en expertos en esta herramienta y no tengamos miedo de perder clientes, porque no serán expertos y sólo arañarán la superficie de esta herramienta. En cierto modo, la IA está democratizando gran parte del mundo artístico que antes estaba reservado a grandes producciones con actores, decorados, cámaras, etc. Ahora, con una tarjeta gráfica decente, imaginación e ingenio, una sola persona puede lograr cosas bastante buenas. resultados. Y esta es simplemente la capacidad de reproducir/imitar una forma de lenguaje existente. El verdadero desafío para los artistas es encontrar un lenguaje completamente nuevo para la IA. Esta debería ser nuestra única preocupación. Sin duda, todo esto está transformando y seguirá transformando la forma en que trabajamos. Lo importante es entender, desde una perspectiva profesional, el potencial de lo que podemos lograr con estas herramientas. Vemos que las poderosas IA gráficas ya han revolucionado la forma en que presentamos el contenido digital. Un solo vistazo a cualquiera de las plataformas de redes sociales muestra cómo el contenido digital se crea cada vez más con IA.

Hoy en día, ya vemos herramientas de edición de fotografías que aplican soluciones de IA a aplicaciones específicas de IA. ¿Crees que en el futuro esta tecnología podría aplicarse al software de renderizado? ¿Qué características o capacidades revolucionarias imagina que podría ofrecer esta fusión en el software de renderizado?

Dada la velocidad a la que se ha desarrollado esta tecnología durante el último año, creemos que es sólo cuestión de tiempo antes de que funcione eficazmente en el software de renderizado. Recuerde, no se trata solo del resultado visual/gráfico que la IA puede generar, sino también de su capacidad para aprender y mejorar a medida que se utiliza y recibe retroalimentación basada en su desempeño. Por ejemplo, un motor de renderizado podría mejorar significativamente los tiempos de renderizado si realizara el mismo renderizado varias veces con pequeñas modificaciones en la configuración y registrara los resultados para repetirlos en situaciones similares. Además, hay un aspecto fundamental de las imágenes generadas por IA, y es que cada generación se rige por un parámetro aleatorio llamado "semilla", que puede fijarse (para replicar los resultados) o mantenerse aleatorio. Este modo aleatorio puede generar ideas (de encuadre, iluminación, texturas, modelado) en las que el artista nunca habría pensado. Si se presta especial atención se pueden conseguir resultados realmente sorprendentes. No sería descabellado pensar que en algún momento, el software de renderizado podría implementar esta funcionalidad al servicio de la creatividad del artista. Ciertamente, no sólo mejorará el software de renderizado sino que también revolucionará el modelado 3D. Hasta ahora, el modelado 3D ha sido una parte de la creación digital que requería mucho tiempo. Imagínese por un momento si se pudieran dibujar objetos 3D mediante indicaciones. Especialmente en el caso del modelado arquitectónico, los valores con los que trabajamos son enteramente geométricos y matemáticos, es decir, medibles y precisos. Es probable que estos valores se puedan ingresar mediante indicaciones en una plataforma de inteligencia artificial. Esto nos permitiría mecanizar procesos tediosos y repetitivos. Por poner un ejemplo, sería como tener a mano un asistente virtual de dibujo 3D.

Observamos que la mayoría de las herramientas de IA funcionan principalmente a través de indicaciones de texto. Sin embargo, dado que son artistas gráficos, ¿las entradas naturales no serían imágenes, trazos o paneles de estado de ánimo? ¿Cuál es su perspectiva sobre este enfoque?

En realidad, la gran mayoría de la IA que genera imágenes ha integrado la capacidad de recibir información visual. De hecho, para nuestro trabajo, es crucial contar con estas extensiones/opciones proporcionadas por diferentes plataformas. La más versátil y potente de todas (aunque menos amigable) es Stable Diffusion, a la que se le pueden añadir varias extensiones tremendamente útiles:

ControlNet:
Es una extensión que analiza una imagen proporcionada por el usuario y tiene muchos modos de detección diferentes. Una vez que se detecta el elemento deseado por el usuario, se le puede indicar mediante mensajes de texto que modifique solo esa parte seleccionada. Por ejemplo:

El "modo OpenPose" nos permite determinar la posición de figuras humanas en imágenes (cuerpo, manos, rostros, etc.). Con este modo podremos detectar la posición de un personaje de personas AXYZ anima® PRO / ALL 3D y 4D ya integrado en una escena. Manteniendo el ángulo de la cámara y la iluminación, podemos crear variaciones aún más realistas de ese mismo personaje, que luego se pueden componer en Photoshop.
El "modo de referencia" se utiliza para copiar el estilo de una imagen y aplicarlo a otra.
El "modo de profundidad" sirve para detectar volúmenes en el espacio de una imagen y luego reproducirlos en otra imagen.
El "modo Hed" detecta pequeños detalles que determinan los contornos de diferentes elementos en una imagen. Esta es una de las extensiones más poderosas y está en constante evolución gracias a las aportaciones de los usuarios.

SD Ultimate Upscaler:
Esta extensión se utiliza para escalar, reconstruir y agregar detalles a imágenes de baja resolución. Todos nos hemos encontrado con situaciones en las que un cliente solicita una textura muy específica y nos envía una foto de 75x75px pero quiere que esa textura cubra el 80% de una imagen de 4000 px. Anteriormente, hubiéramos pasado horas intentando replicar esa textura. Ahora, gracias a esta extensión, podremos utilizar exactamente la misma textura que el cliente desee sin perder calidad.

Inpaint:
Permite dibujar sobre una imagen sólo lo que queremos modificar con un mensaje de texto.

Outpaint:
A partir de la misma imagen, genera contenido más allá de los límites del marco de la imagen original. Estas son sólo algunas de las extensiones disponibles para que los usuarios creen imágenes basadas exclusivamente en entradas visuales. Lo maravilloso de todo esto es que el desarrollo de estas herramientas, al ser de código abierto, depende de las aportaciones de los usuarios y desarrolladores y no únicamente de una empresa motivada únicamente por intereses económicos.

De cara al futuro, ¿cómo visualiza una posible evolución del trabajo que realiza actualmente?

Actualmente, se han logrado avances notables en la generación de imágenes estáticas. Sin embargo, el desafío importante reside en la animación. Hasta este punto, el funcionamiento intrínseco de varios sistemas de IA implica generar un cuadro a la vez, que se interpreta como independiente. Esto puede provocar cierta inestabilidad o falta de coherencia entre fotogramas, haciendo que toda la imagen parezca algo "temblorosa" durante la reproducción. Es probable que esta inestabilidad se resuelva con el tiempo. Sin embargo, como se mencionó anteriormente, la perspectiva más intrigante es el desarrollo de un lenguaje visual que no se limite a imitar lo que ya hacemos, sino que acepte estas inconsistencias e inestabilidades visuales, viéndolas no como errores sino como virtudes. Nuestras aspiraciones para el futuro cercano tienen sus raíces en la búsqueda de este nuevo modo de expresión.

Para concluir, me gustaría preguntarte, desde tu perspectiva como usuario y artista, ¿cómo imaginas una versión futura de nuestro producto estrella, anima® PRO / ALL?

Si podemos permitirnos pensar más allá de las complejidades técnicas, podríamos imaginar una versión futura de anima® PRO / ALL donde aproveche su extensa base de datos de movimientos humanos y entradas visuales de individuos (etnias, vestimenta, situaciones) y los interprete usando herramientas similares. a OpenPose. Esta futura anima® permitiría a los usuarios ingresar (o seleccionar de una lista limitada) un movimiento y una descripción física de un personaje, y luego generaría una malla 3D consistente para integrarla en la escena. Esto proporcionaría a los usuarios una increíble libertad creativa y haría que cada proyecto, ya sean imágenes estáticas o animaciones, fuera verdaderamente único. Entendemos que todavía estamos lejos de desarrollar algo como esto, pero considerando todo lo que hemos presenciado en sólo un año en el ámbito de la IA, no nos sorprendería que fuera posible en un futuro próximo. Si bien somos entusiastas y promotores del desarrollo de la IA, también nos preocupa el posible uso indebido de estas herramientas, usos que se alejan de la herramienta en sí pero que, no obstante, son peligrosos. Es nuestra responsabilidad investigar y seguir desarrollando la IA, pero al mismo tiempo debemos dedicar tiempo a comprender las implicaciones sociales que conlleva y estar preparados para adaptarnos a un mundo donde esta tecnología juega un papel fundamental. Muchas de las cosas que hemos discutido en esta entrevista se basan en nuestras propias experiencias usando la IA en nuestro trabajo. Es posible que nos equivoquemos en alguna de nuestras reflexiones o que hayamos mencionado ciertos procesos de manera un tanto superficial. Por lo tanto, estamos completamente abiertos a mantener una conversación sobre estos temas o abordar cualquier duda que pueda surgir.

ALGUNOS EJEMPLOS DE RENDERIZADOS MEJORADOS POR IA

ACERCA DEL ARTISTA

El estudio creativo es un equipo establecido con sede en Barcelona con más de una década de experiencia internacional. Cuentan con un grupo diverso de profesionales de diversos orígenes y culturas, que brindan una perspectiva integral para los procesos creativos y ofrecen soluciones visuales personalizadas. En el panorama global altamente visual de hoy, donde las imágenes sirven como lenguaje universal para promover ideas y proyectos, se especializan en ofrecer renderizados, animaciones, recorridos virtuales, folletos de ventas y sitios web de primer nivel. Su flujo de trabajo eficiente gira en torno a captar la visión única del cliente, cumplir con los plazos y presentar opciones integrales y rentables. Sus servicios principales abarcan renders, animaciones, recorridos virtuales, folletos de ventas y sitios web.

Para ponerse en contacto con ellos, consulte su información de contacto a continuación:
https://www.promptcollective.com/contacto

Tags

Reading time

Blog

EXPLORANDO EL IMPACTO DE LA IA

¿LA IA ESTÁ CAMBIANDO LOS FLUJOS DE TRABAJO DE VISUALIZACIÓN ARQUITECTÓNICA?

ENTREVISTA A FRANCESCO TESTA DE PROMPT

ALGUNOS EJEMPLOS DE RENDERIZADOS MEJORADOS POR IA

ACERCA DEL ARTISTA

Su carrito está vacío.