Connect with us

Tecnología

Apple lanza una IA de código abierto para editar imágenes con lenguaje natural

Investigadores de Apple y la Universidad de California en Santa Bárbara han lanzado MGIE, un nuevo modelo de inteligencia artificial de código abierto que permite editar imágenes usando lenguaje natural.

Publicado

en

Los esfuerzos de Apple en el campo de la inteligencia artificial avanzan a paso firme, pese a que muchos piensen lo contrario. Investigadores de la firma de Cupertino se aliaron con la Universidad de California en Santa Bárbara (UCSB) para crear MGIE, un nuevo modelo de código abierto que permite editar imágenes usando lenguaje natural.

Es cierto que la web hoy se encuentra abarrotada de herramientas que permiten crear imágenes a partir de la inteligencia artificial generativa. Sin embargo, el esfuerzo de Apple y los expertos de la citada Universidad se ha enfocado en la “edición guiada”, sacando provecho de los modelos de lenguaje multimodales de gran escala (MLLM, por sus sigas en inglés).

De acuerdo con los desarrolladores de esta herramienta, MGIE interpreta la imagen y la orden que el usuario ingresa y procede a realizar la edición, incluso sin poseer mayor contexto sobre el material o la solicitud en sí misma. Así, por ejemplo, uno de los casos presentados es el de la fotografía de una pizza. Utilizando solamente la descripción “hazla más saludable”, la inteligencia artificial de Apple modificó la imagen para incluir tomates y hierbas sobre ella.

“MGIE consta de un MLLM y un modelo de difusión. El MLLM aprende a derivar instrucciones expresivas concisas y ofrece orientación visual explícita. El modelo de difusión se actualiza conjuntamente y realiza la edición de imágenes con la imaginación latente del objetivo previsto mediante un entrenamiento de extremo a extremo. De esta manera, MGIE se beneficia de la derivación visual inherente y aborda comandos humanos ambiguos para lograr una edición razonable. En el ejemplo […], es difícil captar lo que significa “saludable” sin un contexto adicional. Nuestro MGIE puede conectar con precisión ‘ingredientes vegetales’ con la pizza y conducir a la edición correspondiente según las expectativas humanas”.

De la mano de MGIE, los investigadores de Apple y la UCSB quieren demostrar que los modelos de lenguaje multimodales de gran escala pueden ayudar a que la edición de imágenes con inteligencia artificial sea más sencilla. En especial, facilitando las instrucciones necesarias para obtener los resultados deseados.

La nueva inteligencia artificial de Apple puede editar imágenes con lenguaje natural

La nueva inteligencia artificial de Apple puede editar imágenes con lenguaje natural | MGIE
Así funciona la nueva inteligencia artificial de Apple y la UCSB.

Los responsables del proyecto indican que las instrucciones humanas suelen ser demasiado breves para que los actuales métodos de edición con IA las entiendan y procesen correctamente. Así, afirman que usar un MLLM para esta tarea “mejora el control y la flexibilidad” al editar imágenes, sin necesidad de máscaras regionales o descripciones demasiado elaboradas.

Los ejemplos que han presentado hacen más sencillo comprender de qué se trata toda esta historia. Además de lo que ya mencionamos de la pizza, la inteligencia artificial de Apple puede realizar ediciones al estilo Photoshop. En una imagen se ve a un hombre en primer plano y a una mujer detrás de él, a lo lejos, sentada en un sillón. Con el comando “elimina a la mujer en el fondo”, MGIE modifica la foto para que solo el sujeto en primer plano sea visible. Pero no se limita a borrar a la mujer; también cambia el enfoque y lo centra en la expresión en el rostro del hombre.

Los expertos de UCSB y Apple han logrado, además, que la inteligencia artificial realice ediciones locales. Por ejemplo, que cambie lo que aparece en la pantalla de la foto de un ordenador, sin tocar el resto de la imagen. Como así también que pueda concretar optimizaciones globales, como subir el brillo o ajustar la definición del material, entre otras posibilidades.

Al tratarse de un proyecto de investigación, todavía no se sabe si Apple planea incorporar esta inteligencia artificial en su software disponible al público. No obstante, como indicamos al comienzo, deja en claro que los de Cupertino están prestándole cada vez más atención a este tipo de tecnologías. No olvidemos que los de la manzana introdujeron recientemente MLX, una herramienta que permite crear modelos de aprendizaje automático.

Si desean probar MGIE, pueden hacerlo directamente desde esta versión de prueba en Hugging Face Spaces. Aunque al ser un proyecto de código abierto, pueden descargar información, código y modelos preentrenados desde este repositorio en GitHub y probarlo por ustedes mismos.

Con información de Hipertextual

JE

Tecnología

La UE abre investigación contra TikTok por violación a normas de protección a menores

La Unión Europea abrió un “procedimiento formal” contra la red social TikTok, por posible violación de las normas en materia de protección a menores y transparencia, anunció este lunes el comisario europeo de Mercado Interior, Thierry Breton.

Publicado

en

La Unión Europea abrió un “procedimiento formal” contra la red social TikTok, por posible violación de las normas en materia de protección a menores y transparencia, anunció este lunes el comisario europeo de Mercado Interior, Thierry Breton.

“Abrimos hoy una investigación sobre TikTok por presunta violación de la transparencia y las obligaciones de proteger a los menores”, indicó Breton en la red X.

Se trata de la segunda investigación de este tipo en la UE a la luz de nueva regulación de las plataformas digitales, después de una indagatoria similar contra X.

En un comunicado, la Comisión Europea -el brazo ejecutivo de la UE- señaló que la investigación deberá evaluar también si TikTok violó la reglamentación vigente en materia de “acceso a datos, gestión de riesgo, diseño adictivo y contenido nocivo”.

La vicepresidenta ejecutiva de la Comisión, Margrethe Vestager, señaló que “TikTok necesita examinar de cerca los servicios que ofrece y considerar cuidadosamente los riesgos que representan para sus usuarios, tanto jóvenes como mayores”.

La investigación formal se centrará en cuatro áreas: la forma en que TikTok evalúa y mitiga los riesgos sistémicos; cumplimiento con la protección de la privacidad y seguridad de los menores edad; emisión de publicidad “confiable”, y medidas adoptadas para aumentar la transparencia.

“La Comisión llevará ahora a cabo una investigación en profundidad con carácter prioritario”, señaló la Comisión.

Esta investigación es una atribución de la Comisión por la nueva legislación que regula la operación de las plataformas digitales en el espacio europeo. Esta normativa exige que las empresas multipliquen esfuerzos para administrar mejor los contenidos en línea.

Con información de El Economista.

JC

Continuar leyendo

Tecnología

Elon Musk confirma: Primer paciente controla computadora con su mente gracias al chip Neuralink

El fundador de la startup tiene grandes expectativas para el proyecto, y asegura que ayudará a tratar enfermedades como la obesidad, el autismo, la depresión y esquizofrenia.

Publicado

en

La atención alrededor de los Apple Vision Pro comienza a desdibujarse con un nuevo avance tecnológico: el primer paciente humano con un chip de Neuralink implantado en su cerebro ya es capaz de controlar un ratón de computadora con sus pensamientos, según confirmó el fundador de la startup, Elon Musk.

En los últimos minutos del lunes, el empresario anunció que esta persona “parece haberse recuperado totalmente”, según la agencia de noticias Reuters.

“Los progresos son buenos, y el paciente parece haberse recuperado totalmente, sin efectos nocivos de los que tengamos constancia. El paciente es capaz de mover un ratón por la pantalla con solo pensar”, declaró Musk en un evento de Spaces en X (antes Twitter).

Agregó que la empresa estaba intentando llegar al mayor número de clics del paciente con los botones del ratón.

Ante esto, Reuters pidió mayor información, pero los voceros de la empresa no han respondido.

Fue el mes pasado cuando la compañía implantó con éxito un chip en su primer paciente humano, tras obtener la aprobación para reclutar humanos con fines de ensayos.

Para lograr todo esto, se usa un robot que implanta por medio de una cirugía una interfaz cerebro-ordenador en una parte del cerebro que controla las intenciones de movilidad.

El fin principal es que las personas puedan controlar un cursor de la computadora o un teclado con solo pensarlo.

Elon Musk tiene grandes expectativas para este proyecto, y asegura que ayudará a tratar enfermedades como la obesidad, el autismo, la depresión y esquizofrenia.

Actualmente, la compañía está valuada en 5 mil millones de dólares a pesar de que ha sido centro de debates éticos y de seguridad.

Sin embargo, en enero, Reuters informó que la empresa había sido multada por infringir las normas del Departamento de Transporte de Estados Unidos relacionadas al transporte de materiales peligrosos. Eso no fue impedimento para este logro en el primer paciente humano con un chip de Neuralink.

Con información de MVS Noticias.

JC

Continuar leyendo

Tecnología

¿Por qué la gente está devolviendo los Apple Vision Pro? Este es el problema que presentan

Las y los usuarios están buscando la devolución de este producto tras presentar cinetosis.

Publicado

en

No ha pasado ni un mes desde que se lanzaron los Apple Vision Pro, y la gente ya está buscando su devolución, pues al perecer, presentaron algunos problemas en su uso, el más destacado, fue la aparición de un síntoma llamado cinetosis.

La fiebre de los lentes de realidad virtual (RV) duró poco, con una lluvia de memes de quienes consideran estos artículos como innecesarios, mientras que los fans de la tecnología permanecían encantados.

El por qué del revoloteo de los Apple Vision Pro, es porque combina la realidad física con la virtual, es decir, que se puede ver un documento de Word y una pestaña de YouTube, mientras estás en una comida con tu familia y amigos; todo al mismo tiempo.

Los contras de los lentes de realidad virtual

Ahora, pese a lo fascinante que para algunos puede conllevar esta innovación, decenas de usuarios han comenzado a devolver el dispositivo por diversas razones, la cinetosis es una de las principales.

Muchos usuarios reportan que las Vision Pro son pesadas y voluminosas, lo que las hace incómodas de usar durante largos periodos. Además de que, la integración con otros dispositivos Apple no es tan fluida como se esperaba. Las transiciones entre la realidad virtual y la real pueden ser torpes y frustrantes.

¿Qué es la cinetosis?

La cinetosis, también conocida como mareo por movimiento, es un trastorno que afecta a algunas personas cuando viajan en diferentes medios de transporte.

¿Su causa? El oído interno, los ojos, los músculos y las articulaciones envían señales al cerebro sobre el movimiento del cuerpo. Cuando estas señales no coinciden, el cerebro se confunde y puede provocar síntomas como:

  • Náuseas
  • Vómitos
  • Mareos
  • Sudoración fría
  • Palidez
  • Dolor de cabeza
  • Fatiga

¿Mark Zuckerberg tenía razón?

La última crítica que Mark Zuckerberg que hizo sobre los lentes de realidad mixta Apple Vision Pro describiéndolos como inferiores a los Quest 3 (de su empresa Meta) ha generado reacciones polarizadas.

Y es que, las declaraciones de Zuckerberg coincidieron con el informe de medios estadounidenses sobre “la primera oleada” de devoluciones de los Apple Vision Pro, los dispositivos tecnológicos de realidad mixta del gigante tecnológico debido a que algunos usuarios han experimentado dolores de cabeza, otros se quejaban de la incomodidad de su diseño y fatiga ocular al usarlos.

Con información de MVS Noticias

JE

Continuar leyendo

Tendencia