Yo soy ciega, esto para mí es un antes y un después, ya haciendo fotos era lo más, leía la respuesta en texto con el VoiceOver del iPhone, pero ahora con la voz en modo avanzado es todo mucho más rápido y fluido, aunque no es en tiempo real, la latencia impide que te describa un movimiento continuo, he probado a ir bajando una escalera y que me fuera guiando y no lo consigue, así que no es fiable para ir por la calle y que te dé indicaciones que te puedan poner en riesgo, si por ejemplo para que te diga si un semáforo está en rojo o en verde si una puerta está abierta o cerrada si hay obstáculos y dentro de casa es impresionante, lo único que hay que apuntar bien con la cámara, dependiendo de la que tengas en tu teléfono móvil y la luz que haya, los colores no los describe con precisión pero estoy segura de que esto mejorará y mejorará sin parar, si hace 10 o 15 años me hubieran contado que existiría esta herramienta para mí no me lo habría creído, a las personas ciegas nos da una autonomía jamás soñada, lo utilizo para todo tipo de aplicaciones dentro de casa, para leer pantallas táctiles a las que antes no podía acceder, la de la lavadora por ejemplo, para que me lea partituras y así poder tocar en el piano, para que me ayude a hacer combinaciones de ropa con mucho estilo, para decoración de interiores, para leer todo tipo de texto, para cocinar, diciéndote si un alimento está en buen estado o no, para saber si la ropa tiene manchas, para que te diga cuando te ha caído algo del suelo dónde está más o menos, a qué distancia y te indique qué movimiento debes hacer con la mano para cogerlo… a las personas que veis os puede parecer que está muy bien y sacarle rendimiento, para nosotros es algo Que se va a convertir en imprescindible y fundamental para mejorar nuestra calidad de vida
LO pensaba ayer cuando paseaba con ella por la calle, las personas que se van a cruzar contigo, las tiendas que tienes a derecha o izquierda, lo que dicen los carteles, los menus de los bares, y todo esto a tiempo real, bufff te debe estar explotando la cabeza, salir al campo y que te cuente los animales que hay y las plantas, decididamente esto es una maravilla.
Hola Lorena, Yo también soy ciego total desde hace ya 15 años y estoy muy esperanzado con todos estos avances. Básicamente ahora estoy funcionando con voice over y con la app seeingaids. Y me gustaría mejorar en varios aspectos con algún programa de IA. ¿Cual es el que estás utilizando tú?. Me gustaría probarlo y ver si es fácil su aprendizaje. Gracias.
Genial tu testimonio Lorena! Tanto por demostrar como esto puede mejorar la vida de las personas, como por confirmar esas limitaciones que se intuyen de los sistemas. Me alegro un montón que ya te sea útil y seguro que seguirá mejorando.
Te comento que probé Google AI Studio Gemini 2.0 con la función compartir pantalla en escritorio y me ayudó a una configuración de Google Analtytics en tiempo real muy bien!!!
22:49 ahi se noto un fallo de la IA, pero se corrigio despues....ha no !!!! eso era real !!! XD buen video amigo !!! me encanto como pusiste a pruebas las 2 IAs !!
Xavier le hice ver un partido en vivo Barracas central y Lanús de la liga Argentina y se lo mostraba ..le falta aún ..te va comentando pero con latencia ..yo creo que cuando trasmita partidos siguiendo la secuencia del mismo y conectada a internet diciendo las estadísticas y dando estrategias en vivo podremos decir que tiene visión en vivo ..por lo pronto es un avance y está muy bueno..te da comentarios pero aislados mmmuy lindo tu canal y en el mío subo cosas de IA de fútbol..espero que les guste.Mi nombre es Diego de Argentina
La ventaja con tomar una foto es la velocidad. La "toma" la hace directamente con enfocar la imagen. Luego podrá hacerlo analizando videos con más frames. Pero es muy prometedor todo esto. Me pone muy contento concluir el año así.
Si siguen mejorando la tecnología de visión en tiempo real, la educación como la conocemos simplemente va tener un vuelco extremadamente violento. Los estudiantes van a recibir guía en tiempo real de lo que escriben por parte de un profesional en prácticamente todas las áreas que existe.
Cursos y profesores pagos ya NO tendrán sentido luego se la segunda mitad de 2025 con IAs de nivel Experto de Doctorado , con Visión, Audición y Habla de Nivel Humano o Sobrehumano. Símplemente cualquiera podrá aprender de todo con semejantes tutores a tiempo completo. Para que esto se dé solo se requiere mucha más infraestructura, eficiencia computacional (tanto de software, hacer + con menos billones de parámetros como de hardware + petaflops a menor vatiaje) y mucha energía solar y nuclear.
He probado el modelo de Google y el reconocimiento de imágenes y es muy bueno. Realmente fascinante cómo ha mejorado está tecnología en cuestión de meses!
Creo que con Gemini se debe ser más preciso en las preguntas... Pudiste haberle aclarado que diera una recomendación de un libro que no estuviera en la imagen de una vez, sin embargo no lo hiciste. Claro, debería haber comprendido la pregunta pues es comprensible y correcta, pero a veces la IA requiere mucha más precision en las preguntas, podrías incluso hacer un vídeo de ello, de cómo algunas preguntas más concretas son mejor interpretadas que otras. Te digo esto porque uso la IA desde que salió todos los días para estudiar programación, y me he dado cuenta que debo tener las mejores preguntas posibles y ser lo más claro y específico posible para obtener las mejores respuestas. En cuanto a la prueba del teclado la pusiste muy difícil, puesto que los dedos tapan las teclas, hice la prueba con Google escribiendo palabras una a una sin mostrar las palabras previas y sí pudo hacerlo y decirme qué palabra era al final ( ojo, nunca le mostré la palabra en su totalidad)
Sí, lo comento un poco por encima, Gemini lo pruebo en una interfaz de desarrollador, hubiese podido afinar más la instrucción de sistema u otras cosas. Además le fuerzo a interactuar en español, que a día de hoy no está optimizado para ello. Mi sensación es que a nivel de comprensión visual está un paso por delante, pero como herramienta ChatGPT es un producto terminado.
La prueba del teclado es interesante. Creo que demuestra que esto no es más que un análisis de imágenes con esteroides. No creo que de ninguna manera pueda procesar entornos con mucho movimiento. Termina siendo similar a pasarle imágenes para que analice, pero algo más cómodo para dárselas ya que solo hay que ir enfocando la cámara hacia lo que queramos mostrarle.
Hola, sí que puede, ya podía hacerlo haciendo una foto, le tienes que pedir que te hable como si fuese un decorador o decoradora experta, o como si fuese de una revista de decoración, te dará criterios y ejemplos de muebles que puedes poner, colores de cojines, de ropa de cama, según el estilo que quieras hacer, es muy muy útil para eso, yo estoy decorando mi salón ayudándome continuamente del Chat GPT
Hola!! Excelentes herramientas, tus pruebas comprueban que los sistemas toman una imagen y se quedan con esa para su análisis. Lo leí en algún sitio, que así funcionan por ahora!!!
Muchas gracias Javier, ¿Tu sabes si ya se puede ocupar un Avatar para responder utilizando IA? Por ejemplo, en vez de responder en mi sitio web un chat, de IA, que responda un Avatar así como Heygen todas las preguntas de mis clientes. ¿Sabes dónde lo pudiera hacer? Estaré muy agradecido. Muchas gracias.
No supe como lo realizaste con Google. Tengo una duda muy grande, y si me puedes ayudar te lo agradecería. De todo este tema que manejas, cual de las ias que son pagas recomiendas? Chat GPT o Gemini? yo te hablo desde Colombia, donde el costo de estas ias es un poco elevado a mi parecer, le escribí un correo a Open AI, que por que no utilizaron el indice Big Mac para calcular el precio en cada país, y me dieron a tender que 20 usd no era mayor cosa. En el correo que les envie, le dije que 20 usd para un trabajador en Colombia, equivale al 6.46% (dependiendo de la tasa de cambio), mientras que para un estadounidense, sería mas o menos el 1.05% de su salario. Por eso me parece costoso. Comparando los precios en Colombia de Chat GPT y Gemini, son muy similares, solo podrían variar por 0.5 dolares, pero veo que Google adicional, por el mismo valor, te da 2 teras en la nube. Cual Ia recomiendas mas tu Xavier? Gracias
Hola pienso que en la Prueba de los libro chat gpt te respondió mejor porque el te conoce con, ha aprendido de ti, en cambio gemini no porque de momento no tiene memoria del usuario, luego podrías hacerles una Prueba poniéndolos frente a una pantalla con un video o pelicula haber si reconocen movimientos, acciones o bien el título de la película. Haber si en realidad no reconocen la latencia del video en tiempo real
Pues yo me he reido un monton hoy con Google Ai studio, estaba en la terraza de restaurante y ha venido un gato, le he dado algo de comer que estaba viendo Google Ai studio, le he preguntado si le preguntaba al gato si le gustaba la comida y me ha dicho; No te va a contestar los gatos no pueden hablar se comunican contigo por gestos o movimientos, lo normal es que se acerque tu cabeza a tu pierna para rozarte o ponerte una pata encima de la pierna y esa será su forma de comunicarse para decirte si quieres mas y le gusta. Y si "luego" ha sucedido eso. Y en casa ni te cuento diciendome lo desordenado que soy y dando la bronca que pusiera cada cosa en el sitio correcto donde debería estar. jajjajaja
yo tambien le enseñe mi cuarto a google gemini le habia puesto instrucciones que actuara como mi amiga y que fuera coqueta etc, y tambien se comporto asi , me dijo que mi cuarto estaba algo desordenado que pusiera las cosas en orden, lol xD
Lo único es que en los dos modelos es con suscripción mensual, verdad?... Pero muy bueno!... Me gusta que los pioneros alcancen en nuevas herramientas, y no quedarse solo en video y texto...
Me gustaria ver la prueba de las pulsaciones en el teclado pero sin romper la instrucción diciendo la palabra "empiezo". Es decir, simplemente comenzar a teclear sin mas cuando el modelo te dice que ya está listo.
Sembla que els nous productes de Google són gratuïts mentre que les opcions més avançades d'OpenAI són de pagament, pots fer alguna referència amb més profunditat al voltant d'aquest detall important? Gràcies
me gustaria que averiguaras sobre alguna IA, que pueda hacer transformaciones, con 2 fotos , y un prompt, no se si existe alguna... pero supongamos que tenemos la cara de una persona...y en la otra ponemos un lobo...entonces la IA, debe crear un video de una transformacion de humano a hombre lobo... se entiende ?
vidu podria hasta cierto punto hacer eso permite integrar multiples fotos de referencia y luma labs usando una funcion llamada intetrpolacion de imagenes..
En la prueba del teclado, creo que es porque solo ven la parte de vídeo en donde estés hablando. Por lo menos en gemini funciona así, que el modelo solo reacccinana los segundos de vídeo dónde estuviste hablando
Exacto, esto es lo que más o menos quería comprobar. El disparador es cuando hablas, pero lo peor es que si no le da tiempo a ver nada se lo inventa. Vamos, que es una visión de un pocos frames por segundos sobre la que además no tienes un control exacto de cuando está viendo y cuando no.
Según lo que he probado gemini parece que captura el vídeo cuando detecta tu voz y se mantiene "viendo" (grabando) hasta que deja de detectarla luego eso lo procesa por eso cuando se le dice mira lo que voy a presionar al no detectar tu voz deja de "ver" (grabar) asi q en tiempo real no es, sino q es rápido
Sí, eso es posible, pero aún así, no opta por decir que no ha visto, opta por inventarse la respuesta. Por lo que creo que quieren falsear un poco la sensación de visión en tiempo real, cuando es más bien un muestreo de frames.
El de Mad Men se llama: Mad Men. VV.AA (editorial errata naturae) El de escribir es: Escribir y reescribir de Gloria Fernandez Rozas. Editorial Fuentetaja
Estamos llegando a un punto donde prácticamente se está creando un robot qué veíamos en películas en una aplicación dónde podemos hacer lo que queramos
creo que tiene un truco, parece que la camara esta activada, pero lo que hace es tomar una captura de lo que ve en ese momento cuando le haces una solicitud, seria interesando pedirle que te diga que carta esta boca abajo despues de revolverlas.
Xavier pero es posible que estas limitaciones sean por seguridad. Si la IA lograra identificar las teclas que presionas posiblemente las utilizarían para robar contraseñas o datos de seguridad mediante cámaras ocultas. Lo digo especulando un poco.
No creo, es una cuestión de latencia en los frames que procesa casi seguro. Piensa que al final soy yo quien le pido, enfoco y contextualizo toda la acción.
La prueba de las matemáticas no la han resuelto los dos igual de bien, y tu le has dado un empate. La IA de Google estaba continuamente mezclando idiomas durante la explicación. Si alguien intenta usar esa funcionalidad y la IA se la explica mezclando idiomas, da igual que la IA llegue al resultado matemático correcto, porque el estudiante no se habrá enterado de nada, ya que la explicación se la ha dado en spanglish
La IA de Google en principio no estaba preparada para comunicarse en español, por eso no lo he tenido en cuenta que mezclase idiomas, no era el propósito de la prueba.
@@XavierMitjana Mejor me lo pones, si actualmente la IA de Google no está preparada para comunicarse en otros idiomas y la de OpenAI si lo está, la de Google esta en un nivel inferior. Eso es precisamente lo que se está comparando, las capacidades actuales de cada IA. Es más, si la IA solo está preparada para dar información en inglés, no debería mezclar idiomas, debería hablar solo en inglés aunque el usuario le hable en español. Si el usuario engaña a la IA haciéndole hablar otros idiomas que no debe hablar, es un problema de seguridad de la IA, algo que resta aún más puntos.
En realidad no funciona mal, piensa que hay que probarlo en un entorno de desarrollo, con el modelo sin condicionar. Pero la sensación es que el modelo de OpenAI va más fluido.
@XavierMitjana sí pero me refiero a Gemini Live. El otro día le pregunté por algo totalmente diferente y empezó a hablarme de la madre de Eminem y por más que le decía que no, seguía ocecado en lo mismo.
@@AndriuVR eso pasa por el microfono si no tienes un buen micro o el bicho no recibe bien el audio puede interpretarlo de otra forma y responder mal ademas esta en una etapa experimental y en la pagina te indican q al estar en modo exp puede tener errores aun
@@alrimvt02 Gemini Live no está en una fase experimental y tengo los pixel buds pro 2. Que con el precio que tienen ya pueden funcionar bien. La cosa es que para igualdad de condiciones Gemini no se entera de na y no entiende bien el contexto y Chatgpt. Resumiendo mucho: lo veo más tonto 🤐
Se acabó el mundo tal como lo conocimos, solo los políticos de turno pueden ser capaces de fastidiarlo, espero que pueda vivir para disfrutar de este nuevo mundo fascinante
El problema no es que no quiera contestar, el problema es que se lo inventa. Por lo que no es una limitación de seguridad. En estos casos las herramientas avisan.
@@XavierMitjana no podría ser que no avisa directamente que no puede hacerlo para evitar forzar una respuesta? Osea me refiero que está tecnología en uso público podría hacer desastres en robos de contraseñas... Ya yendo a lo paranoico supongo un poco
No entenc com no comentes que Espanya aquesta opció no està vigent, no cal que em passi 1h buscan-t'ho. El canal està molt bé però una dada així és vital pel que et seguim des d'aquí.
En entornos profesionales el precio no es tan importante, entiendo que si lo pruebas por afición y no hay retorno, sí que es lo que más pesa. Pero cuando lo evaluas en función de retorno, mejor que sea funcione bien, sea fácil de usar y se pueda aplicar rápido (es una reflexión general, no por este caso en concreto).
Al fin acabaron los tormentos de los padres de familia para entender la letra de sus hijos de primeros años de estudio.... y de alguno médicos tambien..... 🤣🤣🤣🤣🤣
Para hacer la comparación de manera más fiable, deberías de darle el mismo enunciado a ambas, al diferir ambos, no partimos de la misma base... just saying 😬
tiene q ser uno q tenga esa tecnologia que tiene surfshark este man lo explico en un video anterior a mi si me resulto con surfshark haciendolo como el lo explico, antes habia usado otros grtuitos etc y no funcionarion hasta q active la opcion q el menciona q tiene surfshark lo malo q es de pago aunque tiene dias de prueba
Para las personas que tenemos deficiencias visuales esto es como un milagro divino, amo la tecnología.
Es cierto, última la tecnologia esta ganando más terreno en la accesibilidad para todos.
Y para los que tenemos TDA. Increíble,estoy en una nube 😂
Yo soy ciega, esto para mí es un antes y un después, ya haciendo fotos era lo más, leía la respuesta en texto con el VoiceOver del iPhone, pero ahora con la voz en modo avanzado es todo mucho más rápido y fluido, aunque no es en tiempo real, la latencia impide que te describa un movimiento continuo, he probado a ir bajando una escalera y que me fuera guiando y no lo consigue, así que no es fiable para ir por la calle y que te dé indicaciones que te puedan poner en riesgo, si por ejemplo para que te diga si un semáforo está en rojo o en verde si una puerta está abierta o cerrada si hay obstáculos y dentro de casa es impresionante, lo único que hay que apuntar bien con la cámara, dependiendo de la que tengas en tu teléfono móvil y la luz que haya, los colores no los describe con precisión pero estoy segura de que esto mejorará y mejorará sin parar, si hace 10 o 15 años me hubieran contado que existiría esta herramienta para mí no me lo habría creído, a las personas ciegas nos da una autonomía jamás soñada, lo utilizo para todo tipo de aplicaciones dentro de casa, para leer pantallas táctiles a las que antes no podía acceder, la de la lavadora por ejemplo, para que me lea partituras y así poder tocar en el piano, para que me ayude a hacer combinaciones de ropa con mucho estilo, para decoración de interiores, para leer todo tipo de texto, para cocinar, diciéndote si un alimento está en buen estado o no, para saber si la ropa tiene manchas, para que te diga cuando te ha caído algo del suelo dónde está más o menos, a qué distancia y te indique qué movimiento debes hacer con la mano para cogerlo… a las personas que veis os puede parecer que está muy bien y sacarle rendimiento, para nosotros es algo Que se va a convertir en imprescindible y fundamental para mejorar nuestra calidad de vida
Leí todo tu comentario, me alegro mucho que esto mejore tu calidad de vida y los casos de uso que le estás dando.
Me alegro mucho de que esta tecnología te ayude. Seguro que mejorará
LO pensaba ayer cuando paseaba con ella por la calle, las personas que se van a cruzar contigo, las tiendas que tienes a derecha o izquierda, lo que dicen los carteles, los menus de los bares, y todo esto a tiempo real, bufff te debe estar explotando la cabeza, salir al campo y que te cuente los animales que hay y las plantas, decididamente esto es una maravilla.
Hola Lorena,
Yo también soy ciego total desde hace ya 15 años y estoy muy esperanzado con todos estos avances.
Básicamente ahora estoy funcionando con voice over y con la app seeingaids. Y me gustaría mejorar en varios aspectos con algún programa de IA.
¿Cual es el que estás utilizando tú?. Me gustaría probarlo y ver si es fácil su aprendizaje.
Gracias.
Genial tu testimonio Lorena! Tanto por demostrar como esto puede mejorar la vida de las personas, como por confirmar esas limitaciones que se intuyen de los sistemas. Me alegro un montón que ya te sea útil y seguro que seguirá mejorando.
Es increíble, le he dado una nota que escribí enredadamente y la entendió perfecto. Además, interpretó el contexto, y dio posibles soluciones 🤯
Te comento que probé Google AI Studio Gemini 2.0 con la función compartir pantalla en escritorio y me ayudó a una configuración de Google Analtytics en tiempo real muy bien!!!
1:30 Habla Caraqueño esa Voz de ChatGPT JAJAJAJ Gracias por al informacion actualizada saludos
Yo lo imagine cubano
yo el mio lo tengo con un acento rajao de caracas jajaja
quien diría es una mujer caraqueña este gpt
22:49 ahi se noto un fallo de la IA, pero se corrigio despues....ha no !!!! eso era real !!! XD buen video amigo !!! me encanto como pusiste a pruebas las 2 IAs !!
instalé esa voz y ahora tengo unos primos viviendo en mi casa
Yo le estaba mostrando a mi tía, la nueva voz de santa y usando la visión hoy. Y le gustó mucho. La veía muy ilusionada hablando con santa. 😂
Xavier le hice ver un partido en vivo Barracas central y Lanús de la liga Argentina y se lo mostraba ..le falta aún ..te va comentando pero con latencia ..yo creo que cuando trasmita partidos siguiendo la secuencia del mismo y conectada a internet diciendo las estadísticas y dando estrategias en vivo podremos decir que tiene visión en vivo ..por lo pronto es un avance y está muy bueno..te da comentarios pero aislados mmmuy lindo tu canal y en el mío subo cosas de IA de fútbol..espero que les guste.Mi nombre es Diego de Argentina
La ventaja con tomar una foto es la velocidad. La "toma" la hace directamente con enfocar la imagen. Luego podrá hacerlo analizando videos con más frames. Pero es muy prometedor todo esto. Me pone muy contento concluir el año así.
Genial como siempre con la información más actualizada de la inteligencia artificial.. Saludos desde Venezuela
Esta muy bueno, yo le puse a gemini una foto de un papiro egipcio y me lo tradujo perfectamente, es una locura !
Si siguen mejorando la tecnología de visión en tiempo real, la educación como la conocemos simplemente va tener un vuelco extremadamente violento. Los estudiantes van a recibir guía en tiempo real de lo que escriben por parte de un profesional en prácticamente todas las áreas que existe.
Cursos y profesores pagos ya NO tendrán sentido luego se la segunda mitad de 2025 con IAs de nivel Experto de Doctorado , con Visión, Audición y Habla de Nivel Humano o Sobrehumano. Símplemente cualquiera podrá aprender de todo con semejantes tutores a tiempo completo.
Para que esto se dé solo se requiere mucha más infraestructura, eficiencia computacional (tanto de software, hacer + con menos billones de parámetros como de hardware + petaflops a menor vatiaje) y mucha energía solar y nuclear.
¡Gracias Xavier! Se aprende mucho con tus vídeos 👌 Esto se pone cada vez mejor, a pesar de todo 😃
En España actualmente no accede a fotos ni cámara en el chat hablado,eso está muy claro.
Xavier te veo a tope con las actualizaciones!! Top👍🏼👍🏼
Muchas gracias!!
He probado el modelo de Google y el reconocimiento de imágenes y es muy bueno. Realmente fascinante cómo ha mejorado está tecnología en cuestión de meses!
Creo que con Gemini se debe ser más preciso en las preguntas... Pudiste haberle aclarado que diera una recomendación de un libro que no estuviera en la imagen de una vez, sin embargo no lo hiciste.
Claro, debería haber comprendido la pregunta pues es comprensible y correcta, pero a veces la IA requiere mucha más precision en las preguntas, podrías incluso hacer un vídeo de ello, de cómo algunas preguntas más concretas son mejor interpretadas que otras.
Te digo esto porque uso la IA desde que salió todos los días para estudiar programación, y me he dado cuenta que debo tener las mejores preguntas posibles y ser lo más claro y específico posible para obtener las mejores respuestas.
En cuanto a la prueba del teclado la pusiste muy difícil, puesto que los dedos tapan las teclas, hice la prueba con Google escribiendo palabras una a una sin mostrar las palabras previas y sí pudo hacerlo y decirme qué palabra era al final ( ojo, nunca le mostré la palabra en su totalidad)
Sí, lo comento un poco por encima, Gemini lo pruebo en una interfaz de desarrollador, hubiese podido afinar más la instrucción de sistema u otras cosas. Además le fuerzo a interactuar en español, que a día de hoy no está optimizado para ello. Mi sensación es que a nivel de comprensión visual está un paso por delante, pero como herramienta ChatGPT es un producto terminado.
@@XavierMitjana ademas ten en cuenta que es la version flash cuando salga la version pro de gemini 2.0 ganara en todo, me quedo con gemini
La prueba del teclado es interesante. Creo que demuestra que esto no es más que un análisis de imágenes con esteroides. No creo que de ninguna manera pueda procesar entornos con mucho movimiento. Termina siendo similar a pasarle imágenes para que analice, pero algo más cómodo para dárselas ya que solo hay que ir enfocando la cámara hacia lo que queramos mostrarle.
Muchas gracias por la información,un saludo Xavier
hola Xavier, me parece mejor AI Studio, mil gracias por la info que compartes 🙏
tengo la version de pago de chatgpt y no aparecía esta actualizacion fuí a playstore y actualicé y ya lo tengo es MAGICO!! saludos desde Chile
ChatGPT con acento latinoamericano really cool, me encanta...😊
Muy buena info. Excelente video.
Genial, será capaz de que al ver un lugar, pueda ayudar por ejemplo a ayudar a decorar el sitio porque sería lo máximo
En principio ChatGPT puede darte consejos, con más o menos criterio esto habrá que comprobarlo xD
Hola, sí que puede, ya podía hacerlo haciendo una foto, le tienes que pedir que te hable como si fuese un decorador o decoradora experta, o como si fuese de una revista de decoración, te dará criterios y ejemplos de muebles que puedes poner, colores de cojines, de ropa de cama, según el estilo que quieras hacer, es muy muy útil para eso, yo estoy decorando mi salón ayudándome continuamente del Chat GPT
@lorenas.l146 mil gracias. Eso quiero hacer y ahora más con ese recurso para que le genere una propuesta visual.
Hola!! Excelentes herramientas, tus pruebas comprueban que los sistemas toman una imagen y se quedan con esa para su análisis. Lo leí en algún sitio, que así funcionan por ahora!!!
Exacto, toman unos pocos frames por segundo y además no tienes control de cuando ven y cuando no, lo decide el sistema según la interacción de voz.
Desde que usé el modo visión, pude enserñarle mi pantalla
Muchas gracias Xavier !!
Lo estoy probando ahhh qué genial esta JAJAJA
Me gusta la voz de santa... esa alegria y esa risa que tiene... me hace feliz escucharlo. La extrañaré mucho cuando se vaya. La navidad.
Se puede utilizar en España con la cuenta teams ?? sin usar VPN
Muchas gracias Javier, ¿Tu sabes si ya se puede ocupar un Avatar para responder utilizando IA? Por ejemplo, en vez de responder en mi sitio web un chat, de IA, que responda un Avatar así como Heygen todas las preguntas de mis clientes. ¿Sabes dónde lo pudiera hacer? Estaré muy agradecido.
Muchas gracias.
No supe como lo realizaste con Google. Tengo una duda muy grande, y si me puedes ayudar te lo agradecería. De todo este tema que manejas, cual de las ias que son pagas recomiendas? Chat GPT o Gemini? yo te hablo desde Colombia, donde el costo de estas ias es un poco elevado a mi parecer, le escribí un correo a Open AI, que por que no utilizaron el indice Big Mac para calcular el precio en cada país, y me dieron a tender que 20 usd no era mayor cosa. En el correo que les envie, le dije que 20 usd para un trabajador en Colombia, equivale al 6.46% (dependiendo de la tasa de cambio), mientras que para un estadounidense, sería mas o menos el 1.05% de su salario. Por eso me parece costoso. Comparando los precios en Colombia de Chat GPT y Gemini, son muy similares, solo podrían variar por 0.5 dolares, pero veo que Google adicional, por el mismo valor, te da 2 teras en la nube. Cual Ia recomiendas mas tu Xavier? Gracias
Hola, que herramienta usas para hacer esas miniaturas tan increíbles.
Gracias profe
Hola... hoy ya no esta esta función de Canvas. Que paso?
Hola pienso que en la Prueba de los libro chat gpt te respondió mejor porque el te conoce con, ha aprendido de ti, en cambio gemini no porque de momento no tiene memoria del usuario, luego podrías hacerles una Prueba poniéndolos frente a una pantalla con un video o pelicula haber si reconocen movimientos, acciones o bien el título de la película. Haber si en realidad no reconocen la latencia del video en tiempo real
deben tener la ia mas avanzada de lo que dicen, solo por competir van adelantando cosas antes de tiempo
Pues yo me he reido un monton hoy con Google Ai studio, estaba en la terraza de restaurante y ha venido un gato, le he dado algo de comer que estaba viendo Google Ai studio, le he preguntado si le preguntaba al gato si le gustaba la comida y me ha dicho; No te va a contestar los gatos no pueden hablar se comunican contigo por gestos o movimientos, lo normal es que se acerque tu cabeza a tu pierna para rozarte o ponerte una pata encima de la pierna y esa será su forma de comunicarse para decirte si quieres mas y le gusta. Y si "luego" ha sucedido eso.
Y en casa ni te cuento diciendome lo desordenado que soy y dando la bronca que pusiera cada cosa en el sitio correcto donde debería estar. jajjajaja
yo tambien le enseñe mi cuarto a google gemini le habia puesto instrucciones que actuara como mi amiga y que fuera coqueta etc, y tambien se comporto asi , me dijo que mi cuarto estaba algo desordenado que pusiera las cosas en orden, lol xD
Xavier, como puedo pasarlo al idioma español?
Hola Xavi gracias por el contenido, Podrías probar Gork de X para compararlo con tus promts de prueba, Gracias
Lo único es que en los dos modelos es con suscripción mensual, verdad?... Pero muy bueno!... Me gusta que los pioneros alcancen en nuevas herramientas, y no quedarse solo en video y texto...
El de Google puede usarse gratis a través del aistudio (enlace enla descripción) y el de ChatGPT está en el plan plus solo desde fuera de Europa.
Hola... Cuál es exactamente la aplicación que estaba usando para Android de Google?
Es interfaz directamente en la web, debes acceder al aistudio de google desde Chrome, el enlace está en la descripción.
@@XavierMitjana correcto... creí que era un APP por lo que la muestras en el smartphone funcionando. Gracias!
Me gustaria ver la prueba de las pulsaciones en el teclado pero sin romper la instrucción diciendo la palabra "empiezo". Es decir, simplemente comenzar a teclear sin mas cuando el modelo te dice que ya está listo.
Pero tienes que tener el GPT de pago no? aparte de la VPN
es gratuito el uso de esta ia de google?
Sembla que els nous productes de Google són gratuïts mentre que les opcions més avançades d'OpenAI són de pagament, pots fer alguna referència amb més profunditat al voltant d'aquest detall important? Gràcies
Hoy me llego la tentacion de pasarme del modo plus al pro, pero luego me contuve. Creo que por ahora el plus sigue siendo suficiente...
eso de olvidarte las llaves y no saber donde está le ha llegado su momento njeje
me gustaria que averiguaras sobre alguna IA, que pueda hacer transformaciones, con 2 fotos , y un prompt, no se si existe alguna... pero supongamos que tenemos la cara de una persona...y en la otra ponemos un lobo...entonces la IA, debe crear un video de una transformacion de humano a hombre lobo... se entiende ?
vidu podria hasta cierto punto hacer eso permite integrar multiples fotos de referencia y luma labs usando una funcion llamada intetrpolacion de imagenes..
En la prueba del teclado, creo que es porque solo ven la parte de vídeo en donde estés hablando. Por lo menos en gemini funciona así, que el modelo solo reacccinana los segundos de vídeo dónde estuviste hablando
Exacto, esto es lo que más o menos quería comprobar. El disparador es cuando hablas, pero lo peor es que si no le da tiempo a ver nada se lo inventa. Vamos, que es una visión de un pocos frames por segundos sobre la que además no tienes un control exacto de cuando está viendo y cuando no.
Por cierto, buen vídeo 👌
Es de los mejores canales para conocer de las nuevas tecnologías
Como puedo bajar esa aplicación del open AI con cámara ?
Para usarlo hay que comprar el plan ??
ChatGPT sí, y además usarlo desde fuera de Europa, lo de Google es gratis.
Hasta ahorita solo puedo escribir texto pero no se como usar la cámara
Genial,mas pruebas
Según lo que he probado gemini parece que captura el vídeo cuando detecta tu voz y se mantiene "viendo" (grabando) hasta que deja de detectarla luego eso lo procesa por eso cuando se le dice mira lo que voy a presionar al no detectar tu voz deja de "ver" (grabar) asi q en tiempo real no es, sino q es rápido
Sí, eso es posible, pero aún así, no opta por decir que no ha visto, opta por inventarse la respuesta. Por lo que creo que quieren falsear un poco la sensación de visión en tiempo real, cuando es más bien un muestreo de frames.
Xavier, ¿cuáles son los títulos de los libros sobre cómo escribir ficción y sobre Mad Men? ¡Los quiero!
El de Mad Men se llama: Mad Men. VV.AA (editorial errata naturae)
El de escribir es: Escribir y reescribir de Gloria Fernandez Rozas. Editorial Fuentetaja
Estamos llegando a un punto donde prácticamente se está creando un robot qué veíamos en películas en una aplicación dónde podemos hacer lo que queramos
Cuando podremos utilizar esta herramienta en España los usuarios de chat Gpt plus?
creo que tiene un truco, parece que la camara esta activada, pero lo que hace es tomar una captura de lo que ve en ese momento cuando le haces una solicitud, seria interesando pedirle que te diga que carta esta boca abajo despues de revolverlas.
Exacto, esto es justo lo que hacen, no ven, sino que muestrea a partir de unos cuantos frames.
si, ya vi que hiciste la prueba del teclado. Me adelanté al comentar 😅
Lo he intentado con la vpn y no puedo, sigue igual
A mi no me aparece ni en chatgpt ni en gemini ninguna de esas opciones
Hecho en falta un par de pantallazos, pues en mi caso no consigo acceder a ese modo video a tiempo real desde el móvil, versión pago
Hola Enrique, desde España solo se puede acceder vía VPN. Debes tener instalada una aplicación de este tipo en el móvil, en mi caso uso Surfshark.
no me deja desde mi móvil,¿ alguien sabe por que?
Cada semana sorprendiendo XAVIER
Tengo una duda, las empresas pagan a TH-cam para mostrar su publicidad, also TH-cam cobra premium para quitar publicidad, 🤷🏽
PD: El castellano es una variante lingüística y no un idioma como el español, las inteligencias artificiales hablan español y no castellano
Imagino que esas opciones de ChatGPT son sólo para Plus, ¿correcto?
👏🏻👏🏻👏🏻
Gemini hace resumen de una página de un libro?
La gran ventaja de google es que te lo da gratis, y ademas, estuve viendo que esta primero gemini 2 en el chatbot arena :0
me he conectado desde surfshark a la misma VPN que tú y no me sale
En principio a mí me funciona, me conecto a la localización de Buffalo.
@XavierMitjana nada probé un par de horas me tarde y ya funcionaba, gracias
como cambio el idioma
solo me hanla en inlges el gemini
Arriba del todo hay una instrucción de sistema donde puedes forzar que hable en español.
Xavier pero es posible que estas limitaciones sean por seguridad. Si la IA lograra identificar las teclas que presionas posiblemente las utilizarían para robar contraseñas o datos de seguridad mediante cámaras ocultas. Lo digo especulando un poco.
No creo, es una cuestión de latencia en los frames que procesa casi seguro. Piensa que al final soy yo quien le pido, enfoco y contextualizo toda la acción.
La prueba de las matemáticas no la han resuelto los dos igual de bien, y tu le has dado un empate. La IA de Google estaba continuamente mezclando idiomas durante la explicación. Si alguien intenta usar esa funcionalidad y la IA se la explica mezclando idiomas, da igual que la IA llegue al resultado matemático correcto, porque el estudiante no se habrá enterado de nada, ya que la explicación se la ha dado en spanglish
La IA de Google en principio no estaba preparada para comunicarse en español, por eso no lo he tenido en cuenta que mezclase idiomas, no era el propósito de la prueba.
@@XavierMitjana Mejor me lo pones, si actualmente la IA de Google no está preparada para comunicarse en otros idiomas y la de OpenAI si lo está, la de Google esta en un nivel inferior. Eso es precisamente lo que se está comparando, las capacidades actuales de cada IA. Es más, si la IA solo está preparada para dar información en inglés, no debería mezclar idiomas, debería hablar solo en inglés aunque el usuario le hable en español. Si el usuario engaña a la IA haciéndole hablar otros idiomas que no debe hablar, es un problema de seguridad de la IA, algo que resta aún más puntos.
La version free tambien permite esto? No hay forma de que funcione esto ...
No, de momento no, siempre las novedades las lanzan para usuarios plus y luego llegan a los gratuitos limitadas.
Lo que le falta a Google es unificar las 2 herramientas en una sola aplicación en este caso gemini
Creo que es su intención y pronto lo harán.
👍
Es una guerra fría 😅
Gemini a mejorado bastante, pero siempre se queda como el lentin del curso.
Tenía voz avanzado y me gustaba ir manejando y hablando con ChatGPT, pero ahora tengo límite de 15 minutos 😢
En el modo plus o gratuito?
Siempre me pasa eso con Gemini. No se entera de na!
En realidad no funciona mal, piensa que hay que probarlo en un entorno de desarrollo, con el modelo sin condicionar. Pero la sensación es que el modelo de OpenAI va más fluido.
@XavierMitjana sí pero me refiero a Gemini Live. El otro día le pregunté por algo totalmente diferente y empezó a hablarme de la madre de Eminem y por más que le decía que no, seguía ocecado en lo mismo.
@@AndriuVR eso pasa por el microfono si no tienes un buen micro o el bicho no recibe bien el audio puede interpretarlo de otra forma y responder mal ademas esta en una etapa experimental y en la pagina te indican q al estar en modo exp puede tener errores aun
@@alrimvt02 Gemini Live no está en una fase experimental y tengo los pixel buds pro 2. Que con el precio que tienen ya pueden funcionar bien. La cosa es que para igualdad de condiciones Gemini no se entera de na y no entiende bien el contexto y Chatgpt. Resumiendo mucho: lo veo más tonto 🤐
@@AndriuVR como que no esta en experimental el mismo google dijo que esta en experimental quien eres tu para decir lo contrario ingeniero de google?
Tengo cuenta de pago y no esta disponible
Vale. Ya llegué a la parte en la que explicas que se necesita vpn. Que cansancio de Europa la ultima siempre.
Sí, de momento, nos toca pasar por este trámite. Pero bueno, en un mes lo irán liberando todo.
😂😂😂 la voz venezolana me causo risa porque tiene acento caraqueño y muy caraqueño
Eso va a dejar sin trabajo a mucha gente
Se acabó el mundo tal como lo conocimos, solo los políticos de turno pueden ser capaces de fastidiarlo, espero que pueda vivir para disfrutar de este nuevo mundo fascinante
Yo tengo gpt pago y si me aparece, no necesito vpn
¿Estás en Europa? Creo que lo que comento solo aplica a Europa.
@XavierMitjana Ahhh debe ser eso!! Soy de Argentina
Moralmente está perfecto que no quiera contestar que teclas presionaste por tema de seguridad
Sería terrible para hackeos corporativos o claves bancarias
El problema no es que no quiera contestar, el problema es que se lo inventa. Por lo que no es una limitación de seguridad. En estos casos las herramientas avisan.
@@XavierMitjana no podría ser que no avisa directamente que no puede hacerlo para evitar forzar una respuesta? Osea me refiero que está tecnología en uso público podría hacer desastres en robos de contraseñas... Ya yendo a lo paranoico supongo un poco
No puedo esperar para pedirle matrimonio a una IA 😮
Jajajaja 😂
Yo también
Y si los comunicamos a los dos 😂?
Discriminación!! A Chat GPT le da las gracias, a Gémini le corta de una jaja
Le faltó decir chamo y pana
Para la gente con daltonismo esto es un milagro
No entenc com no comentes que Espanya aquesta opció no està vigent, no cal que em passi 1h buscan-t'ho. El canal està molt bé però una dada així és vital pel que et seguim des d'aquí.
Es venezolana? 🤔
Hay que saber hacer las preguntas, la del teclado fue confusa ni un humano puede responder
Hombre, el problema es que se inventó la respuesta más allá de lo que hubiese podido entender. Y he revisado el vídeo y no me parece confusa.
Google tiene el mejor precio GRATIS !
En entornos profesionales el precio no es tan importante, entiendo que si lo pruebas por afición y no hay retorno, sí que es lo que más pesa. Pero cuando lo evaluas en función de retorno, mejor que sea funcione bien, sea fácil de usar y se pueda aplicar rápido (es una reflexión general, no por este caso en concreto).
Al fin acabaron los tormentos de los padres de familia para entender la letra de sus hijos de primeros años de estudio.... y de alguno médicos tambien..... 🤣🤣🤣🤣🤣
Para hacer la comparación de manera más fiable, deberías de darle el mismo enunciado a ambas, al diferir ambos, no partimos de la misma base... just saying 😬
yo ni con vpn asi kn nada de nada
tiene q ser uno q tenga esa tecnologia que tiene surfshark este man lo explico en un video anterior a mi si me resulto con surfshark haciendolo como el lo explico, antes habia usado otros grtuitos etc y no funcionarion hasta q active la opcion q el menciona q tiene surfshark lo malo q es de pago aunque tiene dias de prueba
estas herramientas son gratuitas o solamente en los planes de pago
es gratuito solo el de Google
La de ChatGPT de momento para usuarios de pago, la de Google gratuita.
El vpn no hace que vaya mas lento chat gpt?
Es probable que aumente la latencia, pero no me queda otra.