CASO DE USO nivel alto. Realizar la programaciÃģn de un grupo de 100 tÃĐcnicos teniendo en cuenta todas las variables de vacaciones, horas diarias, tareas, turnos, etc. Caso que solventaria problemas de miles de empresas, tanto del transporte, seguridad, mantenimiento, etc
Hola, les comento que a los modelos anteriores les pedÃa tareas sencillas como: lÃstame las palabras que no tienen la letra A en la primera estrofa del himno de Colombia y no lo hacÃa. Era una tarea que cualquier niÃąo de 9 aÃąos es capaz de hacer. Pues bien, esta nuevo modelo si lo hizo No contento con eso, hice una prueba mucho mÃĄs completa: le pedà un soneto de amor, con rima perfecta, y sin la letra A. Sobra decir que los modelos anteriores ni me hacÃan el soneto y lo componÃan usando la A. Este modelo sà lo hizo. Se los comparto Soneto sin la letra "A" En tu brillo interior, mi ser yo descubrÃ, Sin tu luz sublime, mi mundo es sin fulgor; Eres tÚ sendero, mi brillo interior, Contigo encontrÃĐ lo que un tiempo perdÃ. Tus ojos reflejos de un bello sentir, En silencio profundo, tu pulso yo oigo; Mi ser sin tu voz es solo un sitio frÃo, Contigo yo entiendo lo que es vivir. En noches sin fin, tus sueÃąos vigilo, Eres el susurro dulce del viento; En tu gesto encuentro todo mi contento, Sin ti, mi existir es solo un sigilo. Eres luz sin fin, mi mejor sentir, Contigo deseo por siempre vivir.
Xavier, me gusta tus videos. sobre el problema del bote para mi contestÃģ correctamente con las 2 opciones ya que en la pregunta no se especifico la capacidad del bote. lo que estaria bueno en futuras actualizaciones del modelo es que antes de que suponga, le pregunte al usuario su duda. capaz esto se puede agregar a la pregunta como: "-pregunta-. si tienes alguna duda, antes de suponer, podes preguntarme mas informaciÃģn" o algo parecido proba de nuevo pero con esto a ver si llega a preguntarte antes de que suponga
Completamente de acuerdo, la pregunta es ambigua a la primera y segunda respuesta. Sino se especifica la capacidad de la barca no queda mas remedio que responder eso.
En realidad, si te fijas bien, en la segunda opciÃģn respondiÃģ mal, ya que primero dice que asume que no caben los 2 en el bote y en el primer viaje pone tanto a la cabra como el humano en el bote y luego continua con la estructura de la respuesta de un acertijo tÃpico. Vamos, que responde mal por un problema de overfitting que es lo que testea este prompt y por eso estÃĄ redactado de este modo.
Yo creo que en el problema del bote el programa ha hecho una interpretaciÃģn de la pregunta de una manera muy literal. Indicando que tÚ (el conductor) tienes que pasar a una persona y a una cabra al otro lado del rÃo. Es decir que en realidad interpreta que hay dos personas y una cabra.
@@arkavilla Eso es. Si se mejora el prompt especificando la cantidad de personas exactas y sobre todo la capacidad del bote, probablemente solo arroje la primera respuesta que dio con independencia de la pregunta similar del dataset, y no discuto que no infiera que el razonamiento aplique desde su dataset que es dÃģnde se basan sus datos, pero si se elimina la ambiguedad dudo mucho que devuelva 2 respuestas.
â@@XavierMitjana reviendo el video. PensÃĐ que te referÃas a equivocado en dar dos opciones. Pero como decÃs, es en la resoluciÃģn del segundo el error. Mala mia. Estaba pensando, estarÃa bueno que la ia pudiera "visualizar" usando la parte visual para poder imaginar el ejemplo
Muchas gracias por el vÃdeo, Xavier. Mi propuesta de casos de uso es sobre la fÃsica cuÃĄntica: sonido, frecuencia, vibraciÃģn, resonancias de un objeto con otro
Gracias Xavier! voy a ver que le puedo pedir, que me simplifique tareas... lo que me gusta que si bien mis exigencias son moderadas estoy con el diseÃąo de algunos proyectos y voy haciendo ajustes y ya va teniendo un backround de mis pedidos temÃĄticos, no necesito reforzar mucho los prompt, es como tenemos una conversaciÃģn fluida, al menos durante el proceso de ese diseÃąo (de cursos de aula virtual por ejemplo, temarios, objetivos... etc, como por citar algo) El punto estÃĄ en no alternar el tema. Saludos, desde CÃģrdoba, Argentina
Para la determinaciÃģn de la pena en deercho penal ha podido calcular las penas a imponer en un 90%. Y ha podido calcular con bastante exito los criterios orientadores de honorarios de al menos dos colegios de abogados.
En el Último problema ademÃĄs plantea un razonamiento que hace inviable que pasen la persona y la cabra al otro lado ya que dice que la barca solo soporta uno a la vez, es decir, o a la persona o a la cabra. TenÃa que haber preguntado que analice su segunda respuesta a ver que contestaba.
Xavier, yo creo que el problema de las velas es mÃĄs un problema de tokenizador que de lÃģgica, como los de contar las letras, realmente no sabemos muy bien como parte las palabras en tokens (y una 'vela' no deja de ser una 'palabra' o varios tokens) o como relaciona luego los tokens entre si. Me imagino que si le dices cuantos trozos de vela quedan en cada caso de forma numÃĐrica acertarÃan casi todos los modelos (digo casi por no mojarme mucho âš) Si que es una pasada ver este nuevo modelo en acciÃģn. Gracias.
En este caso no creo que fuese un problema del tokenizador, porque los otros modelos llegaban consistentemente a la conclusiÃģn opuesta, la vela mÃĄs corta es la que consideraban que se apagaba primero, por lo que parecÃa mÃĄs un fallo en la lÃģgica en este caso. Lo cierto es que este modelo lo ha solucionado de modo impecable, por lo que por ahà parece que la mejora es clara. Pero habrÃĄ que probarlo mÃĄs a fondo.
@@XavierMitjana Si siempre usas el mismo prompt ÂŋNo te has planteado que puede que respondan con la mÃĄs corta por ser la Última de la serie? Si, lo de este modelo ha sido espectacular, a mi me ha encantado como ha 'contado' los segmentos 08:16 digamos que 'extrayendolos' del contexto y enmarcÃĄndolos (le ha faltado ponerles un cabo de vela .ð)
âAciendo la listaâ y ordenando cinco despues de cincuenta y cincuenta y uno. Lo que me sorprende es que Xavier no se haya dado cuenta. Confiamos mucho en estas soluciones y hay que andarse con pies de plomo, son muy Útiles para codear, pero para ciencias y mates estamos bastante lejos de ofrecer calidad universitaria
tambiÃĐn cometiÃģ un error al ordenar alfabÃĐticamente con cincuenta antes que cinco, serÃĄ que ya es hora de cambiar los prompt de pruebas dado que tal vez ya se haya entrenado con ellos?
Excelente video Xavier. Una observaciÃģn si regresas al punto en el que en el prompt del "bote" la IA estÃĄ razonando dice esta "Aciendo" con un grueso error de ortografia.
Otro modelo de caso de uso. Tengo un coche el.electrico con una autonomÃa segura de 400 KM y probable de 450 Km quiero ir de Albacete a Amsterdam. ÂŋCual es el recorrido y las paradas mas adecuado que debo hacer de acuerdo con la informacion de electrolineras existentes y en que puntos donde debo dormir y comer.
Jaja ve que tan bueno es el nuevo modelo planificando y que intente resolver la economÃa mundial y su transiciÃģn de una economÃa de mano de obra humana a una completamente automatizada, que dicte polÃticas de cuando y en que etapa de la curva de automatizaciÃģn comenzarÃa a introducir el UBI si es que lo recomienda claro. GPT4 obviamente se la lÃa con esto y quiÃĐn no pero si este modelo puede resolver eso es muy poderoso.
Ya era hora de que sacaran algo, que lleva una racha OpenAI que no veas, todo anuncios y ni una release XD Gracias por el vÃdeo! :) Pues lo testearÃĐ un poco en lo que me queda de suscripciÃģn, y si veo que me sirve seguirÃĐ, pero si no le encuentro un caso de uso Ãģptimo para mÃ, creo que el mes que viene probarÃĐ la versiÃģn pro de Claude.
La verdad es que tal y como lo han planteado, ahora es apenas una demo, no es funcional para pensar en ÃĐl como herramienta de uso habitual debido a las limitaciones de mensajes semanales.
@@XavierMitjana SÃ, son exageradamente pocos XD Pero aÚn asà en principio me servirÃĄn para probar. Tengo en la recÃĄmara un par de proyectos donde hacer un razonamiento lÃģgico y muy profundo es fundamental, y por ahora ningÚn modelo me ha conseguido ayudar, asà que creo que me servirÃĄn como benchmark del o1 (y si ademÃĄs me soluciona alguno, pues mira, mato dos pÃĄjaros de un tiro ^_^)
Saludos! Excelente vÃdeo, como va avanzando esta tecnologÃa! ðŪ PodrÃas enviarle un archivo, por ejemplo un examen o una tarea de escuela y que actÚe como un profesor, la corrija y le adjudique una calificaciÃģn. Eso ayudarÃa mucho a los maestros a corregir muchos exÃĄmenes a la vez ð
solo una cosa que no me cierra, cuando dices que intenta colar la respuesta con mas limitaciones en el ultimo caso, creo que eso es una fase de su procedimiento donde se plantea otras interpretaciones posibles para luego contrastar y confirmar cual es la mejor respuesta; en otros casos se ha visto de contempla situaciones mas locas, pero luego vuelve a cordura...
SerÃa posible hacer un prompt que permitiera la resoluciÃģn de un problema de forma dialogica? Es decir, que se le permitiera hacer observaciones que pudiera consultar con la persona para hacer un razonamiento dialogado.
Caso de uso a testar: Xavi, 4o falla bastante (aunque Últimamente ha mejorado) en encontrar bibliografÃa real de cualquier tema. En no alucinar. Que use fuentes reales y verificables es un must en la investigaciÃģn con IA. SerÃĄ que el nuevo modelo ha mejorado en esto? Ãnims nano, que ho fas molt bÃĐ ;)
En el video dices que estÃĄ pensado para investigadores del campo de la salud en secuenciaciÃģn de cÃĐlulas, fÃsicos que necesiten fÃģrmulas matemÃĄticas complejas o para programadores que trabajen en entornos complejos. Mi pregunta es: ÂŋESTO ES RAZONAR? A mà me suena a mÃĄs capacidad de cÃĄlculo y mejores respuestas al interrelacionar y elegir opciones. Cuando tenga una conversaciÃģn continua con O1, podrÃĐ notar cÃģmo responde y me ayuda en algÚn tema (ÂĄMUY! acertado el comentario de que le faltarÃa conexiÃģn a internet). He visto 3 videos mÃĄs con pruebas a O1, muy chulos, pero mi relaciÃģn con los LLM es en ÃĄmbito de informaciÃģnâĶ no le voy a pedir cÃĄlculos matemÃĄticos en acertijos. ÂĄSÃ! Me pareciÃģ interesante un ejemplo donde se le daba informaciÃģn de un hospital y que calculara cantidad de personal necesario, programaciÃģn lineal del horario semanal, minimizaciÃģn de costos, etc. ÂĄPero repito! ÂŋEn eso estarÃa razonando? ÂŋMe estarÃa resolviendo un problema general? O mÃĄs bien, Âŋsolo ayudando en un problema de productividad? Esto es lo que me da igual de la inteligencia artificial, lo mismo que me daba igual en la llegada de Internet y su locura de programar pÃĄginas web. Tarde o temprano lo resolverÃĄ un ordenador. A mà no me aporta ningÚn reto vital real. En cambio si charlando con una IA, adopto un enfoque nuevo sobre un tema, en base a contrastar literatura temÃĄtica (lineas de psicologia, filosofia, etc por poner un ejemplo), y con ello ponerme a leer libros, ver documentales, aprender de un tema que de otra manera hubiera tardado o no llegado a conocer, ÂĄsÃ! me parece interesante... seria como estar con HAL en mi propia nave espacial. Aprender un idioma, matemÃĄticas o jugar al ajedrez con HAL, seria un extra, un entretenimiento, pero al RAZONAR, la IA de la nave me ayudaria a conocerme mejor. Lo que se llama metacogniciÃģn y que ahora el marketing de la informatica maquilla como AGI o SUPER AGI.
Hola... aquà si que estamos en la direcciÃģn de GPT-5 y mÃĄs! He realizado una pruebas y es impresionante, por ejemplo el cÃģdigo generado con 4o y o1 es de un niÃąo a un experto. Como todo tiene muchas limitaciones como no poder adjuntar archivos y no puede buscar en internet y no lo veo en el playground aunque creo haberlo visto y luego desapareciÃģ...? plop!
Hice la prueba sin o1 y lo hizo bien la prueba de ordenar alfabÃĐticamente.: Paso 2: Ordenar los nÚmeros alfabÃĐticamente Al ordenar estos nÚmeros alfabÃĐticamente en espaÃąol, el orden serÃa el siguiente: Catorce Cien Cinco .......Ochenta CIEN Paso 3: Identificar el primero El primer nÚmero en orden alfabÃĐtico es Catorce. Por lo tanto, el nÚmero "Catorce" es el primero cuando se ordenan los nÚmeros alfabÃĐticamente en espaÃąol.
Para consultas legales. Ver si es capaz de razonar como un abogado ante un conflicto jurÃdico y emitir un veredicto justificÃĄndolo con la ley Para consultas contables. Ver si sabe aclarar dudas para la declaraciÃģn de la renta y otros modelos impositivos
Xavier, hablabas de o1 y dijiste que se podÃa probar. Disculpa pero no podÃĐs probar o1, probaste o1-preview que no tiene los mismos porcentajes de test, por lo que no estÃĄs probando exactamente lo mismo
el que mejor resuelve es Claude y al parecer hasta Llama 3.1, Chatgpt OpenAI - io aun esta en proceso verde, hay que esperar 3 meses a que tenga mejor resultado.
En el primer prompt dice ââĶPedro empieza a apagar una detrÃĄs de otraâĶâ, cuando lo correcto, al menos para el espaÃąol que manejamos en Mexico seria, ââĶPedro comienza a APAGARLAS una TRAS otraâĶâ. Quitar el plural cambia el sentido de lo que es estÃĄ apagando Pedro, y decir detrÃĄs es que fÃsicamente estÃĄ apagando una con un obstÃĄculo de por medio. El punto de esto es que me asombra la capacidad de comprensiÃģn que tiene el sistema para que, sin importar modismos o costumbres, sino tomar a una lengua como un todo en sus posibles diversas variables de modismos regionales de cada pais, entienda perfectamente el sentido del prompt.
Modelo de caso de uso, Menu semanal que comprende tres platos de comida y tres de cena, en el que haya en cada menÚ un primero plato, un segundo plato y un postre, con la condiciÃģn A) Que se puedan tener hechos y guardados en la nevera o el congelador por siete dias y que solo haya que recalentarlos alen el microondas B) Que estÃĐn equilibrados en calorÃas, proteÃnas y vitaminas c) Que en la medida de lo posible sean de alimentos baratos
Muy interesante. Para muchos va a ser duro ver aparecer probablemente o2, o3, o4, etc luego saltar nÚmeros, cambiar de letra etc etc (como es un clÃĄsico en marketing) pero mientras haya progresos se puede soportar. Muy bueno lo de la cabra. Este modelo se cabrea. Ok! Se cabrearÃĄ tambiÃĐn el modelo o2?
Reflaction les asusto tanto que sacaron su modelo incompleto, prÃĄcticamente es el mismo proceso que usa reflaction, solo que el men lo saco sin afinarlo bien, pero OpenAI si que se asuto y dijo: lo sacamos ahora o este men se nos adelanta, espero que el men saque su modelo ya ajustado y ahora que tiene un buen ejemplo creo que lo sacara con mejores resultados jajaajajja
Exactamente, la IA reflexionando es el siguiente y paso. OpenAI creÃa que eran los Únicos, pero se llevaron la sorpresa cuando alguien filtro el reflection
@@franprimolarry Naaa si funciona solo que el men no lo ajusto bien y lo saco sin hacer buenas pruebas, ademas es el mismo proceso que usa OpenAI, solo que OpenAI lo usa en todos los procesos, osea en cada generaciÃģn de token de llm incluso en las busquedas, es por eso que te consume una barbaridad de tokens, 15 dolares por millon de tokes santo dios ajajajajaj
@@franprimolarry dicen que se uso la api de claude. Pero la esencia del programa de hacer que la IA reflexione fue un exito. Debido a eso Claude sonnet respondia de manera mucho mas acertada. Por eso el paso siguiente es implementar reflection en los modelos
Javier pero hay una manera de usar el chat gpt o1 gratis? Porque en chat bot arena aun no esta y en la pÃĄgina de chat gpt sale que si esta pero solo para miembros de chat gpt4 plus osea de paga. Sabes como usarlo de forma gratuita?
aunque parezca absurdo en los humanos tambien nos pasa algo similar, pensamiento 1 de pensar las cosas rapidas y pensamiento 2 cuando nos tomamos tiempo de pensarlo, lol es curiosa la analogia
Mejorar el chatgpt es un trabajo interdisciplinario. El proceso de la mente es justamente un sistema y que funciona bastante bien, por lo que contratan expertos en psicologÃa y intentan aplicar los distintos aspectos del funcionamiento de la mente, esto ayuda a mejorar chatgpt
pues nose xq tanta insistencia ennresolver problemas que nos gustan resolver ?, mejor metan la ia al campo de la economÃa y polÃtica, ellos si deben quedar sin trabajo
Lo he probado y no me gusta. Tarda siglos en responder, te pone limites a los mensajes demasiado restrictivos y tampoco razona tanto. Me quedo con Chatgtp Omni
Algo que me gusta del nuevo modelo es que no se esfuerza en hablarte como si fuera una persona, cosa que odio, porque creo que no es necesario salvo que sea eso lo que se desee explÃcitamente.
Yo lo utilicÃĐ para generar ideas artÃsticas partiendo de una asociaciÃģn de palabras al azar y las divagaciones que realizÃģ en su razonamiento fueron fascinantes
Yo creo que el tema del overfitting es normal que no estÃĐ resuelto porque parece que esta tÃĐcnica se aplica sobre el modelo base, por lo que como el overfitting es un problema estructural es mÃĄs difÃcil de mitigar.
Las noticias sobre IA se volvieron campaÃąas especulativas. Quien dice tener la mejor herramienta inexistente, es aquel que estÃĄ marcando el trending de noticias.
Lo que pasÃģ con Reflection70b (Todo este tiempo fuÃĐ Claude con un prompt) fuÃĐ todo un circo, aunque curiosamente ese mÃĐtodo de prompteo y cadena de pensamientos es lo que se estÃĄ empezando a usarse con modelos de cÃģdigo abierto con resultados fascinantes
Yo creo que no, esta tÃĐcnica complementa y mejora los modelos anteriores, por lo que aplicarla a modelos de base superiores darÃa mejores resultados.
Siento que me estÃĄn manipulando algunas IAs que uso, al principio no tenÃa errores como los que a veces tengo con el mismo modelo o superiores a este. Uso los de OpenAI y Google
Yo siempre escribà con "b" palabras que sabia que llevaban "v". Y era por que simplemente razonÃĐ que lo importante es el mensaje/idea/ informacion que transmitia lo que escribÃa, y la ortografÃa era simplemente una perdida de energÃa. Y si vamos a las raices de los idiomas(refiriendome a miles de aÃąos atras, tribus) tiene sentido...la inteligencia artificial podria estar trabajando de forma similar
PodrÃas servir para detectar alucinaciones en respuestas a otros modelos cuando no podemos permitirnos fallos? Creo que todavÃa no estÃĄ conectado a internet, y no sÃĐ si hace cÃĄlculos matemÃĄticos precisos, pudiendo usarlo para resolver problemas matemÃĄticos numÃĐricamente...
No estÃĄ conectado a internet de momento y sÃ, una funciÃģn interesante serÃa como corrector de respuestas finales de otros modelos para corregir alucinaciones. Muy buena idea!
Si, respecto a la Última pregunta me he dado cuenta que muchas veces razona de mÃĄs, el preview sobre todo, apuesto a que el mini contesta mejor, en programaciÃģn me estÃĄ pasando, lo logra hacer (cosa que es sorprendente) pero escribe cÃģdigo de mÃĄs, innecesario, ineficiente.
@@XavierMitjana Las IAs van a terminar quitÃĄndoles discos a las mancuernas que las neuronas de muchos levantan en su dÃa a dÃa si la herramienta no se usa con sabidurÃa.
Planteo un problema: Un cubo tiene 11 de sus 12 aristas tienen una resistencia de 1 Ohmio y la otra arista tiene una resistencia de 1.5 Ohmios. Las conexiones a la fuente de alimentaciÃģn se realizan por dos esquinas opuestas del cubo. No hay una Única soluciÃģn para este problema porque no indicamos la posiciÃģn de la resistencia diferente. Creo que dependiendo de la posiciÃģn de esa arista habrÃĄ dos valores diferentes para la soluciÃģn. Se sabe que, usando tÃĐcnicas de anÃĄlisis de redes elÃĐctricas y simetrÃa, la resistencia efectiva entre dos esquinas opuestas de un cubo donde cada arista tiene una resistencia de 1/6 Ohmios. Esto es un clÃĄico que Chat-GPT 4o identifica. El problema planteado rompe la simetrÃa del circuito y eso complica bastante el cÃĄlculo evitando simplificaciones por romper la simetrÃa y ChatGPT 4o no ha podido resolver.
Por lo que estuve viendo, en la parte de la explicacion de su razonamiento escribe todo asi nomas, muchas veces hasta escribe cosas sin sentido y las faltas de ortografia ni hablar. Pero fuera de esa solapa de razonamiento escribe perfecto!
Son prompts de control, que es la clave para identificar si de entrada hay mejoras entre un nuevo modelo y los anteriores. No tiene ningÚn sentido probar prompts diferentes porque no habrÃa manera de establecer una primera comparaciÃģn con modelos anteriores.
SUSCRÃBETE a mi NEWSLETTER y recibe un GPT de regalo:
ð bit.ly/ia-newsletter_
CASO DE USO nivel alto. Realizar la programaciÃģn de un grupo de 100 tÃĐcnicos teniendo en cuenta todas las variables de vacaciones, horas diarias, tareas, turnos, etc. Caso que solventaria problemas de miles de empresas, tanto del transporte, seguridad, mantenimiento, etc
Suscrito desde ase buen rato ðĨ
9:33 "Aciendo la lista" ðĐð Mis ojoooos
ÂĄÂĄNo me extraÃąa que te duelan con esa agudeza!! Mis dieces caballero.
Si, se ha metido una falta curiosa y eso que rara vez le he visto cometer una falta a los modelos anteriores.
ðŪ
@@XavierMitjana Se le perdona a HopenAI
@@juaninbits OpenHay
Este man no decepciona
Bravo, ya razonan, seran de mucha utilidad
Hola, les comento que a los modelos anteriores les pedÃa tareas sencillas como: lÃstame las palabras que no tienen la letra A en la primera estrofa del himno de Colombia y no lo hacÃa. Era una tarea que cualquier niÃąo de 9 aÃąos es capaz de hacer. Pues bien, esta nuevo modelo si lo hizo
No contento con eso, hice una prueba mucho mÃĄs completa: le pedà un soneto de amor, con rima perfecta, y sin la letra A. Sobra decir que los modelos anteriores ni me hacÃan el soneto y lo componÃan usando la A. Este modelo sà lo hizo. Se los comparto
Soneto sin la letra "A"
En tu brillo interior, mi ser yo descubrÃ,
Sin tu luz sublime, mi mundo es sin fulgor;
Eres tÚ sendero, mi brillo interior,
Contigo encontrÃĐ lo que un tiempo perdÃ.
Tus ojos reflejos de un bello sentir,
En silencio profundo, tu pulso yo oigo;
Mi ser sin tu voz es solo un sitio frÃo,
Contigo yo entiendo lo que es vivir.
En noches sin fin, tus sueÃąos vigilo,
Eres el susurro dulce del viento;
En tu gesto encuentro todo mi contento,
Sin ti, mi existir es solo un sigilo.
Eres luz sin fin, mi mejor sentir,
Contigo deseo por siempre vivir.
Tu comentario es buenÃsimo ð me sorprendiÃģ mucho muchÃsimo bastante bastantisimo ðððļ
Xavier, me gusta tus videos. sobre el problema del bote para mi contestÃģ correctamente con las 2 opciones ya que en la pregunta no se especifico la capacidad del bote.
lo que estaria bueno en futuras actualizaciones del modelo es que antes de que suponga, le pregunte al usuario su duda.
capaz esto se puede agregar a la pregunta como:
"-pregunta-. si tienes alguna duda, antes de suponer, podes preguntarme mas informaciÃģn" o algo parecido
proba de nuevo pero con esto a ver si llega a preguntarte antes de que suponga
Completamente de acuerdo, la pregunta es ambigua a la primera y segunda respuesta. Sino se especifica la capacidad de la barca no queda mas remedio que responder eso.
En realidad, si te fijas bien, en la segunda opciÃģn respondiÃģ mal, ya que primero dice que asume que no caben los 2 en el bote y en el primer viaje pone tanto a la cabra como el humano en el bote y luego continua con la estructura de la respuesta de un acertijo tÃpico.
Vamos, que responde mal por un problema de overfitting que es lo que testea este prompt y por eso estÃĄ redactado de este modo.
Yo creo que en el problema del bote el programa ha hecho una interpretaciÃģn de la pregunta de una manera muy literal. Indicando que tÚ (el conductor) tienes que pasar a una persona y a una cabra al otro lado del rÃo. Es decir que en realidad interpreta que hay dos personas y una cabra.
@@arkavilla Eso es. Si se mejora el prompt especificando la cantidad de personas exactas y sobre todo la capacidad del bote, probablemente solo arroje la primera respuesta que dio con independencia de la pregunta similar del dataset, y no discuto que no infiera que el razonamiento aplique desde su dataset que es dÃģnde se basan sus datos, pero si se elimina la ambiguedad dudo mucho que devuelva 2 respuestas.
â@@XavierMitjana reviendo el video. PensÃĐ que te referÃas a equivocado en dar dos opciones. Pero como decÃs, es en la resoluciÃģn del segundo el error. Mala mia.
Estaba pensando, estarÃa bueno que la ia pudiera "visualizar" usando la parte visual para poder imaginar el ejemplo
Muchas gracias por el vÃdeo, Xavier. Mi propuesta de casos de uso es sobre la fÃsica cuÃĄntica: sonido, frecuencia, vibraciÃģn, resonancias de un objeto con otro
Gracias Xavier! voy a ver que le puedo pedir, que me simplifique tareas... lo que me gusta que si bien mis exigencias son moderadas estoy con el diseÃąo de algunos proyectos y voy haciendo ajustes y ya va teniendo un backround de mis pedidos temÃĄticos, no necesito reforzar mucho los prompt, es como tenemos una conversaciÃģn fluida, al menos durante el proceso de ese diseÃąo (de cursos de aula virtual por ejemplo, temarios, objetivos... etc, como por citar algo) El punto estÃĄ en no alternar el tema. Saludos, desde CÃģrdoba, Argentina
ayer lo vi con DotCSV en vivo, tambien queria ver tu opiniÃģn, tremendo lo de Strawberry, saludos
GRACIAS!!! Bendiciones. Para ediciÃģn de Video!
Muchas gracias por el vÃdeo Xavier!!! Que gozada ððð ð
Para la determinaciÃģn de la pena en deercho penal ha podido calcular las penas a imponer en un 90%. Y ha podido calcular con bastante exito los criterios orientadores de honorarios de al menos dos colegios de abogados.
O sea que puede ser mejor que un abogado
@@dalniery9385 si pero al final siempre necesitaras a un experto para que haga las preguntas al final de cuentas
TambiÃĐn resuelve bien al decirle que te diga oraciones aue ermine con la palabra manzana.
En el Último problema ademÃĄs plantea un razonamiento que hace inviable que pasen la persona y la cabra al otro lado ya que dice que la barca solo soporta uno a la vez, es decir, o a la persona o a la cabra. TenÃa que haber preguntado que analice su segunda respuesta a ver que contestaba.
Xavier, yo creo que el problema de las velas es mÃĄs un problema de tokenizador que de lÃģgica, como los de contar las letras, realmente no sabemos muy bien como parte las palabras en tokens (y una 'vela' no deja de ser una 'palabra' o varios tokens) o como relaciona luego los tokens entre si. Me imagino que si le dices cuantos trozos de vela quedan en cada caso de forma numÃĐrica acertarÃan casi todos los modelos (digo casi por no mojarme mucho âš) Si que es una pasada ver este nuevo modelo en acciÃģn. Gracias.
En este caso no creo que fuese un problema del tokenizador, porque los otros modelos llegaban consistentemente a la conclusiÃģn opuesta, la vela mÃĄs corta es la que consideraban que se apagaba primero, por lo que parecÃa mÃĄs un fallo en la lÃģgica en este caso. Lo cierto es que este modelo lo ha solucionado de modo impecable, por lo que por ahà parece que la mejora es clara. Pero habrÃĄ que probarlo mÃĄs a fondo.
@@XavierMitjana Si siempre usas el mismo prompt ÂŋNo te has planteado que puede que respondan con la mÃĄs corta por ser la Última de la serie? Si, lo de este modelo ha sido espectacular, a mi me ha encantado como ha 'contado' los segmentos 08:16 digamos que 'extrayendolos' del contexto y enmarcÃĄndolos (le ha faltado ponerles un cabo de vela .ð)
âAciendo la listaâ y ordenando cinco despues de cincuenta y cincuenta y uno. Lo que me sorprende es que Xavier no se haya dado cuenta. Confiamos mucho en estas soluciones y hay que andarse con pies de plomo, son muy Útiles para codear, pero para ciencias y mates estamos bastante lejos de ofrecer calidad universitaria
tambiÃĐn cometiÃģ un error al ordenar alfabÃĐticamente con cincuenta antes que cinco, serÃĄ que ya es hora de cambiar los prompt de pruebas dado que tal vez ya se haya entrenado con ellos?
Excelente video Xavier. Una observaciÃģn si regresas al punto en el que en el prompt del "bote" la IA estÃĄ razonando dice esta "Aciendo" con un grueso error de ortografia.
Exactamente querÃa comentar lo mismo
SÃ, se le ha colado un error enorme, los otros modelos jurarÃa que no les he visto nunca un error ortogrÃĄfico.
FuncionarÃĄ con Marketin Digital? Algo que estÃĄ constantemente cambiando
Otro modelo de caso de uso.
Tengo un coche el.electrico con una autonomÃa segura de 400 KM y probable de 450 Km quiero ir de Albacete a Amsterdam. ÂŋCual es el recorrido y las paradas mas adecuado que debo hacer de acuerdo con la informacion de electrolineras existentes y en que puntos donde debo dormir y comer.
Yo creo que los modelos asi, pensantes no tienen limite si razona de ese modo el limite es nuestra imaginaciÃģn.
Gracias por el video, aclarando mis dudas sobre los nuevos modelos. Saludos de Chile.
Muchas Gracias Xavier.
Jaja ve que tan bueno es el nuevo modelo planificando y que intente resolver la economÃa mundial y su transiciÃģn de una economÃa de mano de obra humana a una completamente automatizada, que dicte polÃticas de cuando y en que etapa de la curva de automatizaciÃģn comenzarÃa a introducir el UBI si es que lo recomienda claro. GPT4 obviamente se la lÃa con esto y quiÃĐn no pero si este modelo puede resolver eso es muy poderoso.
interesante y claro
Muy agradecida ðððððð
Muchas gracias. Para analizar fondos de inversiÃģn? No se le puede meter PDF,
Pero si le das los datos entiendo que si puede analizar y comparar
Pero segÚn estoy viendo en 10'12" estÃĄ mal ordenado, cinco debÃa estar antes de cincuenta
Yo acabo de crear la extensiÃģn SEO para chrome perfecta sin tener idea de cÃģdigo.
Ya era hora de que sacaran algo, que lleva una racha OpenAI que no veas, todo anuncios y ni una release XD Gracias por el vÃdeo! :)
Pues lo testearÃĐ un poco en lo que me queda de suscripciÃģn, y si veo que me sirve seguirÃĐ, pero si no le encuentro un caso de uso Ãģptimo para mÃ, creo que el mes que viene probarÃĐ la versiÃģn pro de Claude.
La verdad es que tal y como lo han planteado, ahora es apenas una demo, no es funcional para pensar en ÃĐl como herramienta de uso habitual debido a las limitaciones de mensajes semanales.
@@XavierMitjana SÃ, son exageradamente pocos XD Pero aÚn asà en principio me servirÃĄn para probar. Tengo en la recÃĄmara un par de proyectos donde hacer un razonamiento lÃģgico y muy profundo es fundamental, y por ahora ningÚn modelo me ha conseguido ayudar, asà que creo que me servirÃĄn como benchmark del o1 (y si ademÃĄs me soluciona alguno, pues mira, mato dos pÃĄjaros de un tiro ^_^)
Saludos! Excelente vÃdeo, como va avanzando esta tecnologÃa! ðŪ
PodrÃas enviarle un archivo, por ejemplo un examen o una tarea de escuela y que actÚe como un profesor, la corrija y le adjudique una calificaciÃģn. Eso ayudarÃa mucho a los maestros a corregir muchos exÃĄmenes a la vez ð
solo una cosa que no me cierra, cuando dices que intenta colar la respuesta con mas limitaciones en el ultimo caso, creo que eso es una fase de su procedimiento donde se plantea otras interpretaciones posibles para luego contrastar y confirmar cual es la mejor respuesta; en otros casos se ha visto de contempla situaciones mas locas, pero luego vuelve a cordura...
Gracias Javier
Hola. Me encantas tu publicaciones. Te go una duda , si ya tengo GPTs creados puedes hacer que ocupen este MODELO.
Hola Rodrigo, no, OpenAI no deja seleccionar que modelo usan los GPTs.
jaja, que gracioso la prueba de la cabra y la persona que pasan el rio en una barca.
Min 12:08 ðŪ ReprobÃģ el examen de doctoradoðĨšðð§ Quien sabe en donde habrÃĄ comprado su "phd"
SerÃa interesante intentar crear GPTs personalizados con la ayuda de estos nuevos modelos.
Justo este es uno de los casos de uso que tenÃamos en mente. Tengo curiosidad por ver si es capaz de crear prompts de sistema mÃĄs afinados.
11:06 ese ya lo hace bien gpt4-o ð
MÃĄs que un modelo, esto es un sistema. O en otras palabras, la incipiente inteligencia de los agentes trabajadores del futuro (2025)
SerÃa posible hacer un prompt que permitiera la resoluciÃģn de un problema de forma dialogica? Es decir, que se le permitiera hacer observaciones que pudiera consultar con la persona para hacer un razonamiento dialogado.
Hay una indicaciÃģn de Openai que seÃąala que no debe pedirsele chain-of-thinking al modelo o1.
Caso de uso a testar: Xavi, 4o falla bastante (aunque Últimamente ha mejorado) en encontrar bibliografÃa real de cualquier tema. En no alucinar. Que use fuentes reales y verificables es un must en la investigaciÃģn con IA. SerÃĄ que el nuevo modelo ha mejorado en esto? Ãnims nano, que ho fas molt bÃĐ ;)
En el video dices que estÃĄ pensado para investigadores del campo de la salud en secuenciaciÃģn de cÃĐlulas, fÃsicos que necesiten fÃģrmulas matemÃĄticas complejas o para programadores que trabajen en entornos complejos. Mi pregunta es: ÂŋESTO ES RAZONAR? A mà me suena a mÃĄs capacidad de cÃĄlculo y mejores respuestas al interrelacionar y elegir opciones. Cuando tenga una conversaciÃģn continua con O1, podrÃĐ notar cÃģmo responde y me ayuda en algÚn tema (ÂĄMUY! acertado el comentario de que le faltarÃa conexiÃģn a internet). He visto 3 videos mÃĄs con pruebas a O1, muy chulos, pero mi relaciÃģn con los LLM es en ÃĄmbito de informaciÃģnâĶ no le voy a pedir cÃĄlculos matemÃĄticos en acertijos. ÂĄSÃ! Me pareciÃģ interesante un ejemplo donde se le daba informaciÃģn de un hospital y que calculara cantidad de personal necesario, programaciÃģn lineal del horario semanal, minimizaciÃģn de costos, etc. ÂĄPero repito! ÂŋEn eso estarÃa razonando? ÂŋMe estarÃa resolviendo un problema general? O mÃĄs bien, Âŋsolo ayudando en un problema de productividad? Esto es lo que me da igual de la inteligencia artificial, lo mismo que me daba igual en la llegada de Internet y su locura de programar pÃĄginas web. Tarde o temprano lo resolverÃĄ un ordenador. A mà no me aporta ningÚn reto vital real. En cambio si charlando con una IA, adopto un enfoque nuevo sobre un tema, en base a contrastar literatura temÃĄtica (lineas de psicologia, filosofia, etc por poner un ejemplo), y con ello ponerme a leer libros, ver documentales, aprender de un tema que de otra manera hubiera tardado o no llegado a conocer, ÂĄsÃ! me parece interesante... seria como estar con HAL en mi propia nave espacial. Aprender un idioma, matemÃĄticas o jugar al ajedrez con HAL, seria un extra, un entretenimiento, pero al RAZONAR, la IA de la nave me ayudaria a conocerme mejor. Lo que se llama metacogniciÃģn y que ahora el marketing de la informatica maquilla como AGI o SUPER AGI.
Hola... aquà si que estamos en la direcciÃģn de GPT-5 y mÃĄs! He realizado una pruebas y es impresionante, por ejemplo el cÃģdigo generado con 4o y o1 es de un niÃąo a un experto.
Como todo tiene muchas limitaciones como no poder adjuntar archivos y no puede buscar en internet y no lo veo en el playground aunque creo haberlo visto y luego desapareciÃģ...? plop!
Hice la prueba sin o1 y lo hizo bien la prueba de ordenar alfabÃĐticamente.:
Paso 2: Ordenar los nÚmeros alfabÃĐticamente
Al ordenar estos nÚmeros alfabÃĐticamente en espaÃąol, el orden serÃa el siguiente:
Catorce
Cien
Cinco
.......Ochenta CIEN
Paso 3: Identificar el primero
El primer nÚmero en orden alfabÃĐtico es Catorce.
Por lo tanto, el nÚmero "Catorce" es el primero cuando se ordenan los nÚmeros alfabÃĐticamente en espaÃąol.
En todas mis pruebas anteriores el modelo GPT4o respondiÃģ mal a este prompt, deberÃĐ volver a probarlo.
Hola, en OpenAI dijeron que no se le diga al modelo que piense paso a paso. Saludos
Para consultas legales. Ver si es capaz de razonar como un abogado ante un conflicto jurÃdico y emitir un veredicto justificÃĄndolo con la ley
Para consultas contables. Ver si sabe aclarar dudas para la declaraciÃģn de la renta y otros modelos impositivos
Xavier, hablabas de o1 y dijiste que se podÃa probar. Disculpa pero no podÃĐs probar o1, probaste o1-preview que no tiene los mismos porcentajes de test, por lo que no estÃĄs probando exactamente lo mismo
el que mejor resuelve es Claude y al parecer hasta Llama 3.1, Chatgpt OpenAI - io aun esta en proceso verde, hay que esperar 3 meses a que tenga mejor resultado.
En el primer prompt dice ââĶPedro empieza a apagar una detrÃĄs de otraâĶâ, cuando lo correcto, al menos para el espaÃąol que manejamos en Mexico seria, ââĶPedro comienza a APAGARLAS una TRAS otraâĶâ. Quitar el plural cambia el sentido de lo que es estÃĄ apagando Pedro, y decir detrÃĄs es que fÃsicamente estÃĄ apagando una con un obstÃĄculo de por medio.
El punto de esto es que me asombra la capacidad de comprensiÃģn que tiene el sistema para que, sin importar modismos o costumbres, sino tomar a una lengua como un todo en sus posibles diversas variables de modismos regionales de cada pais, entienda perfectamente el sentido del prompt.
Aciendo
Sin duda es un gran paso
Modelo de caso de uso,
Menu semanal que comprende tres platos de comida y tres de cena, en el que haya en cada menÚ un primero plato, un segundo plato y un postre, con la condiciÃģn
A) Que se puedan tener hechos y guardados en la nevera o el congelador por siete dias y que solo haya que recalentarlos alen el microondas
B) Que estÃĐn equilibrados en calorÃas, proteÃnas y vitaminas
c) Que en la medida de lo posible sean de alimentos baratos
Muy interesante. Para muchos va a ser duro ver aparecer probablemente o2, o3, o4, etc luego saltar nÚmeros, cambiar de letra etc etc (como es un clÃĄsico en marketing) pero mientras haya progresos se puede soportar. Muy bueno lo de la cabra. Este modelo se cabrea. Ok! Se cabrearÃĄ tambiÃĐn el modelo o2?
9:25 Vaya! Escribe con faltas de ortografÃa...
Me gustan tus testeos
Gracias. Cual es el link de acceso para probarlo?
ÂŋPuede evaluar la rentabilidad de un negocio?
Lo probarÃĐ tengo doctorado en fÃsica y en la pasada versiÃģn deberÃĄs no supera a un alumno de lic
CÃģmo te fue?
@@fidellinares6400 lo estuve probando y no puede programar un simple ajuste a lorenzianas para hacer conciliaciones a espectros, le falta mucho
Que golazo pagar la suscripciÃģn de ChatGPT. Jajaja
Reflaction les asusto tanto que sacaron su modelo incompleto, prÃĄcticamente es el mismo proceso que usa reflaction, solo que el men lo saco sin afinarlo bien, pero OpenAI si que se asuto y dijo: lo sacamos ahora o este men se nos adelanta, espero que el men saque su modelo ya ajustado y ahora que tiene un buen ejemplo creo que lo sacara con mejores resultados jajaajajja
Exactamente, la IA reflexionando es el siguiente y paso. OpenAI creÃa que eran los Únicos, pero se llevaron la sorpresa cuando alguien filtro el reflection
Parece ser que fue una estafa
@@franprimolarry Naaa si funciona solo que el men no lo ajusto bien y lo saco sin hacer buenas pruebas, ademas es el mismo proceso que usa OpenAI, solo que OpenAI lo usa en todos los procesos, osea en cada generaciÃģn de token de llm incluso en las busquedas, es por eso que te consume una barbaridad de tokens, 15 dolares por millon de tokes santo dios ajajajajaj
@@franprimolarry dicen que se uso la api de claude. Pero la esencia del programa de hacer que la IA reflexione fue un exito.
Debido a eso Claude sonnet respondia de manera mucho mas acertada.
Por eso el paso siguiente es implementar reflection en los modelos
Era ingenierÃa de Prompt cuando prometÃan un finetuningâ@@italo9537
Javier pero hay una manera de usar el chat gpt o1 gratis? Porque en chat bot arena aun no esta y en la pÃĄgina de chat gpt sale que si esta pero solo para miembros de chat gpt4 plus osea de paga. Sabes como usarlo de forma gratuita?
aunque parezca absurdo en los humanos tambien nos pasa algo similar, pensamiento 1 de pensar las cosas rapidas y pensamiento 2 cuando nos tomamos tiempo de pensarlo, lol es curiosa la analogia
Mejorar el chatgpt es un trabajo interdisciplinario. El proceso de la mente es justamente un sistema y que funciona bastante bien, por lo que contratan expertos en psicologÃa y intentan aplicar los distintos aspectos del funcionamiento de la mente, esto ayuda a mejorar chatgpt
Es raro que en la segunda prueba, el chat escriba "haciendo" sin ache. ÂŋA quÃĐ podrÃa deberse?
Hola cuando abro Chatgpt y doy click arriba a izqueda no me salen modelos q salen a ti en el video
Le pedi qje utilizara la erramienta de buscador en tiempo real y lo hizo.
AÚn no estÃĄ disponible ðĒ
pues nose xq tanta insistencia ennresolver problemas que nos gustan resolver ?, mejor metan la ia al campo de la economÃa y polÃtica, ellos si deben quedar sin trabajo
Lo he probado y no me gusta. Tarda siglos en responder, te pone limites a los mensajes demasiado restrictivos y tampoco razona tanto. Me quedo con Chatgtp Omni
"Aciendo" sin "H", un super PHD
Algo que me gusta del nuevo modelo es que no se esfuerza en hablarte como si fuera una persona, cosa que odio, porque creo que no es necesario salvo que sea eso lo que se desee explÃcitamente.
Yo lo utilicÃĐ para generar ideas artÃsticas partiendo de una asociaciÃģn de palabras al azar y las divagaciones que realizÃģ en su razonamiento fueron fascinantes
Gracias por los tutoriales y el valor que aportas. Dicho lo cual al parecer que con el tema de la cabra se pierden ðģ
Yo creo que el tema del overfitting es normal que no estÃĐ resuelto porque parece que esta tÃĐcnica se aplica sobre el modelo base, por lo que como el overfitting es un problema estructural es mÃĄs difÃcil de mitigar.
Ahora toca compararlas en el chat bot arena :v
Las noticias sobre IA se volvieron campaÃąas especulativas. Quien dice tener la mejor herramienta inexistente, es aquel que estÃĄ marcando el trending de noticias.
Lo que pasÃģ con Reflection70b (Todo este tiempo fuÃĐ Claude con un prompt) fuÃĐ todo un circo, aunque curiosamente ese mÃĐtodo de prompteo y cadena de pensamientos es lo que se estÃĄ empezando a usarse con modelos de cÃģdigo abierto con resultados fascinantes
Fuente ???
@@di-egohumilde4515 Arial 12
El ciudadano de a pie solo lo usa para hacer memes y montajes.
Porque el ciudadano de a pie es un npc
Minuto 9:34. Responde como parte de su razonamiento con una falta de ortografÃa ("Aciendo" la lista). ÂŋQue explicaciÃģn tiene?
ÂŋSerÃĄ este el fin de los modelos anteriores? OpenAI-o1 parece ser el futuro de la IA. ÂŋQuÃĐ opinan ustedes? ðĪ
Yo creo que no, esta tÃĐcnica complementa y mejora los modelos anteriores, por lo que aplicarla a modelos de base superiores darÃa mejores resultados.
Programar es pensar no teclear dijo sabiamente un exponente de la ProgramaciÃģn aÃąares atrÃĄs...
Siento que me estÃĄn manipulando algunas IAs que uso, al principio no tenÃa errores como los que a veces tengo con el mismo modelo o superiores a este. Uso los de OpenAI y Google
Los prompt funcionan mejor sin la chain of thought
Yo siempre escribà con "b" palabras que sabia que llevaban "v". Y era por que simplemente razonÃĐ que lo importante es el mensaje/idea/ informacion que transmitia lo que escribÃa, y la ortografÃa era simplemente una perdida de energÃa. Y si vamos a las raices de los idiomas(refiriendome a miles de aÃąos atras, tribus) tiene sentido...la inteligencia artificial podria estar trabajando de forma similar
ACIENDO la lista. JAJAJAJA.
Han percibido el error ortogrÃĄfico en la palabra "aciendo"?
FaltÃģ probar algo de matemÃĄtica.
En el prÃģximo vÃdeo termino de exprimir los mensajes, el lÃmite de 30 a la semana me ha tenido un poco limitado.
PodrÃas servir para detectar alucinaciones en respuestas a otros modelos cuando no podemos permitirnos fallos? Creo que todavÃa no estÃĄ conectado a internet, y no sÃĐ si hace cÃĄlculos matemÃĄticos precisos, pudiendo usarlo para resolver problemas matemÃĄticos numÃĐricamente...
No estÃĄ conectado a internet de momento y sÃ, una funciÃģn interesante serÃa como corrector de respuestas finales de otros modelos para corregir alucinaciones. Muy buena idea!
Si, respecto a la Última pregunta me he dado cuenta que muchas veces razona de mÃĄs, el preview sobre todo, apuesto a que el mini contesta mejor, en programaciÃģn me estÃĄ pasando, lo logra hacer (cosa que es sorprendente) pero escribe cÃģdigo de mÃĄs, innecesario, ineficiente.
Bro lit esta pasando recien... Es progresivo... Hace dos aÃąos ni se pensaba esto... Ahora uf... La eficiencia incrementara
"Aciendo"
SÃ, se le ha colado un error ortogrÃĄfico curioso.
Pero el nÚmero quÃĐ deberÃa ser el primero es el cuatro no el catorce
Hola Luis, no, la respuesta correcta es catorce, alfabÃĐticamente fÃjate que uno empieza por "ca" y el otro por "cu".
@@XavierMitjana Las IAs van a terminar quitÃĄndoles discos a las mancuernas que las neuronas de muchos levantan en su dÃa a dÃa si la herramienta no se usa con sabidurÃa.
Pinta a que le han metido un prompt de pensamiento al 4o. Por cierto, me ha asesinado ChatGPT escribiendo "Aciendo"
SÃ, parece una metodologÃa que combina CoT con RLHF, pero supongo que es algo mÃĄs complejo.
Puso "cinco" despuÃĐs de "Cincuenta y uno", por lo cual lo respondiÃģ incorrectamente.
Cierto, en la cadena de razonamiento hubo un error, pero identificÃģ bien el primero de la lista, que es algo que hasta ahora todos fallaban.
Me parece que CINCO alfabÃĐticamente va antes que CINCUENTAðĪ
Cierto, en la cadena de razonamiento hubo un error, pero identificÃģ bien el primero de la lista, que es algo que hasta ahora todos fallaban.
es solo tarda mas en las respuestas, y creo es mas complicado. pero no pudo responder que es FLUX 1.0 :) me mando una fruta
Ha ordenado mal los nÚmeros, ha puesto cincuenta antes que cinco
+1
Planteo un problema: Un cubo tiene 11 de sus 12 aristas tienen una resistencia de 1 Ohmio y la otra arista tiene una resistencia de 1.5 Ohmios. Las conexiones a la fuente de alimentaciÃģn se realizan por dos esquinas opuestas del cubo.
No hay una Única soluciÃģn para este problema porque no indicamos la posiciÃģn de la resistencia diferente. Creo que dependiendo de la posiciÃģn de esa arista habrÃĄ dos valores diferentes para la soluciÃģn.
Se sabe que, usando tÃĐcnicas de anÃĄlisis de redes elÃĐctricas y simetrÃa, la resistencia efectiva entre dos esquinas opuestas de un cubo donde cada arista tiene una resistencia de 1/6 Ohmios. Esto es un clÃĄico que Chat-GPT 4o identifica. El problema planteado rompe la simetrÃa del circuito y eso complica bastante el cÃĄlculo evitando simplificaciones por romper la simetrÃa y ChatGPT 4o no ha podido resolver.
Aciendo???? le faltÃģ la H
Mmm no me gustÃģ mucho estÃĄ capado a las imÃĄgenes y la informaciÃģn especializada
Por lo que estuve viendo, en la parte de la explicacion de su razonamiento escribe todo asi nomas, muchas veces hasta escribe cosas sin sentido y las faltas de ortografia ni hablar. Pero fuera de esa solapa de razonamiento escribe perfecto!
Nomas version de paga :(
Me tiene cansado sus prompt repetidos. Todoa usan esos prompt y la AI ya empieza a conocer y responder bien a punta de cansancio.
CAMBIA TUS PROMPT
Son prompts de control, que es la clave para identificar si de entrada hay mejoras entre un nuevo modelo y los anteriores. No tiene ningÚn sentido probar prompts diferentes porque no habrÃa manera de establecer una primera comparaciÃģn con modelos anteriores.