Un CHIP que EJECUTA IA x20 MÁS RÁPIDO ¿QUÉ?| Cerebras y Magic
ฝัง
- เผยแพร่เมื่อ 22 ก.ย. 2024
- Nuevos avances en chips ahora permiten acelerar x20 la inferencia de la IA. Cerebras presenta su nuevo procesador con velocidades de vértigo. Al mismo tiempo la empresa Magic presenta su nuevo modelo LTM con ventana de contexto de 100M de TOKENS!
👉 Demo Voz Cerebras
cerebras.verce...
👉 Noticia Cerebras
cerebras.ai/in...
👉 Noticia Magic LTM
magic.dev/blog...
🔴 Mi canal principal (DotCSV) / dotcsv
- ¡MÁS DOTCSV! --
📸 Instagram : / dotcsv
💸 Patreon : / dotcsv
👾 Twitch!!! : / dotcsv
🐥 Twitter : / dotcsv
🔴 SUSCRÍBETE PARA MÁS NOTICIAS Y TUTORIALES DE IA SEMANALES! :)
Grande Carlos !
Grande Carlos y Muchas Gracias!!!
y si le pido que me enseñe ingles?? es que cuando salgan estas cosas van ha ser una locura.. adios profesores por desgracia o suerte ya no se que decir jaja
Gracias Carlos por escucharnos/leernos o al menos hablo por mí, estás haciendo lo que justo esperaba de este canal, que subieras videos mucho más seguido con las últimas noticias, novedades, avances, pruebas, filtraciones, anuncios, papers, etc, sobre la IA en general. Quizá sin tanta edición como te gusta subir al otro canal pero con mucha más regularidad. Excelente!
Así como en su momento 1 mega era una locura y ahora nos parece nada, va a llegar un día en el futuro que la gente va a decir "100 millones de ventana de contexto? Fuaa, no se hace nada con eso"
Jajaja sera litaral cuando te dicen que los computadores antiguos funcionaban lo Kilobytes de ram
Ni siquiera eran procesadores cuánticos 🤣🤣🤣
@@Andylium o "como podian teclear letra por letra en eso que llamaban teclado? no se cansaban? con lo facil y rapido que es usar la voz y la vista xd"
@@TheGuitarnobeso lleva pudiendo hacerse muchos años y nunca tuvo excesivo éxito. Yo alguna vez le dicto al móvil pero normalmente escribo jeje
"Ah, pero antes se jugaba a los videojuegos con mandos y pantallas? No se transmitía al cerebro la imagen y sonido y se conectaba el mismo cerebro de manera inalámbrica para simular los movimientos como si fueran reales???"
Algunos tienen tu nivel la académico pero no explican con la pasión que lo explicas tú Carlos👍👍
8:59 "colaste uno mas", que increible !!
Silencio , DotCSV acaba de subir video
🗿
Lo lograste, me hiciste sentir vértigo. Todo esto me parece una locura, aún más que este disponible al público.
Gracias por mantenernos informados sobre estos temas, grande DotCSV Lab
Es increíble como cada vez que te escucho hablar acerca de estos temas haces conclusiones y traes ideas nuevas que muchos casos no se me habían venido a la cabeza me encanta poder ver el contenido de una persona con tanto para aportar muchas gracias
No tiene sentido hablar de t/s sino de total cost of ownership. Es como usar un Ferrari para repartir pizzas porque es más rápido . Lo importante es cual es el coste de inversión , mantenimiento , energía, vida útil.
He estado estos días trabajando con librería LangGraph (un proyecto de LangChain) que básicamente lo que permite es tratar a los agentes de IA como nodos interconectados en un gráfico. Por supuesto, se pueden llegar a hacer sistemas de “pensamiento” bastante interesantes, aunque tardan un montón en correr, ya que requiere hacer llamadas a multitud de nodos que procesan y realizan inferencia sobre las predicciones de los otros nodos a lo largo del gráfico. Pero con todas estas caídas en la velocidad de inferencia, me explota la cabeza con solo pensar los gráficos que se podrían llegar a construir de esta manera. 🤯
Hola podrías recomendarme algunos topicos para entender sobre ese tema?
Trata de entender primero las bases de langchain (runnables, chains, tools, invokations) entender esto te facilitara el aprendizaje de langraph
@@andresfeliperiostamayo7307o primero de ML xd
langchain no es una mala libreria, pero es una libreria que tarde o tempranqo al aumentar su complejidad va a tener problemas de rendimiento, es facil desarrollar con ella, pero luego creas unas cosas que tardan muchismo, y mas si le metes a cada agente RAGS o herramientas v para generar chains, etc , preferiría usar directamente una base de datos de grafos y pasar la lógica de langchain a un lenguaje mas veloz, de nada te sirve usar groq, o cerebras si tienes un cuello de botella en el lenguaje, ademas hay que implementar paralelizacion, y un monton de etc para crear una solucion medianamente decente y mas potente de lo que estamos viendo, algo con un diferencial, asi que langchain no se yo si sea el futuro del desarrollo de la IA. y lang:graph se me hace mas una copia de los KGS implementados por neo4j con exito.
Léete toda la saga de Harry Potter y escribe un octavo libro teniendo en cuenta los 7 anteriores, siendo creativo y coherente con las tramas de los personajes desde el primer libro hasta el final del séptimo.
No se podrá vender, pero saldrán historias interesantes de estos experimentos. Entretenimiento infinito, libros que nunca acaban... Locura.
Excelente idea!! Sería mejor que haga los 19 años que Rowling se salteo
Que locura lo de la conversación pufff😮
¿Los inicios de los "cerebros positrónicos" de Asimov?
Justo acabo de ver la noticia y ya hay video
Que buen servicio, tome mi like
Y hay gente viviendo en una burbuja diciendo q esto de la IA es una burbuja...
Hola, lo es.
@@Ajbn12321 Te parece que con todos los avances que estamos teniendo sea una burbuja? te parece normal hablar con la computadora como si fuera una persona y tener una conversacion que perfectamente podrias tener con un amigo?
solo el tiempo lo dira, por ahora solo veo avances muy rapidos
Lo mismo se decía de los videojuegos y ahora hasta hay carreras universitarias, también del bitcoin y ahora algunos se arrepienten de haber vendido antes de tiempo.
Me dio vértigo, escalofríos... y hasta miedo xD
Cómo sería un modelo que pueda recordar todo lo que ha pasado en toda la historia del internet, incluyendo videos, imágenes y audio?
Ahora ya no parece tan descabellado que un LMM pueda procesar el texto paralelamente como secuencias de imágenes, que es bastante más parecido a lo que hacemos nosotros cuando estamos hablando de algo, lo visualizamos en nuestra cabeza. Somos seres bastante visuales ya que la visión aporta una enorme cantidad de lógica al contexto, por eso la "imaginación" es un concepto que evoca información visual. Esa lógica interna puede ser un world model muy potente que pueda prevenir la mayoría de alucinaciones.
wow
Sos mi guía para estudiar e investigar las IA. Saludos desde Argentina!
Ajajaja, algo anda mal si un influencer es tu guia de investigacion 😹
@@israelaaronpino6843 guia para aprender más, al menos una de las tantas que tengo. ¿Molesta que deje un comentario por el trabajo que hace dotCSV por el trabajo que hace? Que ganas de andar comentando pavadas que tienes Israel
@@josegastoncirvini1444me preocuparia, si fuera tu, que investigues academicamente con un influencer. Tomalo o dejalo, soy libre de comentar, adios
Excelente video. En algún momento regresarán los live de programación. Saludos.
Esto es como cuando pasamos de gpt2 a gpt3 hace más de 4 años
Me encanta que estés subiendo vídeos informativos más a menudo. Genial el video, da vértigo como tu dices.
Que locura este momento histórico que estamos viviendo. Gracias por compartir.
Va a existir una escasez de papel de baño 🧻 y toallitas húmedas
Estoy de acuerdo, los vídeos del otro canal son increíbles, pero al ritmo al que se generan avances se me hace más útil vídeos sencillos en edición y directos pero más frecuentes.
Con esa conversación quedé 😱
Pensé que estaba viendo un video del otro canal, solo con un fondo diferente. Recién al final me di cuenta que este era un canal alternativo jaja. Ahora también me suscribí a este otro canal, me ayuda a estar informado sobre los últimos avances de manera muy amena y no vendes humo como otros youtubers, que a veces parece que prostituyen su contenido por views.
Muchas gracias por la información... Tremendo..... Y lo que falta.... Saludos desde Mexicali, Baja California, México
Gracias por tu trabajo Carlos. He aprendido muchísimo con tus vídeos y sigue siendo mi canal favorito 😊
Gran video Carlos!!!! Un abrazo!!!😏
El Primer Cerebro Positrónico 🥳🎉🎉🎉🎉🎉
Busca ayuda.
Eres un pro Carlos, me gusta tu trabajo. Vamos pa adelante.
Este es el futuro, lo que debe pasar para que se pueda analizar desde la cámara el mundo real sin filtrar tanta información.
15:47 Es cierto Carlos 😮😮 Eso sería muy útil en Adobe After Effects y Blender donde tienen una ventana para hacer scripts de Javascript y Python (los famosos "embeddable languages") pero están como modificados para que sólo funcionen en esos programas. El modelo podría leer la documentación y actualizarse para escribir el código en esos lenguajes que nunca había visto 😮👍
Me ha faltado una comparación con el famoso chip de Nvidia Blackwell B200 para entender lo que significa esto.
Hay un informe que habla de Blackwell B200 trabajando en llama 70B a 23.000 tokens por Segundo
Singularity is here
Excelente video Carlos!
Muchas gracias por la información, realmente una locura como está avanzando este compo de la ciencia.
Enorme Carlos, eres lo mejor ❤ Creo que muy muchos agradecemos tu contenido. Muchas gracias
Gracias Carlos, esperando más vídeos 👌
¿Donde se pueden comprar acciones de Cerebras?
Estoy probando la conversación con cerebras y va muy lento y se corta. Deben estar a tope 😢 a ti te ha ido de lujo Carlos. Espectacular
Posiblemente lo estemos saturando ahora entre todos 😅
Al momento de este mensaje va muy bien, estuve hablando como 1h y me encantó, creo que esto se va a convertir en una herramienta de estudio muy poderoza en cualquier disciplina.
@@DotJuansan si, a mí también me fue bien hoy. Es impresionante
Mi canal favorito de Inteligencia artificial
Gracias Carlos por tanto conocimiento que nos brindas, un gran saludo desde Chile 🎉
muy interesante este video de hoy. 🎉
Voy montado en la ola de la AI siguiendo canda noticia 🤯 en tu canal.
¿Cuantos meses para alcanzar la singularidad?
Listo... ya está. Esto es "HER" (la película).
😅 No puedo dejar de pensar en cuánto más rápido podríamos tener respuestas si estos chips fueran la norma. ¿Alguna vez hemos sido testigos de un avance así en la tecnología?
Hola amigo el canal es increíble gracias por el contenido
Vaya, una IA puede tener una conversación más fluida que yo xdn't
Lo probé hoy, wow me gustó, excelente para conversaciones filosoficas o para pasar el tiempo y muchisimo mas
Imagínate eso aplicado al código secreto de la biblia, ya no tendríamos que estar buscando.
Genial video!
Chegamos ao futuro finalmente.
Muy buenas reflexiones
El futuro pinta demasiado bueno o demasiado espeluznante si personas inescrupulosas usan toda esta tecnología para el mal.
Un saludo dot :)
Consulta. ¿Esto puede aplicarse a Q*, para sortear lo que comentaban que era lento como para sacarlo como producto?
Soy solo yo o estas IAs están alcanzando niveles de poder cosmológicos más allá de lo exponencial y de lo sobrehumano y están por dejarnos bien atrás en una fracción de tiempo infinitesimal 😨
Eres solo tú🤣🤣
🤔Y si dejamos que el modelo elija los hiper parámetros. Entrenar un modelo que decida cuáles son los hiper parámetros necesarios (óptimos) para una respuesta predeterminada. Hay preguntas que no necesitas tantos tokens para responderlas, más creatividad menos creatividad. Que antes de responder, un agente independiente (entrenado para eso) decida los hiper parámetros del LLM.
Igual también entrenar al modelo con tiempo. O un modelo a parte que este rastreando el tiempo que tarda la pregunta y respuesta. Esto le da contexto sobre el tiempo.
--Ing Rey HB 🧠👍
vaya locura lo exponencial de esto. ¿Como sera el 2030? en que ni me lo imagino. Que es que va todo taaan rapido que es que ni puedo estudiarlo... vaya locura...
La IA avanza poco a poco es interesante, también este es un buen canal gracias por tus análisis Carlos.
Interesantísimo. Lo que no me queda claro es si realmente a NVIDIA le ha salido competencia como para poder perder su envidiable posición dominante en menos de un par de años. Lo pregunto porque supestamente su ventaja tecnológica frente a sus competidores inmediatos, se antojaba enorme, prácticamente inalcazable en unos cuatro o cinco años.
No puedo esperar a ver el estado de la IA en el año 2054.
Uhhhhh, es demasiado bueno, con esa velocidad....
No hay punto de comparación con nada... Pero entiendo que open ai no podría ofrecer esto porque sería para tanta gente que no dan abasto
no hacwe lo quewle pide. es porquería. ni siquiera sabe dar su nombre.
todavia, pero habria que esperar que incorporen estos nuevos chips
Gracias Carlos
Que bien lo explicas
Que carreras se estudia para poder adentrarse en este mundo y tener una minima posibilidad de trabajar para alguna empresa de esa categoria?
Incluso estaria bueno un video explicando sobre esto. Yo se que hay personas que tenemos mucho interés en esto y nos gustaría adentrarnos mas, pero no tenemos idea por donde arrancar
Ciencias de la computación
El problema que veo es que esto va tan rápido que no hay una cultura empresarial capaz de sacarle partido a los usos derivados. O mejor dicho, la cultura empresarial actual no está al nivel para entender y gestionar este mundo de posibilidades. Hay 2 tipos: los que ignoran totalmente está revolución y los que tienen expectativas totalmente fuera de rango.
si, es un ciclo que habrá pasado siempre. una buena lectura de los acontecimientos.
Pues sí que da vértigo toda esta información, pero lo que es impresionante es la aplicación de voz de Cerebras, es curioso que tiene la facultad de hablar en idioma español, eso sí, con un acento difícil de entender y a veces un poco espanglish, pero lo curioso es que no entiende nada si le hablas en español. Pero es una brutalidad la cantidad de información que te da haciéndoles simples preguntas, además en lo poco que he podido probar parece información veraz.
Y la demo? No hay link
de acuerdo a la curva de desarrollo tecnológico, ya en el 207 aprox., se hablaba de que para el 2025 un chip de u$1000 tendría la capacidad de procesamineto de un cerebro humano y para el 2030 un chip con el mismo costo va tener la capacida de procesamiento de todo el globo. Puede parece fantasioso pero al rtimo que vamos parece cada vez más posible.
fe de erratas 207: 2017
Excelente
Increíble video me encanta
Excelente
Deberías hacer asociación con cr7 para presentar nuevas técnicas al análisis deportivo.
DIOS QUE MARAVILLOSO
gracias
hola buenas noticias, la segunda inicia en 9:34
Y qué hay de Colosus?
Brutal
Ese modelo de 100m de tokens, si es bueno o comparable a llama 3.1 70b literalmente acabaría con los rag.
Yo simplemente le pregunto varias cosas del texto para ver como analiza el interior de los textos.
8:58 literalmente "Her"
es una basura. no sirve. no te deja hablar. solo da la chapa.
Se me ocurre que si procesas info 10 veces más rápido, no solo puedes procesar 10 veces más info, sino también tener 10 veces menos procesadores
Una oblea todo el chip??😮😮😮😮
Buenas, consulta, saben una IA para traducir todo un texto de ingles a Español?
Y consulto también una IA para ponerle vos diferente a un video para publicidad.
*Todo eso está muy bien 100M de contexto y tal...pero se supone que aparte de 'agujas en el pajar' ... ¿será tambien capaz de comprender a la sociedad de las agujas, su política, sus pensamientos intimos..sus sueños?...*
*O sea...si le doy las tres partes del señor de los anillos y me contesta:*
*"Esto va de hobbits, magos y un tuerto"...pues no está nada mal.*
*"Esto va de diferentes razas y etnias que conviven bajo el temor a un tirano que amenaza su existencia"...pues está bastante bien*
*"Esto está mal, hay una incoherencia entre la definicion y uso del tabaco de la cuaderna del este y una observacion que hace Zarquino al respecto de los cuidados requeridos por las hojas mientras lo apuñala serpiente"....pues ya empieza a ser otro nivel.*
mientras esten en la nube es un negocio para ellos y no para nosotros ;(
Es bueno para nosotros mientras sigan las suscripcionea free. Ahora, puedes comprar las maquinas e implementas un modelo IA en tu local.
lo de cerebral esta de lujo
Gracias tqm
Ya lo probe y es demasiado rápido😊😊
cuál es la música de fondo?
Que miedo!
Es tremendo.
Habla un poco como la chica de socratica, ¿No?
Me gustaría aprender IA pero siento que son las empresas con todo el poder de procesamiento los que realmente pueden hacer algo bueno, o alguien cree algo diferente?
La información será 10 veces mas rápido es como si estuvieras en in juego 3 días y solo fueron 30 minutos es fascinante.
Sobre todo porque 30 minutos x 10 da 3 días 🤣🤣🤣🤣
@@BibliaExacta es una forma de decirlo no lo tomes tan en serio.
* cerebras si te puede responder en idioma español, solo que no se le puede preguntar en otro idioma que no sea ingles.
Estás noticias son mucho más interesantes que las filtraciones de openAI.
No sé en qué piensan en openAI. Deberían estar apostando por el hardware. Multiplicar x10 la velocidad de respuesta de un modelo es multiplicar x10 las posibilidades de cobrar tokens...
Su estrategia tendrán, lo que no se sabe es si será buena o mala pero ahí está el mundo de la inversión el riesgo etc... Como ha dicho Carlos esos chips nuevos son muy específicos y están en el nicho de la inferencia con una determinada arquitectura de transformars. Y si openai estuviera investigando otra arquitectura y esos chips quedarán obsoletos porque están pensados para esa arquitectura? No se sabe...
@@marcc0183 tienes razón. Aunque la imagen que proyecta openAI es la de centrarse únicamente en el software.
excelente noticia para que bajen de precio las GPUs.
hola?
será curioso cuando seamos ancianos y los niños no entiendan como podíamos vivir con la tecnología actual
❤❤❤
Esto si da miedo el potencial que puede tener 🤔