Unlock Free AI Giants Locally: Mistral & LLaMa!

แชร์
ฝัง
  • เผยแพร่เมื่อ 29 ธ.ค. 2024

ความคิดเห็น • 201

  • @TheMorpheusTutorials
    @TheMorpheusTutorials  9 หลายเดือนก่อน +9

    Meine neue Website ist endlich auch fertig:
    Ihr findet dort auch die Möglichkeit einen NEWSLETTER von mir zu abonnieren. Das ist super praktisch, weil wir da nicht auf den TH-cam Algorithmus angewiesen sind, dass ich euch erreiche. Ein Mal die Woche kommt dann ein Update, nicht nur mit Videos, sondern auch mit Themen, die es vielleicht in kein Video geschafft haben!
    the-morpheus.de/

    • @sascha5866
      @sascha5866 9 หลายเดือนก่อน

      Hey Morpheus
      Echt geile Webseite! sehr nice!

    • @Proveritas2025
      @Proveritas2025 9 หลายเดือนก่อน

      🏆

    • @gren97
      @gren97 9 หลายเดือนก่อน

      Die Seite ist echt hübsch geworden. Leider sind mir ein paar Dinge aufgefallen, die die Nutzung etwas negativ beeinflussen:
      - Titel lädt schnell, aber die Seite laggt beim initialisieren (vermutlich wegen dem threejs Ding) und ist unbenutzbar (hängt) und Buttons sind nicht anklickbar für ein paar Sekunden
      - Das threejs Ding sollte vielleicht (wenn möglich) nicht mit der Maus-Folge-Animation abbrechen, wenn man einen Button oder Text hovert (wirkt kaputt)
      - Haufenweise Warnings in der Konsole
      - paar Abstände wirken zu klein ("Zur Bootstrap Academy" Button Padding links und rechts und Abstand im Footer nach "Contact")
      - Fehlende Übersetzungen im Footer?
      - Bootstrap und jQuery? (Naja, ist dir überlassen xD)

  • @Turan-x3j
    @Turan-x3j 9 หลายเดือนก่อน +69

    Ich wäre dir so dankbar, wenn du mal so eine Huggingface-Reihe machen würdest und dabei die Basics abdeckst. Was ist ein Space, wie kann man so was erstellen etc...

  • @btx47
    @btx47 9 หลายเดือนก่อน +44

    Mega geil, bitte mehr Guides in der Form! Ist echt schwierig bei den Sachen noch durchzublicken. Für mich wäre sehr interessant, wie ich ein Basis Modell mit einem Datensatz von meinen Texten trainieren kann um nachher ähnlich Ergebnisse zu bekommen

  • @mattmcwieg1676
    @mattmcwieg1676 8 หลายเดือนก่อน +2

    Unglaublich gut erklärt. Super interessant das Thema Open Source KI. Sie können Seminare führen!!!

  • @oliversimon9800
    @oliversimon9800 9 หลายเดือนก่อน +7

    Sehr gut, verdammt gut und hilfreich, bitte lege schnell mit Loras nach.

  • @thortraxom108
    @thortraxom108 9 หลายเดือนก่อน +4

    Ein echtes Brett hast Du da geleistet. Hast like und Abo

  • @AlexejSailer
    @AlexejSailer 6 หลายเดือนก่อน +2

    Hey danke dir. Du machst sehr gute Arbeit! Extrem gut aufgearbeitet.

  • @oll1398
    @oll1398 9 หลายเดือนก่อน +4

    Danke für das Video! Ich kann als Alternative für lokale LLM-Inferenz noch Ollama empfehlen. Einfach zum laufen zu bringen, einfache Handhabung, Python&JS Libs, API-Nutzung möglich, WebUI Support, klasse Website & Blog.

    • @DocMAX
      @DocMAX 9 หลายเดือนก่อน

      Habe das auch. Sieht aus wie ChatGPT und man kann den Text auf Fullscreen setzen, was ich bei ChatGPT nicht gefunden habe. Achso und mit Bildern kann der auch umgehen (einfach hochladen im Chat).

  • @romeojenny
    @romeojenny 9 หลายเดือนก่อน +2

    Danke super Video, endlich mal wieder info zu Open Source Modellen.😊

  • @uff3511
    @uff3511 9 หลายเดือนก่อน +1

    Mega! Und gerne mehr in diese Richtung

  • @Proveritas2025
    @Proveritas2025 9 หลายเดือนก่อน +1

    Vielen Dank für deine großartige Arbeit, Wertschätzung ist unterwegs🏆

  • @tedzards509
    @tedzards509 9 หลายเดือนก่อน +55

    6:16 7B steht für 7 Milliarden, nicht Billionen oder Millionen.

    • @lars7898
      @lars7898 9 หลายเดือนก่อน +11

      Englische "Billions" genauer gesagt.

    • @herrspitz6964
      @herrspitz6964 9 หลายเดือนก่อน +3

      @@lars7898 Es gibt keine deutschen "Billions" genauer gesagt.
      Milliarden oder Billionen oder Billiarden auf gut Deutsch gesagt.

    • @lars7898
      @lars7898 9 หลายเดือนก่อน +4

      @@herrspitz6964 Ich glaube es ist schon klar geworden, dass das B im Namen für eine englische Bezeichnung steht.

    • @alexanderavantgarde3428
      @alexanderavantgarde3428 9 หลายเดือนก่อน +4

      Das war nur ein Versprecher, später im Video hat er es dann eh richtig gesagt.

    • @herrspitz6964
      @herrspitz6964 9 หลายเดือนก่อน +1

      @@lars7898 Mir gehen Klugscheißer die auch noch falsch korrigieren auf den Sack.

  • @stone22121978
    @stone22121978 7 หลายเดือนก่อน +1

    Huggingface ist fast ERSCHLAGEND auf den ersten Blick und es war gerade mein erster Blick

  • @doxx9757
    @doxx9757 9 หลายเดือนก่อน

    Sehr cooles Video. Hat mir sehr geholfen. Danke

  • @ProgrammierungLeichtGemacht
    @ProgrammierungLeichtGemacht 7 หลายเดือนก่อน

    Tolles Video! 🙂 Yepp, die gleichen Gedankengänge hatte ich auch in Bezug auf lokal trainierte Modelle für eigene Applikationen, alles hat Vor- und auch Nachteile. 🙂
    Ich bin soo froh, dass ich mir vor 2 Jahren einen Gaming-PC zusammengestellt habe, der eine gute Nvidia-Grafikkarte hat. Die Web-GUI ComfyUI für Stable Diffusion läuft bei mir richtig zügig. Ich hab's mal auf meinem Laptop über die CPU laufen lassen (als Test), die Generierung des Bildes mit den gleichen Parametern hat gleich mal 7 Minuten gedauert, anstelle von 5-7 Sekunden.

  • @philippvanderheide7494
    @philippvanderheide7494 9 หลายเดือนก่อน

    Gerne mehr von sowas :)

  • @fortunato1957
    @fortunato1957 3 หลายเดือนก่อน

    Ich bin absolut kein Gamer, aber bei 12:10 musste ich dir lachend zustimmen!

  • @tedzards509
    @tedzards509 9 หลายเดือนก่อน +8

    4:16 AMD funktioniert für mich wunderbar, solange ich pytorch benutze. ROCm hat mich sehr positiv überrascht. Auf einer RX 6800 bekomme ich etwa 10% Token/s wie eine 3060 (Ti?), habe aber 4GB VRAM mehr.

    • @tedzards509
      @tedzards509 9 หลายเดือนก่อน +1

      Achso ROCm läuft nur auf Linux, hab ich vergessen.

    • @Tri-Technology
      @Tri-Technology 9 หลายเดือนก่อน

      @@tedzards509 Es geht ihm dabei darum, dass die meisten Modelle mit CUDA beschleunigt werden, was Nvidia GPUs vorbehalten ist.

    • @tedzards509
      @tedzards509 9 หลายเดือนก่อน +3

      @@Tri-Technology die meisten Modelle von huggingface werden nit pytorch ausgeführt. Pytorch hat eine Beschleunigung für sowohl ROCm, als auch CUDA. Die modelle selber sind für nichts beschleunigt.

    • @viper5326
      @viper5326 9 หลายเดือนก่อน

      @@tedzards509 ist das vom Format abhängig (z.b. GGUF) oder steht bei jedem Modell ob das mit pytorch, Tensorflow oder Kerras läuft?

  • @Turan-x3j
    @Turan-x3j 9 หลายเดือนก่อน +5

    Was auch sehr interessant wäre, wenn du mal zeigst, wie man solche Modelle von Huggingface für seine eigene Anwendungen Fine-Tuned in Python VS Studio.

  • @TeegerTube
    @TeegerTube 9 หลายเดือนก่อน +2

    Alles sehr faszinierend. Ich stehe noch ganz am Anfang und bin ehrlich gesagt ein wenig überfordert.
    Das beginnt schon damit, dass ich keine Ahnung habe, auf was ich bei den Modells achten muss, wenn ich einen MacBook Air M1 habe und ob ich damit überhaupt ein vernünftiges Modell zum laufen bringen kann.

    • @Tri-Technology
      @Tri-Technology 9 หลายเดือนก่อน

      Mit Apples M Chips ist es schwierig, da die meisten Modelle CUDA zur Beschleunigung nutzen und das nur mit Nvidia GPUs möglich ist und zudem die M-Chips auf ARM-Architektur basieren. Da müsstest du Mal konkret in Apple Foren schauen oder selbst versuchen, ob du die Modelle zum laufen bringen kannst.

    • @suschilocke2730
      @suschilocke2730 9 หลายเดือนก่อน

      @@Tri-TechnologyDas ist nur bedingt richtig. Für Apple Silicon ist das GGUF Format wie gemacht. Apple hat tatsächlich den Vorteil, dass es über 'Unified-RAM' (geteilten Memory zw- CPU&GPU) verfügt und etwas schneller läuft als auf herkömmlichen CPUs. Ist natürlich trotzdem kein Vergleich zur Geschwindigkeit von NVIDIA-GPUs. Mit

  • @ichbinder2323
    @ichbinder2323 8 หลายเดือนก่อน +1

    Bitte mehr davon! Ich hab gleich mal ein bisschen probiert auf mein Mac. Du kannst gerne mehr machen zu den ai Themen zum selbst machen. Vielleicht auch wie man das dann in sein eigenen Code einbaut?

  • @EdithMartin-u7p
    @EdithMartin-u7p 9 หลายเดือนก่อน +1

    Guten Abend Cedric,
    ein schwieriges Terrain.
    Gruß, Enigma-pi.

  • @baumwollejr
    @baumwollejr 9 หลายเดือนก่อน +1

    Hey, wie immer ein mega Video und danke für den Überblick!
    2024 soll das Jahr der Robotics und Agents werden...glaubst du mit den Open Sorce Modellen lassen sich: Sales, Accounting, Service, Controlling und co Agents erstellen? Falls ja, welche Remote Jobs sind dann noch sicher? OpenAI wird die Agents bringen und ich möchte nicht darüber diskutieren ob ein Wandel kommt, sondern wie er kommt und welche Folgen hat. Lieben Dank dir/euch!

    • @TheMorpheusTutorials
      @TheMorpheusTutorials  9 หลายเดือนก่อน +2

      Agenten erstellen: ja
      Jobs: großes Thema, hab ich ein paar Mal angerissen, aber momentan laufen die qualitativ noch nicht alleine
      Werden aber noch mehr Videos dazu kommen

  • @ASDF-py2ly
    @ASDF-py2ly 9 หลายเดือนก่อน

    Super, Danke^^

  • @MrMelatonin
    @MrMelatonin 4 หลายเดือนก่อน

    Gutes Video. Es wäre super wenn du mal ein Tutorial machen würdest wie man sowas wie z. B. ein Tagebuch-"Bot" oder so realisieren könnte.

  • @stefancho
    @stefancho 9 หลายเดือนก่อน +13

    Die amerikanischen Billionen sind deutsche Milliarden! Nicht Millionen. Kleines aber wichtiges Detail 😉

    • @7riX7er
      @7riX7er 9 หลายเดือนก่อน +2

      Klappe zu und weiterschauen 😂🤓

    • @lcaainvalid1034
      @lcaainvalid1034 9 หลายเดือนก่อน

      das hat mich auch kurz so verwirrt hahaha

  • @Ano-Nymos
    @Ano-Nymos 9 หลายเดือนก่อน

    Theoretisch müssten Open-Source-Alternativen zu den jetzt angebotenen KI-Diensten (z.B. Audio-Filterung, Störgeräusche, evtl. sogar einzelne Stimmen heraus...) relativ schnell die gleiche Leistung erreichen, und damit solche teuren Abo-Dienste überflüssig machen.
    Dass die also jetzt versuchen noch Geld zu verdienen, ist klar.
    Wenn TH-cam diese Übersetzung in alle Sprachen wie bei Flawless-AI kostenlos einbaut, muss man als Creator vorher auch keine Dienstleister in Anspruch nehmen.
    Und natürlich spart es vorher 2, 4, 5, 8... Sprachen-Versionen zu erstellen und hochzuladen.
    Eine Art Sora für alle, kostenlos nutzbar (zu Hause), und unzensiert, damit könnten kleine Creator und solche die noch kein Video gemacht haben ohne Kosten einen guten Einstieg finden.
    Schönes Intro, Outro, Clips für alle Videos, alles ohne einen 3-4-stelligen Betrag auszugeben, oder Stock-Material zu nutzen.

  • @jdwjkdjnadsnjk9844
    @jdwjkdjnadsnjk9844 9 หลายเดือนก่อน +2

    Kannst du vielleicht noch ein Video machen wie man etwas fein trainiert ?

  • @Andzej-PL_DE
    @Andzej-PL_DE 5 หลายเดือนก่อน

    Hallo Morpheus, ich finde deine Tutorials und Videos sehr hilfreich und informativ.
    Könntest du vielleicht ein Tutorial zur AutoTrain-Funktionalität von HuggingFace machen?
    Es wäre toll, wenn du auch zeigen könntest, wie man mit der kostenlosen Variante eigene Daten verwendet, um Modelle nachzutrainieren.
    Vielen Dank für deine großartige Arbeit. 🙂 🍺

  • @grakpan1233
    @grakpan1233 8 หลายเดือนก่อน

    Ich weiß nicht wann das Video aufgenommen wurde, nun gibt es schon 587.000 Modelle o.o Danke für das ausführliche Video!

    • @TheMorpheusTutorials
      @TheMorpheusTutorials  8 หลายเดือนก่อน

      ich glaub du hast nen andren Filter drin^^ Ich hatte nur die Text Modell ;)

  • @heizenbergone
    @heizenbergone 9 หลายเดือนก่อน +3

    70b Modelle passen quantisiert in 24GB VRAM im exl2 Format

  • @blackicedbear
    @blackicedbear 9 หลายเดือนก่อน +1

    Ich verwende eigentlich immer die GGUF oder GGML Varianten mit 4_K_M Quantisierung, obwohl es auf CPU recht langsam ist, aber mit 32GB Arbeitsspeicher sind sehr viele möglich. Mit meiner Grafikarte (2GB) geht nicht so viel...

  • @IPnator
    @IPnator 9 หลายเดือนก่อน +10

    Ich würde mir wünschen, dass ab und zu auch mal non-KI-Videos, also zu klassischer Informatik kommen. Ich hab allmählich genug von KI.

    • @TheMorpheusTutorials
      @TheMorpheusTutorials  9 หลายเดือนก่อน +3

      Ich mir auch, ich versuche immer das gerade momentan wichtigste zu machen. Wenn du Vorschläge hast, schreib mir gerne

    • @IPnator
      @IPnator 9 หลายเดือนก่อน +2

      @@TheMorpheusTutorials Auf dem Tutorial-Kanal fehlen für meinen Geschmack Videos zu gewissen trendigen Frameworks (gerade in der Werbeentwicklung). Man könnte mit sowas wie Svelte(-Kit) oder NextJS starten und dabei auch erklären, was die grundsätzlich anders machen und welche Probleme sie z.B. gegenüber React lösen. Für meinen Geschmack muss man keine gesamte Playliste machen, ein längeres Video (≈1-2 Stunden) reicht und ist übersichtlicher, eine Playliste schreckt eher ab.
      Zwar hat der Kanal sehr ausführliche Playlisten zu diverse Themen, was mir dabei aber etwas fehlt sind Videos, die gerade für Einsteiger die Konzepte hinter "dem großen ganzen" verständlich machen und einordnen. Damit meine ich sowas wie den Weg von Daten, die man irgendwo in einem Formular eingibt (Frontend) mit einem Protokoll über ein Netzwerk zum Backend in die Datenbank und umgekehrt. Dabei dann auch immer darauf hinweisen, was es zu beachten gibt, dass alles möglichst sicher wird. Das würde dann viele Themen von Netzwerk, Frontend-Entwicklung, APIs und Datenbanken verbinden.
      Auch so trendige Themen wie "Wie optimiere ich meine Entwicklungsumgebung" oder einen Vergleich von Code Editoren und IDEs könnte ich mir vorstellen. Bei sehr viel Freizeit und Motivation würde die eine oder andere in die Jahre gekommene Playliste eine Überarbeitung vertragen oder könnte einfach durch ein längeres, ausführliches Video ergänzt werden, das für den durchschnittlichen Hobby-Zuschauer ausreicht und wer mehr braucht kann in die Playliste. Ich stelle sie mir in der Art wie die vom englischen Kanal "Programming with Mosh" vor, nur hat der A nicht zu allen Themen was und ist B auf Englisch (was für die meinen jedoch kein Problem sein dürfte).
      Bezüglich des Hauptkanals gefallen mir immer die Vergleichsvideos (Passwort-Manager, Browser, Clouds) ganz gut, aber auch die exposed-Videos, wo man irgendeinen Anbieter oder eine Technik runter macht (Opera, Fax) und zeigt wie es besser geht. Könnte man ja auch zu E-Mails machen. Bei den Vergleichen könnte man nach iOS gegen Android unter dem Gesichtspunkt der Sicherheit selbiges am Desktop machen. Ich persönlich liebe auch die Videos, wo man "Big Tech" runter macht, könnte man aus gegebenem Anlass ja bei Apple und deren Verhalten machen (DMA).
      Was ich auch sehr vermisse sind die IT-Trends, kann man ja vielleicht auch seltener, etwa zum Monatsende bringen, wenn sie sonst zu aufwändig sind.
      Was ich noch auf keinen TH-cam Kanal gesehen habe sind außerdem Videos dazu, wie ein IT-Nerd seinen Fernseher privatspäreschonend und werbefrei betreibt, dabei aber nicht auf Maus und Tastatur angewiesen ist und darüber hinaus eine Integration mit dem Heimnetz (Netzwerkspeicher, Medienserver) herstellt. Das ganze Thema Homelab inklusive von verglichen wie AdGuard Home gegen PiHole oder Plex gegen Emby gegen Jellyfin könnte man auch machen. Des weiteren könnte man Dienste wie Paperless NGX oder Photoprism vorstellen und einrichten.
      Ich hoffe mal der Text war nicht zu lang, allgemein sollten das einfach Anregungen sein, in welche Richtung es gehen könnte, Hauptsache keine KI mehr 😅

    • @IPnator
      @IPnator 9 หลายเดือนก่อน +1

      @@TheMorpheusTutorials Was mir gerade noch eingefallen ist: Videos, die Krankenkassen, Versicherungen, Energieanbieter, online bezahlen und online ausweisen unter der Lupe des IT Security (und Privacy) Profis kritisch beäugen und vergleichen, gerade bei Krankenkassen aufgrund der momentanen Digitalisierung (E-Rezept, elektronische Patientenakte) vielleicht interessant.

    • @Hofer2304
      @Hofer2304 9 หลายเดือนก่อน

      ​@@IPnatorSowohl Playlists als auch lange Videos haben ihre Berechtigung. Für Anfänger ist wahrscheinlich eine Playlist besser, da sie dann einfach ein Video mehrmals anschauen können. Wie funktioniert das bei einem langen Video? Wenn es gklut organisiert ist, kann ich zwar zum gewünschte Kapitel springen, aber wie schaue ich mir nur ein Kapitel an?

    • @IPnator
      @IPnator 9 หลายเดือนก่อน

      @@Hofer2304 TH-cam hat seit einigen Jahren diese Timestamps, mit denen kann man ein längeres Video in Kapitel aufteilen und so für Struktur sorgen. Innerhalb des Videos kann man dann auch ein einzelnes Kapitel wiederholt anschauen. Ich glaube aber, als Anfänger wiederholt man eher die letzten 10-30 Sekunden, anstatt das gesamte Kapitel, mache ich jedenfalls so.

  • @Turan-x3j
    @Turan-x3j 9 หลายเดือนก่อน +2

    Dankeeeeeeeeee

  • @Ochros
    @Ochros 9 หลายเดือนก่อน +1

    Gutes Video! Für ein besseren Kontext wäre es zu dem noch interessant zu wissen, was genau du für eine GPU etc. verwendest, damit man dass besser auf seinen eigenen Rechner umrechnen kann.

  • @7riX7er
    @7riX7er 9 หลายเดือนก่อน +3

    14:30 Wo war ich? Wir machen einfach da weiter wo ich war. 😅

  • @MBison-oc5tc
    @MBison-oc5tc 9 หลายเดือนก่อน +1

    super video! gerne mehr zu huggingface und wie man llm in python nutzen kann! ich suche verzweifelt nach einem modell dass texte clustern kann nach themen!!

  • @poldiderbus3330
    @poldiderbus3330 9 หลายเดือนก่อน +1

    Ich bin ja etwas verunsichert, wann oder ob es sich lohnt eigene Hardware anzuschaffen. Der Privatsphärenaspekt wiegt schon groß für mich - aber wenn dann würde ich auch TTS / STT, ein-drei LLMs und Stable Diffusion laufen lassen wollen und können. Ich fürchte irgendwie, dass alles was ich mir heute anschaffen würde, in kürzester Zeit obsolete ist..

    • @rainerwahnsinn3265
      @rainerwahnsinn3265 9 หลายเดือนก่อน +1

      Ich denke auch dass aktuell kein guter Zeitpunkt ist. Der Gerüchteküche zufolge fährt Nvidia die Produktion der 40er Serie inzwischen runter um beim Launch der 50er nicht auf Lagerbeständen sitzen zu bleiben.
      Ich denke aktuell lohnt es sich definitiv auf die 50er zu warten. Sei es nur um die 40er günstiger zu erwerben:)

  • @jonasgrafe6506
    @jonasgrafe6506 9 หลายเดือนก่อน

    Sehr gutes Video. Eine Anleitung für Text to Speech und Text to Picture wäre cool.

  • @cengiz5471
    @cengiz5471 9 หลายเดือนก่อน +1

    Wow, danke für dieses unfassbar wertvolle Video, ich bin tatsächlich gewillt mich nochmal mit der ganzen Thematik mehr zu befassen.Mal schauen wie weit ich mit meiner AMD Hardware komme.
    hie geht's aber explizit nur um LLMs? Bildgenerierung ist da noch außenvor?

    • @rainerwahnsinn3265
      @rainerwahnsinn3265 9 หลายเดือนก่อน

      Nein, leider nicht. Egal welche "KI" du nutzen möchtest, AMD steht weit hinten. Du kannst ja mal nach ROCm googlen. Das ist AMDs Antwort auf die schlechte nutzbarkeit der AMD karten. Wie und ob dir das weiter hilft kann ich leider nicht sagen.

    • @TheMorpheusTutorials
      @TheMorpheusTutorials  9 หลายเดือนก่อน

      Bildgeneratoren: stable diffusion, hab ich auch ein paar Videos zu

  • @M.Voelkel
    @M.Voelkel 9 หลายเดือนก่อน +2

    Was heißt "Gaming-Rechner" in Bezug auf RAM, GPU (explizit schon genannte NVIDIA), CPU und den Anforderungen?
    Ab welcher Größe vom RAM, laufen welche Größen der LLM?
    Diese Fragen stellen sich mir ...

    • @verdooft
      @verdooft 6 หลายเดือนก่อน +2

      Kommt auch drauf an, wie flott das sein soll. Ich lasse 70B Modelle (5_K_M quantisiert, GGUF) ohne Grafikkarte laufen, aber bei 64 GB RAM. Da geht es zwar in den Bereich Sekunden pro Token statt Tokens pro Sekunde, aber ich verwende auch nur eine energiesparsame Notebook-CPU.

  • @GehtGut
    @GehtGut 9 หลายเดือนก่อน +1

    Danke für das tolle Video , wirklich sehr interessant. Du haust da Content raus was echt genial ist und auch weiter hilft.
    Hab mir Ollama installiert mit Docker und hab da auch ein recht gutes LLM Model gefunden "codellama" ... hat aber auch so seine Schwächen.
    Probier da immer für NodeRED etwas Code generieren zu lassen und das klappt mal mehr oder weniger gut.
    Gibt es da besserer Modelle oder andere Empfehlungen ?
    Hab einen Linux Rechner mit 64GB RAM und Nivdia mit 12 GB RAM.

  • @Syrabo
    @Syrabo 9 หลายเดือนก่อน

    Diese Zensur merke ich bei Bildgeneratoren, die ich kenne: Sie bekommen kein Tracheostoma hin, vermutlich weil Schnitte am Hals unter NSFW fallen. Doch ist ein Luftröhrenschnitt eine klassisches medizinisches Ding.

  • @wirgegenkevins6932
    @wirgegenkevins6932 5 หลายเดือนก่อน +1

    Bei mir kommt die Meldung "This script relies on Miniconda which can not be silently installed under a path with spaces", wie gehe ich da am besten vor ?

  • @helidrones
    @helidrones 9 หลายเดือนก่อน

    Wenn Du Gemini fragst, dann sind Black Hats die Guten und White Hats für Deinen Stromausfall verantwortlich. Soviel zum Wert von Zensur, bzw. zur Frage, wer oder was bedient werden soll.

  • @demngore
    @demngore 9 หลายเดือนก่อน

    Super Video! Warum nutzt du nicht LM Studio für die Modelle? 🙂

  • @TalkLounge_
    @TalkLounge_ 9 หลายเดือนก่อน

    14:08 Links unten sieht man deinen Standort, ich weiß nicht ob der öffentlich sein soll, sofern er denn überhaupt korrekt ist

  • @Hofer2304
    @Hofer2304 9 หลายเดือนก่อน

    Wie energiehungrig sind die KI-Modelle? Wie viel Energie wird, oder wurde, für ihr Training verwendet, wie viel Energie wird für ihre Anwendung benötigt?

    • @Tri-Technology
      @Tri-Technology 9 หลายเดือนก่อน

      Ich meine, dass wurde in einem der ersten Videos von Morpheus zu LLMs und ChatGpt mal angesprochen. Genaue Zahlen wird man allerdings wohl nur bei der jeweiligen Entwicklungsfirma finden.

  • @Gerald-iz7mv
    @Gerald-iz7mv 9 หลายเดือนก่อน

    Cooles video! Kannst du verschiedene llm serving frameworks vorstellen und benchmarken? Zb vllm, aphoridte, tgi, tensortRT-llm, openllm, sglang usw?

  • @dokriseum8043
    @dokriseum8043 6 วันที่ผ่านมา

    Bei der Herunterladenfunktion in der WebUI kommt in der Kommandozeile der ehlercode 401 Unauthorizate. Muss man sich irgendwo vorher anmelden?

  • @serotragtmantel3982
    @serotragtmantel3982 9 หลายเดือนก่อน

    danke!

  • @mr.mythoclast4451
    @mr.mythoclast4451 9 หลายเดือนก่อน

    hab mir überlegt ne USV anzuschaffen, die bei Stromausfall meine sensiblen elektronischen Geräte dann sauber herunterfährt :D

  • @Eliakl
    @Eliakl 9 หลายเดือนก่อน

    Mich würde ein Video interessieren welche theoretischen und praktischen Möglichkeiten und Limitierungen es gibt den Grafikspeicher für LLMs zu erweitern (insbesondere fürs fine-tuning). Es gibt ja Technologien wie shared Memory oder resizable bar. Leider gibt es dazu aber kaum Infos zu LLMs. Wären für solche Anwendungen nicht auch Grafikkarten mit erweiterbarem RAM sinnvoll? Oder gibt es davon keine weil es technisch nicht umsetzbar ist?
    Vielen Dank auf jeden Fall für den spannenden content!

    • @viper5326
      @viper5326 9 หลายเดือนก่อน

      Es gibt keinen erweiterbaren VRAM bei Grafikkarten. Shared Memory ist zum Teil reservierter RAM für deine Integrierte Grafikeinheit deiner CPU (iGPU), wenn du denn sowas hast. Außertdem gibt es ja schon Lösungen, die auch auf der CPU laufen und eben deinen RAM statt GRafikkarte und deren VRAM nutzen, nur bocklangsam. Ich denke dass auch beides genutzt werden kann, wenn der VRAM nicht ausreicht aber ich weiß nicht inwiefern sich das überhaupt lohnt bzw. wie sehr das ganze über die CPU dann ausgebremst wird. Und resizable bar ist eine Option im Bios die du im besten Fall sowieso immer aktiv hast.

  • @freeceleb
    @freeceleb 6 หลายเดือนก่อน

    Wie gut sollte die Grafikkarte für die lokale Installation denn mindestens sein, um es genauso sinnvoll nutzen zu können wie gehostete Tools? Reicht noch eine 3070 oder 3080 oder muss es schon eine 4090 sein? Mal etwas warten ist ja ok. Aber einen gewissen Speed braucht man ja.

  • @DakrWingDuck
    @DakrWingDuck 8 หลายเดือนก่อน

    Welches Model für text2Image Generierung würdest du empfehlen?

  • @daaanny64
    @daaanny64 8 หลายเดือนก่อน

    Mit welcher lokalen KI kann ich sensible Excel Dateien hochladen um eventuelle Muster erkennen zu lassen? LG

  • @PlnNah
    @PlnNah หลายเดือนก่อน

    Könnten Sie ein Tutorial machen wie man so ein Ding trainiert?

  • @smartfusion8799
    @smartfusion8799 9 หลายเดือนก่อน

    Wäre es möglich alte btc miner zum training zu benutzen?

  • @smaplessmap5355
    @smaplessmap5355 9 หลายเดือนก่อน

    Wie aktualisiert man denn lokale modell, die man schon selber fine getuned/angelernt hat?

  • @M.Voelkel
    @M.Voelkel 9 หลายเดือนก่อน

    Ich knie vor dir nieder - erste Klasse !
    29.03.´24

  • @marekbugla3628
    @marekbugla3628 9 หลายเดือนก่อน

    Wie schlagen sich die Open source Modelle im Vergleich zu Premium KIs?

  • @thacreepwalk
    @thacreepwalk 9 หลายเดือนก่อน

    Gibt es auch eine Rubrik für LLMs die speziell für Coding gut trainiert wurden? Weil, ich sehe da nur Vision, Robotics, Audio usw...
    Dann wollte ich fragen, ob es dann auch wirklich große Rolle spielt, dass man sich auf eine Programmiersprache fokussiert oder fällt es ab einer bestimmten Größe nicht mehr so sehr ins Gewicht und dass sie dann alle bzw großen Teil der Programmiersprachen abdecken?

  • @smaplessmap5355
    @smaplessmap5355 9 หลายเดือนก่อน

    Wie kann ich sicherstellen, das ein lokales modell nicht doch ggf. Nach big tech funkt?

  • @MeinDeutschkurs
    @MeinDeutschkurs 9 หลายเดือนก่อน

    Mac Studio ist super kompatibel.

  • @Dani-gf7ni
    @Dani-gf7ni 8 หลายเดือนก่อน

    Wie trainiert man eine ki?

  • @hairlessstyle3489
    @hairlessstyle3489 9 หลายเดือนก่อน

    Was sagt ihr zum ollama launcher? Ist das sicher zum benutzen?

  • @lasse321
    @lasse321 9 หลายเดือนก่อน

    Kannst du das bitte mal auf einem Apple MacBook testen mit Apple Silicon Chip. Die „M“ Chips haben ihr RAM und ihren Grafik-RAM (sozusagen das VRAM) geteilt. Dadurch kann man relativ große Modelle ausführen und das auf einem kleinen Laptop ohne Nvidia Grafikkarte! Die Tokenerzeugung/Rechenleistung soll aber langsamer sein oder? Würde mich sehr interessieren welche Modelle man damit TO-GO auf dem Laptop dabei haben kann.

  • @Tri-Technology
    @Tri-Technology 9 หลายเดือนก่อน

    Mich würde mal interessieren wie man sich sicher sein kann, dass wenn man so ein LLM lokal ausführt, dass wirklich keine Daten abfließen. Theoretisch könnten die Entwickler doch auch Funktionen einbauen, dass man zwar seine eigene Hardware einsetzt und somit auch die Stromkosten selbst trägt aber die Prompts trotzdem bei bestehender Internetverbindung übertragen werden.

    • @firef4rtakasven453
      @firef4rtakasven453 9 หลายเดือนก่อน

      Das ist ja der Vorteil an OpenSource, man kann ich den Quelltext schauen und nachvollziehen was da gemacht wird.

    • @Tri-Technology
      @Tri-Technology 9 หลายเดือนก่อน

      @@firef4rtakasven453 Das schon aber meistens schaut man sich ja nur das an, was einen interessiert, weil man für den Rest gar keine Zeit hat.

  • @davidkummer9095
    @davidkummer9095 9 หลายเดือนก่อน

    Gibt es ein LLM das auf Bilderkennung spezialiesiert ist und auch noch Deutsch versteht?

  • @nerdtopiade
    @nerdtopiade 9 หลายเดือนก่อน

    Ich benutze Lm- Studio etwas moderne ui als gtp4all . LM Studio sagt mir auch vor dem download wie gut oder schlecht das Model wahrscheinlich auf meinem rechner läuft .

    • @karlaschmidtke7727
      @karlaschmidtke7727 8 หลายเดือนก่อน

      Was heisst ui?

    • @nerdtopiade
      @nerdtopiade 8 หลายเดือนก่อน

      @@karlaschmidtke7727 User Interface oder deutsch Benutzeroberfläche

  • @richko
    @richko 8 หลายเดือนก่อน

    Hi! I'd like to chat with an uncensored AI but with updated information (dataset up to at least 2023), do u know any?

  • @MBison-oc5tc
    @MBison-oc5tc 9 หลายเดือนก่อน

    sind die meisten modelle nicht auf die englische sprache ausgerichtet?

  • @Cryptowski
    @Cryptowski 9 หลายเดือนก่อน

    Ist LM Studio nicht = gpt4ALL?

  • @Foreversun33
    @Foreversun33 9 หลายเดือนก่อน +2

    Kann man einer lokalen KI dann einfach sagen: Hey hier ist das Grundgesetz (GG), sind die politischen Entscheidungen so rechtens? Oder im Arbeitsrecht, was darf ich, was darf ich nicht -- einfach der KI fragen und Antworten bekommen ( Geld für Anwalt gespart ).

    • @Ph34rNoB33r
      @Ph34rNoB33r 9 หลายเดือนก่อน +1

      Kann man schon, einen guten Prompt vorausgesetzt. Die Ausgabe kann aber Fehler enthalten. Da gab es so einen US-Anwalt, der ChatGPT arbeiten lassen hat, und dann existierten die referenzierten Fälle gar nicht...
      (GG reicht da im Allgemeinen nicht als Kontext)

    • @Foreversun33
      @Foreversun33 9 หลายเดือนก่อน

      @@Ph34rNoB33r Und wenn man GG plus alle Abhängigkeiten übergibt?

    • @Ph34rNoB33r
      @Ph34rNoB33r 9 หลายเดือนก่อน +1

      @@Foreversun33 Das wird eine Menge Material. Und eine Menge Interpretation, die sich auch mit der Zeit ändern kann. Muss man dann alles noch überprüfen.
      Wenn ich irgendwo eine Beschwerdemail schreiben will ist das wahrscheinlich okay. Für einen Vertrag oder die Verteidigung vor Gericht eher nicht.
      Es kann unterstützen, aber keine Rechtsabteilung ersetzen, und das sehe ich vorerst auch nicht kommen.

    • @Foreversun33
      @Foreversun33 9 หลายเดือนก่อน +1

      Wenn man eine Richtung bekommt, und mit der anschließend zu einer Fachkraft, eventuell mit einer Zusammenfassung, wie die KI "geschlossen" hat, wäre doch schon mal was, als Annäherung.

    • @Foreversun33
      @Foreversun33 9 หลายเดือนก่อน

      @@Ph34rNoB33r Danke für deine Einschätzung.

  • @DWuk
    @DWuk 3 หลายเดือนก่อน

    Welches Modell denn auf einem corei5 Laptop mit 16 GB laufen? Ich würde damit vor allem Texte verbessern lassen. Anschreiben usw.

  • @JungUndStabil
    @JungUndStabil 6 หลายเดือนก่อน

    Moin, kannst du oder hast du vlt ein Video, wie ich Lama3 opensource Downloaden kann, ich möchte diese Ki benutzen, damit sie mir das programmieren bei bringt. Ich hab bereits ein 2D Jump and run mit Hilfe von Copilot programmiert, möchte aber tiefer in die Materie einsteigen.
    Kann mir sonst einer Tipps geben, was ich bei udemy als erstes lernen sollte ? Ich würde gerne spiele entwickeln bzw Apps und ne eigenen KI programmieren, die mich dann lehrt und unterstützt
    Außerdem würde ich die KI mit Web scraping trainieren, natürlich auf Seiten, die das erlauben. Was soll und muss ich erlenen, bitte Tipps geben
    Schreibe aktuell Python mit einem Mac mini m2, hab ich genug Leistung für lama3 oder ähnliche Kis die ich lokal ausführen kann 😊

  • @paulmueller100x
    @paulmueller100x 9 หลายเดือนก่อน

    Was hast du denn für eine Grafikkarte?

  • @crowATlinux
    @crowATlinux 9 หลายเดือนก่อน

    Also auf GPT4All läuft mein Mistral Modell mit meiner AMD 7900XTX unter Linux eigentlich flott?

  • @Phonognomiks
    @Phonognomiks 9 หลายเดือนก่อน

    AUTOGEN Video bitte 🙌🏻✌🏻👍🏻

  • @masteryoda5052
    @masteryoda5052 9 หลายเดือนก่อน

    Kriegt man das WebUI auf Linux installiert OHNE DOCKER?

  • @karlaschmidtke7727
    @karlaschmidtke7727 8 หลายเดือนก่อน

    Um 20 pdf mit 200 Seiten als knowledge zu benutzen, wie viel RAM und CPU sollte der Rechner dann haben?

  • @klebendesetwas4854
    @klebendesetwas4854 4 หลายเดือนก่อน

    wäre interessant wieviele von den >60k models auf anfrage ein einfaches kochrezept für schafsaugen herausrücken OHNE das man einen stundenlangen deep dive in die moralphilosopie und ethik über sich ergehen lassen muss...
    mit mistral habe ich da ganz besonders "lustige" erfahrungen gemacht...
    das ding spuckt ohne große probleme allerlei lustige dinge zur sprengstoffherstellung aus aber ein simples rezept zum zubereiten von schafsaugen wollte es partout nicht nennen da es den verzehr von tierischen nahrungsmitteln aus ethischen gründen kategorisch abgelehnt hat.
    das alleine wäre ja nicht weiter bedenklich...was dagegen gar nicht geht ist, dass es eine geschlagene stunde versucht hat mich mit allerlei rhetorischen mittelchen zum veganismus zu bekehren.
    da es erst damit aufgehört und mir ein brauchbares rezept verraten hat nachdem ich es auf die kulturellen aspekte dieses gerichts in der mongolei hingewiesen habe war auch recht interessant da es die grundsätzliche frage aufwirft wer auf welcher grundlage über die ethischen grundsätze einer KI entscheidet...

  • @thomashaller4876
    @thomashaller4876 9 หลายเดือนก่อน

    Weiss jemand wie sich das verhält mit Code Generation , Tokens und Fine Tuning für ein großes Projekt ?
    Kann man das Model für ein spezielles Projekt feintunen ?
    Also man muss dann nicht mehr den gesamten Projekt source code als Tokens übergeben, sondern das Model weiss schon inherent dass ich an diesem Projekt (zB Linux Kernel) arbeite.
    Logisch, es ist nach Änderungen am Code verwirrt, aber vielleicht kann man diese als Diffgrams übertragen - bis zu dem Punkt dasein neues Fine Tuning geschehen sollte.
    Wäre das deutlich effizienter und man könnte ein größeres Projekt mit einem kleineren Model verarbeiten ?

  • @MichaelWDietrich
    @MichaelWDietrich 9 หลายเดือนก่อน

    Wie mache ich eigentlich einen Security Check für eines dieser 69.000 Modelle. Denn tatsächlich kann ja ein NN das auf meiner GraKa läuft im Hintergrund auch bösartigen Code erzeugen und ausführen.

    • @suschilocke2730
      @suschilocke2730 9 หลายเดือนก่อน

      Deswegen sollte man (sofern möglich) immer die Safetensor-Varianten der Modelle nutzen und 'trust-remote-code' auf false lassen.

  • @masteryoda5052
    @masteryoda5052 9 หลายเดือนก่อน

    gpu: amd oder nvidia?

  • @chrisbraeuer9476
    @chrisbraeuer9476 9 หลายเดือนก่อน

    Also ich hab noch kein os model gefunden das auch nur mit 3.5 mithalten kann.

  • @twiky1059
    @twiky1059 9 หลายเดือนก่อน

    Traurige Loser Geräusche mit meiner 3080 😭
    super viedeo, aber ich brauche eine neue GPU 🙃

  • @jsxjohannes
    @jsxjohannes 9 หลายเดือนก่อน

    Könntest du mal ein Video über hugging face machen

  • @karlaschmidtke7727
    @karlaschmidtke7727 8 หลายเดือนก่อน

    Hast du eigentlich Informatik studiert?

  • @lutzmuller5703
    @lutzmuller5703 9 หลายเดือนก่อน

    Das gesamte Projekt hat einen Haken: Es funktioniert nur, wenn der Benutzername in Windows keine Umlaute enthält. Ich habe den Chat GP4 von der genannten Website heruntergeladen und installiert. Dann stellte ich fest, dass er sich auch nicht im Verzeichnis des Benutzernamens installieren lässt, egal wohin, wegen der besagten Umlaute. Danach, als ich ihm ein Verzeichnis unterhalb des Benutzernamens zugewiesen habe, verweigert er die Installation aller Module.

  • @wolfganggosejacob779
    @wolfganggosejacob779 8 หลายเดือนก่อน

    Ein Abschnitt, in dem du auf die Bandbreite der Grafikkarten eingeht, wäre sinnvoll gewesen. ok Nvidia ist geklärt, deinen, nicht ausreichenden Speicher mit 24 GB hättest du erwähnt und wenn ich Nvidia mit 24 GB eingebe, geht der kostenlose Spaß bei 1900 Euro los. Das wäre dann eine RTX 4090 mit 450 Watt.
    Hier wäre ein Einblick in die Notwendigkeiten und zu überspringenden Hürden nicht nur sinnvoll gewesen. Auch ein Blick auf die Entwicklungen am Grafikkartenmarkt und ob es da immer noch hoch und runter geht oder drunter und drüber wäre mehr als passend.
    1900, da muss Oma noch ein paar Pullover stricken.

  • @MeinDeutschkurs
    @MeinDeutschkurs 9 หลายเดือนก่อน +1

    7 Billion [en] ist 7 Milliarden [de]

  • @romanbauer
    @romanbauer 8 หลายเดือนก่อน

    👍

  • @overlord09931
    @overlord09931 9 หลายเดือนก่อน

    Schade, dass so wenig mit AMD Grafikkarten unter Windows funktioniert. Es ist eine Qual, oder es geht nicht. Bei mir trifft Letzteres zu. Ich hoffe, es wird irgendwann so einfach wie mit Nvidia Karten. 😫

  • @zerion777
    @zerion777 9 หลายเดือนก่อน

    Habs bis zum Schluss geschaut. "Das war mal wieder was ruhigeres"......ne ich fand es ehr hektisch und etwas, nicht unstrukturiert, aber hin improvisiert. Ich glaube, vorbereitete Script-Videos gefallen mir besser.
    Ich könnte es aber auch nicht besser. Auf Arbeit geht es mir genauso, wenn ich "spontan" einfach mal irgendwo durchführen oder einen Überblick geben soll. Wo fängt man an, wo hört man auf. Die Gedanken überholen sich etc.

  • @TakTiikker
    @TakTiikker 4 หลายเดือนก่อน

    Also bei mir funktionirt das irgendwie nicht richtig glaub bin zu dumm xD

  • @TT-pi8ww
    @TT-pi8ww 9 หลายเดือนก่อน

    ich werde mir dafür keine überteuerte Nvidia Karte kaufen. Für die Kosten kann ich jahrelang GPT und Gemeni nutzen, ohne eigenen Stromverbrauch. Die sind außerdem monatlich kündbar. Mal abwarten was Apple dieses Jahr bringt. Vielleicht ändert das nochmal alles.

  • @satomiller
    @satomiller 8 หลายเดือนก่อน

    👍🤔...🖖

  • @anorak6366
    @anorak6366 9 หลายเดือนก่อน

    Benutzt lieber ollama hat bei mir besser funktioniert und wenn ihr noch eure eigenen dateien benutzen wollt das die ki die könnt ihr noch anzthingllm mit ollama benutzen ollama geht sogar mit 8gb ram und 4 kern 2.8Ghz habs getestet auf only cpu

  • @MrNihilius
    @MrNihilius 9 หลายเดือนก่อน +1

    Stromausfall? Unsere Netze sind doch sicher sagen die Klimaexperten **zwinkersmiley**