ONNX - ONNX Runtime, простой пример.

แชร์
ฝัง
  • เผยแพร่เมื่อ 3 ธ.ค. 2024

ความคิดเห็น • 6

  • @tempdeltavalue
    @tempdeltavalue ปีที่แล้ว

    хм, у ваших ipynb файлах виглядає так що ви запускали не використовуючи cuda to(device), hugging face трансформери по дефолту раняться на cpu (ніби) тому це якесь трохи дивне порівняння часу

    • @qdzzzxc8620
      @qdzzzxc8620 หลายเดือนก่อน

      так на сервере без gpu инференс

    • @tempdeltavalue
      @tempdeltavalue หลายเดือนก่อน

      @@qdzzzxc8620
      Ну так .. то все локально ніби раниться , просто порівнювати час інференсу моделі на cpu , як мінімум, дивно (імхо)

    • @qdzzzxc8620
      @qdzzzxc8620 หลายเดือนก่อน +1

      @@tempdeltavalue так смысл сравнивать cuda и cpu, если у тебя на сервере физически нет gpu и интересует скорость на cpu инференсе. та же llama.cpp и подобные не поддерживают куду, но из-за распберри паев и подобного имеют право на жизнь

  • @retiber1
    @retiber1 ปีที่แล้ว +1

    ФреймВОрки, а не фреймВЁрки!