Medusa: Simple LLM Inference Acceleration Framework with Multiple Decoding Heads

Поділитися
Вставка
  • Опубліковано 6 вер 2024

КОМЕНТАРІ • 2

  • @user-ly3wu1pi1m
    @user-ly3wu1pi1m Місяць тому

    very impressive!

  • @herbst1661
    @herbst1661 2 місяці тому

    Very interesting research.. Medusa is such a cool name for this. 😄