• Deutsch
    • English
  • Über bonndoc
  • Leitlinien
  • Deutsch 
    • Deutsch
    • English
  • Einloggen
Suche 
  •   bonndoc Startseite
  • Zentrale wissenschaftliche Einrichtungen
  • Suche
  •   bonndoc Startseite
  • Zentrale wissenschaftliche Einrichtungen
  • Suche
JavaScript is disabled for your browser. Some features of this site may not work without it.

Suche

Erweiterte FilterErweiterte Filter ausblenden

Filter

Verwenden Sie Filter, um die Suchergebnisse zu verfeinern.

Anzeige der Dokumente 1-1 von 1

  • Sortiermöglichkeiten:
  • Relevanz
  • Titel aufsteigend
  • Titel absteigend
  • Erscheinungsdatum aufsteigend
  • Erscheinungsdatum absteigend
  • Ergebnisse pro Seite:
  • 5
  • 10
  • 20
  • 40
  • 60
  • 80
  • 100
Thumbnail

Small and Fast LLMs on Commodity Hardware: Post-Training Quantization in llama.cpp 

Sparrenberg, Lorenz; Deußer, Tobias; Berger, Armin; Sifa, Rafet (2025-11-24)
Large Language Models (LLMs) have demonstrated remarkable capabilities but their significant computational and memory demands hinder widespread deployment, especially on resource-constrained devices. Quantization, the ...

Kontakt | Impressum
Indexed by 
BASE
Theme by 
Atmire NV
 

 

Entdecke

AutorBerger, Armin (1)
Deußer, Tobias (1)
Sifa, Rafet (1)Sparrenberg, Lorenz (1)SchlagwortGGUF (1)Inference Efficiency (1)
K-quants (1)
Large Language Models (1)llama.cpp (1)LLM (1)Model Compression (1)Post-Training Quantization (1)Quantization (1)... mehrKlassifikation (DDC)004 Informatik (1)... mehrPublikationstyp
Konferenzveröffentlichung (1)
... mehrErscheinungsdatum2025 (1)

Stöbern

Gesamter BestandBereiche & SammlungenErscheinungsdatumAutorenTitelSchlagworteKlassifikation (DDC)PublikationstypOpen-Access-Fonds (Universität Bonn)Diesen BereichErscheinungsdatumAutorenTitelSchlagworteKlassifikation (DDC)PublikationstypOpen-Access-Fonds (Universität Bonn)

Kontakt | Impressum
Indexed by 
BASE
Theme by 
Atmire NV