opinionsreddit2026년 4월 21일 오전 11:41

ggml-cpu: Optimized x86 and generic cpu q1_0 dot (follow up) by pl752 · Pull Request #21636 · ggml-org/llama.cpp

Available b8858 onwards. This is optimized CPU version so faster t/s now. (Just tested on my old weak laptop(16GB DDR3 RAM). Before : 0.3 t/s & After : 1.7 t/s. Obviously I didn't get expected boost as my laptop don't have AVX or AVX512 support. I'll be checking on my new laptop this week.) FYI Metal, Vulkan, CUDA versions also supporting this(1-bit versions .... Bonsai). Check those too if you haven't already. submitted by /u/pmttyji [link] [comments]

원문 보기 →

관련 기사

OpenAI 라이브스트림

ChatGPT Images 2.0 출시, 이미지 생성 기능 대폭 업그레이드

2025년의 "6개월만 더 기다려" 주장이 단 한 번의 업데이트로 무너졌다

AMD Strix Halo에서 Mistral Medium 3.5 돌려봤더니 느려 죽겠네—밤새 돌려야 함