opinionsreddit2026년 4월 21일 오후 06:07

Llama.cpp's auto fit works much better than I expected

I always thought with 32GB of VRAM, the biggest models I could run were around 20GB, like Qwen3.5 27B Q4 or Q6. I had an impression that everything had to fit in VRAM or I'd get 2 t/s. Man was I wrong. I just tested Qwen3.6 Q8 with 256k context on llama.cpp, with `--fit` on, the weights alone are bigger than my VRAM, and my 5090 is hooked up via Oculink, but I’m still getting 57 t/s! This is literally magic. If you’ve been stuck in the same boat as me thinking it’s all VRAM or nothing, you shou

원문 보기 →

OpenAI 라이브스트림

OpenAI가 라이브스트림 이벤트를 개최합니다. 방송 중에 구체적인 발표, 신제품 출시 또는 시연이 공개될 예정입니다.

The last time OpenAI did an unannounced livestream, they dropped GPT-4 Turbo and changed pricing overnight

Hacker News

오피니언읽음86d

ChatGPT Images 2.0 출시, 이미지 생성 기능 대폭 업그레이드

OpenAI가 ChatGPT Images 2.0을 출시했습니다. AI 이미지 생성 기능이 크게 향상되었습니다. 라이브스트림 발표회에서 새로운 기능을 직접 확인할 수 있습니다. https://openai.com/live/ 에서 시청하세요.

OpenAI is positioning this as a direct competitor to established image generation tools, suggesting they're confident enough to challenge the current market leaders

Hacker News

109

오피니언읽음87d

2025년의 "6개월만 더 기다려" 주장이 단 한 번의 업데이트로 무너졌다

2025년 내내 LLM에 대한 불만에 대한 표준 답변은 "3~6개월만 더 기다리면 다음 세대가 쉽게 해결할 거야"라는 식이었다. 이 주장은 어디서나 들을 수 있었다. 모든 한계는 일시적이라고 했고, 모든 부족한 기능은 몇 번의 업데이트 후에 올 거라고 했으며, 모든 자율 에이전트 데모는 임박한 미래의 미리보기라고 했다. 이제 2026년 4월이다. 그 약속들이 얼마나 지켜졌는지 확인할 시간이다. Reddit의 r/ClaudeAI에서 이번 주 Opus 4.7에 대한 긴 스레드가 올라왔는데, 여러 사용자들이 "이건 퇴보다"라고 주장하고 있다.

오피니언읽음74d

AMD Strix Halo에서 Mistral Medium 3.5 돌려봤더니 느려 죽겠네—밤새 돌려야 함

AMD의 새로운 Strix Halo 칩에서 Mistral Medium 3.5를 실제로 테스트한 사람이 있는데, 결과는…최악입니다. 48k 토큰 프롬프트에 4k 사고 토큰을 더해서 코드 아키텍처 질문에 답하는 데만 약 2시간이 걸렸어요. 정말입니다, 2시간. Strix Halo에서 로컬로 이 모델을 돌리고 싶다면 자기 전에 실행해놓고 자야 합니다. Q5_K_XL 양자화, GPU 가속, 캐시 재사용 등 온갖 최적화를 다 적용해도 여전히 느립니다. '로컬 AI의 꿈'은 아직 멀었지만, 적어도 작동은 합니다.

관련 기사

OpenAI 라이브스트림

ChatGPT Images 2.0 출시, 이미지 생성 기능 대폭 업그레이드

2025년의 "6개월만 더 기다려" 주장이 단 한 번의 업데이트로 무너졌다

AMD Strix Halo에서 Mistral Medium 3.5 돌려봤더니 느려 죽겠네—밤새 돌려야 함