Deepseek v4 API 서비스 사용기
최근에 DS4.c 를 활용해서 LocalLLM 으로 Deepseek v4 Flash 모델을 정말 잘 활용 해 오고 있었습니다. 그런 와중에 DS4.c 에서 Pro 모델에 대한 지원도 추가를 해줘서 Pro 모델도 살짝 돌려보긴 했습니다만. Flash 모델의 경우도 25tps 정도로 약간 답답한 속도를 보여 줫는데 Pro 모델의 경우 모델을 로딩만 해도 일단 512g 의 통합 메모리인 맥 스튜디오 m3 Ultra 라 해도 1M 컨텍스트는 꿈도 못꿉니다. 컨텍스트 타협을 …
댓글을 달려면 로그인해야 합니다.