DeepSeek-V3.2-Exp 모델이 공식 출시되어 오픈 소스되었습니다
2025-09-29 18:12:55
ChainCatcher 메시지, DeepSeek-V3.2-Exp 모델이 오늘 공식 출시되어 오픈 소스되었습니다. 모델은 희소 Attention 구조를 도입하여, 이 구조는 계산 자원 소모를 효과적으로 줄이고 모델 추론 효율성을 향상시킬 수 있습니다. 현재 이 모델은 화웨이 클라우드 대모델 서비스 플랫폼 MaaS에 공식적으로 배포되었으며, DeepSeek-V3.2-Exp 모델에 대해 화웨이 클라우드는 이번에도 대 EP 병렬方案을 배포하여 희소 Attention 구조를 기반으로 긴 시퀀스 친화적인 맥락 병렬 전략을 구현하고, 모델 지연 시간과 처리 성능을 모두 고려하고 있습니다.
최신 뉴스
CoinNess
2025-10-01 02:27:02
CoinNess
2025-10-01 02:26:52
CoinNess
2025-10-01 02:26:40
CoinNess
2025-10-01 02:14:40
CoinNess
2025-10-01 02:03:27