DeepSeek-R1知识科普:什么是上下文窗口,量化方式下的显存估算 上篇文章以DeepSeek-R1为例,我们介绍了什么是量化,不同量化版本的差距是什么。这篇我们来了解下什么是上下文窗口以及不同量化方式、上下文下的显存占用估算。 生活百科# KVCache# 上下文窗口# 推理模型 2个月前0290
Gemini 2.5 谷歌推最强Gemini推理模型:月费1800,已拿奥赛金牌,性能超OpenAI o3和Grok 4 Gemini 2.5作者 | ZeR0编辑 | 漠影智东西8月2日报道,昨夜,谷歌推出其迄今最强推理模型Gemini 2.5 Deep Think。 生活百科# Gemini2.5# OpenAI# 奥赛金牌 2个月前0370