4月30日,小米开源首个推理大模型“Xiaomi MiMo”,联动预训练到后训练,全面提升推理能力。目前,MiMo-7B 已开源4个模型至HuggingFace。
在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 用 7B 的参数规模,超越了OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。
就在昨天,阿里巴巴宣布开源新一代通义千问模型Qwen3。千问3是国内首个“混合推理模型”,将“快思考”与“慢思考”集成进同一个模型。另有市场消息透露,DeepSeek的R2也即将发布。
相关文章:
小米精英驾驶丨高阶驾驶培训开放成都站报名06-15
AI周报|OpenAI发布新模型o3-pro;AMD推出AI芯片MI350“硬刚”英伟达06-15
今年6月10日是首个“文明对话国际日” 外交部介绍相关情况06-10
深度推理模型写高考英语作文谁更强?记者实测,名校英语教师点评06-09
AI网络+自动驾驶,蘑菇车联获评北京市两业融合成长型试点企业06-06
董明珠孟羽童合体带货500万元05-25
西安:“AI+”赋能城市创新发展05-20