李飞飞团队用不到50美元训练出新模型

《科创板日报》报道,李飞飞等人以不到50美元的云计算费用训练出名为s1的人工智能推理模型,表现与OpenAI的O1等模型相当。然而,调查发现,s1模型基于阿里云通义千问(Qwen)模型进行微调,而非从零开始。专家指出,这种低成本训练依赖于已有基座模型,1000个样本数据量有限,效果并不适用于所有场景。尽管如此,这一研究为AI领域提供了新的思考方向。

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...