2025(1):Web2.0时代
点击量:443DeepSeek:AI大模型国产之光
DeepSeek,国产AI大模型,由杭州深度求索人工智能基础技术研究有限公司开发,拥有强大的自然语言处理能力,能够理解并回答问题,还能辅助写代码、整理资料和解决复杂数学问题。
自2024年1月发布第一款大模型开始,DeepSeek一路狂飙,在多项评测中表现优于主流开源模型,且具有成本优势,引起业界极大关注。2025年1月20日,DeepSeek-R1模型正式发布,并同步开源模型权重;该模型在后训练阶段大规模使用了强化学习技术,极大提升了模型推理能力。加上之前发布的DeepSeek-V3,两款大模型成本低廉,性能与OpenAI相当,再次引发全球关注。
2025年中国农历新年伊始,DeepSeek访问使用量急速上升,已经成为目前最快突破3000万日活跃用户量的应用程序,火爆全球。凭借低成本、开源属性,以及通过强化学习(RL)与模型蒸馏技术,将大模型参数量缩减至原规模的1/10,同时保持高性能,DeepSeek被引入越来越多的领域,运营商的云平台、手机、PC等终端厂商纷纷接入DeepSeek,一些地方政府也开始在政务系统部署DeepSeek。
DeepSeek的成功被一些人视为中国技术理想主义的体现,甚至被外国人比喻为“神秘的东方力量”。目前普通用户可免费使用DeepSeek进行对话,网址:https://www.deepseek.com/ ,还可下载APP使用。