近日发布的DeepSeek R1以较低成本展现出卓越性能。在去年美国数学邀请赛(AIME)测试中,DeepSeek R1的准确率达到79.8%,超越OpenAI的o1(79.2%)。
DeepSeek备受瞩目的主要原因在于令人惊叹的性价比。DeepSeek方面透露,R1的开发成本约为557.6万美元,仅为Meta AI模型Llama 3研发成本的10分之1,更仅是OpenAI的ChatGPT研发成本的18分之1。
DeepSeek称,公司采用AI自主寻找答案的群组相对策略优化(GRPO)学习方法,并使用混合专家(MoE)技术,在处理特定任务时仅激活必要的AI模块,从而极大提高计算效率并降低成本。主要使用的芯片为英伟达(NVIDIA)H800,并在推理过程中部分使用中国华为的芯片。
备受关注的同时,DeepSeek公布的开发成本数据引发争议。美国半导体研究咨询机构SemiAnalysis表示,仅DeepSeek AI模型所需的硬件投资成本就远远超过5亿美元,是DeepSeek官方公布数据的90倍。DeepSeek的成本数据存疑,但挑战OpenAI规模经济法则的事实,以及选择开放源代码策略而非ChatGPT的封闭模式,同样为韩国提供新的机遇。
Kakao则采取不同策略,专注模型编排(Model Orchestration)方式,即不直接开发大语言模型(LLM),而是整合其他AI模型,打造个性化AI助手。此外,Kakao宣布4日与OpenAI合作推出新的AI服务Kanana,进一步提升市场预期。
资本市场对此反应迅速。3日,Kakao和NAVER股价分别上涨9%和0.23%,收于4.18万韩元和21.7万韩元。在前一个交易日,两家公司股价分别上涨7%和6%。值得注意的是,当日韩国综合股指(KOSPI)大跌2.52%,但Kakao和NAVER逆势上涨,显示出市场对AI业务的乐观预期。
兴国证券研究员金志贤(音)表示,过去NAVER一直难以在AI领域与全球其他企业竞争,但DeepSeek的开源策略可能带来溢出效应,从而提升韩国软件企业竞争力。Sangsangin证券研究员崔承浩(音)也指出,如果能够有效借鉴DeepSeek的方法,受到基础设施成本限制的韩国及全球AI开发活动有望加速。
不过,DeepSeek选择开源模式但并未完全公开核心技术细节,因此韩国AI企业短期内难以完全复刻。业内人士表示,严格来讲,DeepSeek并未公开所有源代码和数据,因此无法直接照搬方法,想要取得类似成果需要时间,但DeepSeek在AI轻量化方面提出新的思路,对资金有限的企业而言,这无疑是一大启发。
