中国初创公司“DeepSeek”推出新型 AI 模型 DeepSeek-V4,其亮点是支持长达 100 万字的指令数据,同时显著降低处理和内存成本,正值中美科技竞争日趋激烈之际。
“DeepSeek”(深度求索)是一家来自中国杭州的新锐初创公司,去年曾引发“DeepSeek 冲击”,导致全球科技股下跌。该公司宣布推出最新的人工智能模型“DeepSeek-V4”,并表示新版本在性能提升的同时,资源消耗大幅减少。
该公司通过微信和 X 平台发布声明称,DeepSeek-V4 的最大特点是处理数据的上下文长度高达 100 万字,这在国际模型和开源模型中均处于领先水平,使 AI 能够处理海量数据并准确理解复杂指令。
本次发布中,DeepSeek 将模型分为两个子版本,以满足不同应用需求:旗舰版 DeepSeek-V4-Pro 拥有高达 1.6 万亿参数,全球知识水平仅次于谷歌的 Gemini-Pro-3.1,但优于所有其他开源模型;经济版 DeepSeek-V4-Flash 则注重效率和速度,参数为 2840 亿,旨在为企业和开发者提供高性价比选择。
研究机构 iiMedia 创始人张毅表示,此次发布是行业的“重要转折点”,因为它解决了处理长指令时速度慢、成本高的问题,这将使高端 AI 技术从实验室工具真正走向广泛的商业应用。
DeepSeek-V4 的发布正值中美关系高度紧张之际,白宫指责中国机构大规模窃取美国 AI 技术。
美国总统唐纳德·特朗普的科学与技术顾问迈克尔·克拉齐奥斯表示,美国有证据表明,中国存在一个利用“蒸馏”技术(即从竞争对手模型中提取数据)的产业级行为,以此构建成本更低、性能相近的自身模型。
DeepSeek 在低成本下创建高性能 AI 的成功,给硅谷公司如 Meta 和微软带来了难题,后者需要巨额投资来维持竞争力。最近,Meta 刚刚宣布裁员 10% 以保持利润,并将资金投入 AI 开发以跟上时代。
然而,尽管 DeepSeek 在中国广受欢迎,尤其是在医疗、金融和地方政府机构中,但仍面临关于数据隐私和内容审查的质疑,这是中国 AI 模型普遍存在的问题,它们往往回避回答政治敏感话题。
(编译:李程 泰国中文社;审校:Alex;来源:泰国中文社)
原创文章,作者:泰国中文社,如若转载,请注明出处:https://thais.com/news-101813/