(南华早报)中国初创公司DeepSeek 成为2025年开源大型语言模型(LLM)领域“最大的黑马”。就在几天前,该公司的最新版本发布在全球AI(AI)社区引起轰动。
这一评估来自英伟达高级研究科学家、人工智能代理计划负责人 Jim Fan 在元旦当天在社会化媒体平台X上发布的一篇帖子。此前,这家总部在杭州的初创公司上周发布了同名法学硕士学位课程 DeepSeek V3。
范写道:“(新的 AI 模型)表明,资源限制迫使你以惊人的方式重塑自我。”他指的是 DeepSeek 如何以其他科技公司投资打造法学硕士的资本支出的一小部分来开发该产品。
LLM 指的是 ChatGPT 等生成式 AI服务的基础技术。在 AI 中,大量参数对于使 LLM 能适应更复杂的数据模式并做出精确预测至关重要。开源让公众可以访问软件程序的源代码,允许第三方研发人员修改或共享其设计、修复损坏的链接或扩展其功能。
尽管美国的制裁在很大程度上阻止了中国人工智能公司获得用于训练模型的先进半导体,但 DeepSeek 以比大公司更低的成本开发出了强大的 LLM,这表明中国人工智能公司已经取得了长足的进步。
利用旨在实现高性价比训练的新架构,DeepSeek的V3模型仅需278万GPU小时(即图形处理单元用于训练LLM的总时间)。根据这家初创公司在12月26日发布的技术报告,DeepSeek的训练过程使用了英伟达中国定制的H800 GPU。
这一过程大大少于 Meta 在英伟达更先进的 H100 芯片上训练其 Llama 3.1 模型所需的 3,080 万 GPU 小时数,而英伟达的 H100 芯片是不允许出口到中国的。
卡帕奇的观察促使樊尚当天在 X 上发文回应:资源限制是一件美好的事情。在残酷的人工智能竞争环境中,生存本能是取得突破的主要驱动力。”
“我关注 DeepSeek 很久了。他们去年的开放编码模式是最好的之一,樊纲写道。“卓越的OSS(开源软件)模式给商业化的前沿乐虎国际客户端下载公司带来了巨大压力,迫使它们加快步伐。”
云计算初创乐虎国际手机版下载人工智能公司创始人贾阳青在12月27日的一篇X帖子中呼应了樊纲的观点。“他曾担任《南华早报》所有者阿里巴巴集团控股公司的副总裁。
据报道,这家初创公司是对冲基金经理 High Flyer Quant 于 2023 年分拆出来的。DeepSeek 的幕后推手是 High-Flyer Quant 创始人梁文峰,他曾在浙江大学攻读人工智能专业。
DeepSeek 的大多数研发人员都是应届毕业生,或者是人工智能职业生涯的初期人员,这也是公司在招聘新员工时更看重能力而非经验的做法。
(央视财经《正点财经》)美国近期公布的多项经济数据表现不佳,美国股市上周显著下跌,市场对美国经济衰退的担忧加剧。当地时间9日,特朗普在接受美国媒体专访时对有关问题进行了回应。根据美国亚特兰大联储上周发布的最新预测,今年第一季度美国实际GDP经年化调整后将收缩2.4%。
近期,围绕美国对墨加征收关税一事,美国总统特朗普多次反复,引发市场的恐慌情绪。另一方面,加拿大执政党在9日选出了新的领导人卡尼,他也将作为特鲁多的接班者执掌加拿大政局。但在加拿大候任总理人选敲定的第二天,美股血流成河。10日收盘时,纽约股市三大股指暴跌。
国际刑警组织对杜特尔特发出红色通缉令 两天前杜特尔特访港 #菲律宾 #杜特尔特 #香港 #通缉令 #菲律宾总统
专访国家气候中心主任巢清尘:近期频繁出现接近1.5℃的气温升幅,警示地球将面临越来越频发的系统性且不可逆的灾难性变化
根据国家气候中心的监测,2024年全球表面平均温度较工业化前水平高出1.49摄氏度,成为全世界有气象记录以来的最暖年份。
10日晚,新浪微博CEO王高飞发文辟谣,回应网传“超一线男星澳门赌博”称,“最早的好像是去年10月的,AI分析完判断该传闻缺乏实质性证据,且主要信息源为匿名账号及营销号,存在动机和逻辑漏洞……”
一手消息!《哪吒2》四天后登陆英国和爱尔兰,第一场IMAX安排在全英最大银幕影院
据《哪吒2》欧洲发行商最新消息:《哪吒2》将于3月14日登陆英国和爱尔兰,由于观众情绪高涨,院线新增更多超前点映场,并于3月21日全面上映。“天劫之后,哪吒及敖丙的灵魂虽然保住,但肉身很快就会魂飞魄散。太乙真人只能用七色宝莲给二人重塑肉身,但过程中却遭遇重重困难。
近日,省内外一些学校。发布春假、劳动节假期的消息。共9天!据中国人民大学教务处发布的《2024-2025学年校历》显示,该校将于2025年4月底放春假。
特朗普最新表态,美股崩了,“血流成河”!特斯拉暴跌15%,X平台遭大规模攻击,马斯克回应!国际油价下跌,最新分析……
当地时间3月10日,受美国总统特朗普关税政策影响,美国经济衰退风险上升,引发市场严重担忧,美国股市当日收盘暴跌。