这两天李宸开始着手规划火星计划的初步框架,一个来自深度求索公司的紧急电话打断了他的工作。
“李总!成了!DeepSeek成了!”电话那头,章博宇的声音激动得几乎破音,背景里还能听到团队成员的欢呼声。
李宸立刻放下手中的文件:“具体说说。”
“我们刚刚完成了最终测试!”章博宇语速飞快,“基于您提供的初始思路,加上后续您指导的自适应初始化策略和动态梯度裁剪,DeepSeek在各项基准测试中全面超越了GPT!”
他继续汇报着具体数据:“在MMLU多任务语言理解测试中,DeepSeek达到了92.1%,比GPT高出20个百分点;在代码生成任务中,HumanEval得分87.3%,超过了GPT的84.2%;更重要的是,我们的训练成本比传统架构降低了45%,推理速度提升了一倍以上!”
这些数字并没有让李宸感到很惊讶,毕竟如今的GPT只是第一代,而经过他指导的DeepSeek可是能和GPT-4掰手腕的,打个小弟不是轻轻松松?
“而且,”章博宇继续说,“我们在您提出的合成数据训练方法基础上做了优化,现在模型在数学推理和科学问题解答上的表现,简直像是......像是拥有了您的一部分智慧!”
李宸微微一笑,这或许就是100点智力带来的间接影响,他在指导团队时提出的那些思路和方法,确实融入了自己独特的思维方式。
“准备发布会吧,”李宸果断决定,“尽快。”
两天后,深度求索公司在国家会议中心召开了盛大的发布会,能够容纳上千人的会场座无虚席,来自全球各地的科技媒体、投资人和业界专家齐聚一堂。
能有这么多资深的专家来全是因为这是李宸的公司,现在全世界都在关注这个华夏天才的一举一动。
章博宇作为CEO主持发布会,当他宣布DeepSeek的各项性能指标时,台下先是死一般的寂静,随即爆发出难以置信的惊呼声。
一位来自OpenAI的技术专家失声喊道:“这不可能!”
他们作为人工智能的先行者,本以为DeepSeek只是一款模仿他们的作品,能达到80%的性能就很好了,没想到直接被超越了。
随后的现场演示让所有质疑者都闭上了嘴,DeepSeek不仅在常规的对话和创作任务中表现出色,更在复杂的数学证明、物理问题推理和代码调试等需要深度思考的任务中展现出了近乎人类的智慧。
在互动环节中,一位来自麻省理工学院的教授提出了一个复杂问题,DeepSeek不仅准确理解了问题,还给出了一个简洁而优雅的证明思路。
教授当场震惊地说不出话,这是GPT无论如何也无法做到的。
发布会结束后,全球科技界迎来了继核聚变之后的又一次大地震。
《华儿街日报》的头条标题是《华夏AI的惊天逆袭:DeepSeek全面碾压GPT》。
《科技评论》则写道:“这不仅仅是技术上的超越,更是一种思维方式的胜利。DeepSeek展现出的推理能力,让人看到了通用人工智能的曙光。”
硅谷陷入了一片恐慌,OpenAI紧急召开董事会,讨论应对策略,谷歌、微软等巨头也纷纷调整自己的AI发展路线图。
所有人都明白,AI领域的游戏规则已经被彻底改变。
更让西方科技公司感到绝望的是,DeepSeek展现出的某些能力似乎与李宸在核聚变项目中使用的数学方法有着微妙的联系。
这让人不禁怀疑,李宸是否找到了一种将深层次数学思维融入AI模型的方法。
在国内,DeepSeek的成功则引发了全民狂欢,微博热搜前十中有一半都与DeepSeek相关。
【DeepSeek牛逼!李神牛逼!】
【从核聚变到AI,还有什么是李神做不到的?】
【刚刚试用了DeepSeek,写代码简直不要太爽!暴打GPT】
深度求索公司的官网在发布会后一小时内访问量暴增,预约试用DeepSeek的企业用户超过了一万家,公司的估值疯狂上升,成为了全球最具价值的AI初创企业。
当晚,李宸在办公室里接听着各方的祝贺电话。
梁文峰也打来了电话,声音中满是兴奋:“李老板,深度求索的估值已经突破万亿了!我们的投资获得了百倍回报!哈哈!”
最近几天他可真是被这个惊喜砸晕了,他万万没想到之前无意间与李宸合作的项目如今获得了如此高额的回报。
其实之前他更多的打算只是与李宸建立个合作伙伴关系,搞好关系,毕竟创造一个比GPT还强的大模型在当时看来难如登天。
李宸笑呵呵地说:“这只是开始,我们会继续优化模型,下一步要实现多模态能力。”
挂断电话后,他回到办公桌前,重新打开“火星计划”的文档,在“技术基础”一栏中郑重地添上了两项:
“能源基础:可控核聚变技术(烛龙示范堆)”
“智能基础:DeepSeek人工智能系统(待改进)”
李宸盯着电脑喃喃道:“也是时候和我那两个学生见一面了。”
这些项目都很缺人才,正好有两个高级的免费劳动力。
喜欢重回高三:每秒都能有金钱奖励!请大家收藏:(www.071662.com)重回高三:每秒都能有金钱奖励!小米免费小说网站更新速度全网最快。