米乐M6Kimi奇袭百度文心一言酝酿改名|AI光年就在国内大模型竞争处于焦灼状态时,创业公司月之暗面却靠着kimi智能助手的“200万字长文本”率先出圈,甚至还催生了“Kimi概念股”。
Kimi的优势仅领先一个星期。随着阿里通义千问、百度文心一言等宣布免费开放200万—500万甚至1000万字的长文本能力后,kimi长文本推理能力瞬间被赶超,其“Kimi概念股”的热度也开始消散。
但短期看,已给用户普及了“长文本推理能力”的kimi是这波流量的赢家。据similarweb数据显示,Kimi Chat的访问量已从去年十月的15.6万,增长至2024年2月的279万。
而3月19日至3月25日,在月之暗面宣布把长文本能力从20万字提升至200万字那一周,Kimi 的访问量达到了394万次,略高于文心一言的338万次,一度跃升为国内网页端周度访问量最高的AI应用。据similarweb数据显示,整个3月kimi的访问量达到1218.6万次。
有投资人透露,月之暗面新一轮融资完成后,阿里将成为其持股40%的单一大股东。不过,为了保证创始人团队保有绝对的决策权和控制权,做了AB股处理,拥有足够的投票权。
“阿里给了比较苛刻的投资条款,但月之暗面当时要想继续留在牌桌上,只能有所妥协。本质上,急需新故事的阿里,和急需资金弹药的月暗各取所需,都得付出部分代价。”有投资人对《AI光年》解释。
4月10日早间,马云在阿里内网发表题为《致改革 致创新》的帖子,肯定阿里变革一年成效。针对行业未来,马云判断,“三、五年的时间跨度对于互联网领域而言,犹如一个世纪之久,足以发生翻天覆地的变化,AI时代刚刚到来,一切才刚开始,我们正当其时。”
一位行业人士对《AI光年》透露,百度当下最重要的是力出一孔。“目前文心一言的大模型研发、垂直To B应用、To C产品分别在三个不同的事业群,负责人也各不相同。”
比如,负责文心一言自然语言处理底层技术的主力团队是副总裁吴甜,直接向CTO王海峰汇报,而百度智能云的负责人是副总裁朱勇直接向百度智能云事业群总裁沈抖汇报。
知情人士对《AI光年》透露,为了区别文心一言大模型在技术、To C产品、To B市场的定位,百度内部高管正讨论,是否需要为文心一言更换新的品牌标识。
长期看,回归大模型根本,长文本推理能力仅是通往AGI(通用人工智能)的必要技能之一。在实现AGI的漫长征程中,长文本并非唯一标准,多模态学习、神经网络架构创新、应用落地与生态建设、伦理与道德框架构建等各个维度都不可或缺。
虽然kimi只做了几天的“顶流”,但这也不得不让行业思考,为何率先普及大模型“长文本推理能力”的会是一家创业公司,而非有资本、有算力、有人才、有应用场景的大厂?
kimi能抢占用户“长文本”的心智并非偶然。在去年多数大模型在“卷参数、卷开闭源、卷榜单”忙的不亦乐乎时,2023年3月才成立的月之暗面就以“抄近道”的形式在“百模大战”中脱颖而出。
多位投资人对《AI光年》总结月之暗面能从大厂和众多创业公司中“冒尖”的原因,主要为以下两点:
“kimi现在之所以能引爆长文本推理能力是因为他们很早就开始做这件事情了。去年我见杨植麟(月之暗面创始人)时,他就非常明确要做好大模型长文本这件事儿了。他是行业中第一个讲‘长文本’的人,大约两周后米乐M6,OpenAI CEO奥特曼也在某个采访中才提到这件事。”月之暗面早期投资人对《AI光年》解释。
杨植麟曾在此前的采访中把长文本比做“登月的第一步”,是新的计算机内存。用通俗的话说,大模型若要理解复杂的长文本情境,需要足够大的“上下文窗口”或者“记忆空间”来容纳并处理这些关联信息,犹如计算机和手机的内存。
去年10月,月之暗面推出Kimi智能助手时,就在介绍中给自己贴上了“超大内存”的标签。贴标签仅是第一步,新技术和新范式最好催化剂永远是用户需求。
从用户的角度看,20万—200万字的无损上下文能力,可以帮助用户快速解锁翻译、专业学术论文、法律文书、金融报告等专业使用场景,这对“小白”用户更是刚需。
今年3月18日,Kimi智能助手无损上下文扩容到200 万字并引发了百度、阿里等大厂的跟进,又进一步加强了用户对kimi“长文本推理能力”的认知。
对于阿里、百度等大厂能快速将长文档处理的文字范围翻倍,天使投资人郭涛对《深网》解释,“长文本处理是自然语言处理的一个分支,各大模型在底层技术上的差别不大,关键看模型的优化、训练策略的调整及数据质量等。”
“算力是大模型进化的门槛”已经成为行业共识。有资料显示,GPT-3.5在微软Azure AI超算基础设施(由V100GPU组成的高带宽集群)上进行训练,总算力消耗约 3640PF-days(即每秒一千万亿次计算,运行3640天)米乐M6。
业内一种公认说法是,做好AI大模型的算力门槛是1万枚英伟达A100芯片。这就决定了,大模型的竞争不仅是科技竞争,也是资金实力的较量。对于创业公司来说,要先于对手融到更多的钱,招聘更优秀的人。
不过,一位月之暗面早期投资人对《深网》表示:“资本和算力对于想做AGI的公司来说,是一个必要非充分条件,是公司在不同阶段承接用户需求的基础,但大模型竞争的核心还是公司的技术、产品。技术要保证产品足够好用、有价值,然后才是资金上的保障。”
对于“kimi如何在5个月里用相同成本和设备把模型响应速度提升3倍”的问题,该投资人表示,“技术细节不方便透露。”
无论如何,kimi的威胁已不容小觑。最先在中国推出类似ChatGPT聊天机器人软件文心一言的百度,要避免“起了大早,赶了个晚集”的尴尬。
用户量仅是基础,回归商业本身,检验一个模式能否长久,关键要看是否有用户及客户愿意为商业化落地买单。
“与百度等大厂相比,目前kimi在资金、算力资源、应用场景、商业化落地方面还都存在短板米乐M6。”天使投资人郭涛对《AI光年》分析。
月之暗面的算力短板在kimi“出圈”时就已显露。公开资料显示,3月21日,Kimi Chat曾因流量激增遭遇了短暂的服务中断。为此,月之暗面通过算法优化和算力扩容以保证Kimi Chat服务的稳定性和响应速度。
据《AI光年》获悉,前期火山引擎和阿里云是kimi算力的主要提供方,完成今年A轮融资后,Kimi在未来的推理加速或主要依赖阿里云。
在商业化落地方面,百度选择“两条腿走路”。在C端,文心一言4.0版正针对个人用户收费。在B端,百度采用大模型+云服务的方式,通过模型即服务(MAAS)等方式在B端收费。
“不过,文心一言4.0版在C端针对个人用户收费,一定程度上不利于用户的积累和数据的迭代,制约其大模型的发展。”有投资人分析。
在C端商业化落地方面,Kimi Chat目前处于免费的状态。有投资人透露,Kimi用户的获客成本达到12元-13元,近一个月来日均下载量为17805,每天的获客成本至少20万元。
在C端免费的情况下,Kimi 要向B端探索商业化落地。公开资料显示,掌阅科技、华策影视等公司已和月之暗面在影视剧本创作、读者互动体验、内容个性化推荐等方面展开深度合作。对此,二者都没有正面回应,表示一切以公司公开信息为准。
“月之暗面在商业化落地处于一个早期探索的阶段。无论是算力资源、还是应用场景和商业化,百度等大厂比月之暗面等创业公司更有优势。”有投资人对《AI光年》透露。
在该投资人看来,在Meta开源Llama 2、埃隆.马斯克开源Grok的情况下,仅北京、上海发布的大模型产品就超过100多个,国内大模型的混战才刚刚开始。
对此,一位月之暗面早期投资人对《AI光年》表示,“独立创业公司在大模型领域有两大优势,人才密度和组织效率。在此基础上,只要保证算力资源不短缺,创业公司更有机会。”