「ChatGPT热浪下,澜舟科技的AI创业启示」
文章主题:
来源丨创业邦(ichuangyebang)
作者丨赵晓晓
编辑丨昝立永
🌟前天在创新工场的一场AI盛会上,澜舟科技的掌舵人周明CEO,以深度且引人入胜的方式,分享了他从微软华丽转身,投身创业的全过程。他花了足足40多分钟,详尽剖析了决定创业的初心与抉择背后的故事。🚀语言模型的研发路径,如何孕育出ChatGPT这样的行业巨头,他是如何观察和解读这一现象的?这些问题都一一解答,仿佛在为现场的媒体朋友们揭示一个创业者的独特视角。🌟周明CEO深入浅出地探讨了中国创业者眼中的机遇,他的话语中充满了对这片土地未来的期待与信心。他的分享,不仅是一次技术与商业的深度剖析,更像是一堂生动的创业指南课。📚值得注意的是,这场演讲旨在启发而非推销,因此,所有关于个人身份和联系方式的信息都被巧妙地隐藏在内容之中,让每一位听众都能沉浸在知识的海洋中,汲取力量。💪
🌟周明,一位深谙行业趋势的创业者,早在两年前就洞察到未来的大势——🔥人工智能模型的崛起。尽管初期他的创业之路并不炽热🔥,经历了两年的沉淀与打磨,他始终保持着敏锐的洞察力和决心。📚现在,ChatGPT的横空出世,仿佛为他量身定做的东风,让他的努力迎来了回报的时刻🌈。他说:“恰逢其时,我们终于赶上了这个技术革新带来的浪潮。”🚀无需过多华丽的辞藻,周明的故事就是一个鲜活的例证,证明了在科技快速迭代的今天,坚持和时机的重要性。\总结来说,他的创业经历就像一部励志的剧本,充满了转折与惊喜,等待着被更多人理解和分享。🌟
🌟周明的职业生涯犹如一部精彩篇章,跨越了近三十年的岁月。在他的早期岁月里(1998年前),他在清华大学这片学术圣殿担任熠熠生辉的副教授角色,那时的他,专注且才华横溢。随后,他投身科技巨头微软研究院,这一段长达21.5年的时光见证了他从新手到领军人物的蜕变。直至2020年,他以微软亚洲研究院副院长的身份挥手告别,这段辉煌的职业旅程无疑是他职业生涯中的璀璨明珠。SEO优化词汇:清华大学副教授、微软亚洲研究院副院长、21.5年科技生涯
🌟当初,创新工场的重量级人物李开复,一位人工智能领域的领军人物,好奇地询问周明为何放弃清华的优厚职位,转而投身微软。周明的回答充满决心与远见,他透露出内心的抱负——不仅要带领团队达到世界顶尖水平,还要让中国的自然语言处理技术(🎯NLP)在全世界熠熠生辉。🌟
🌟【AI巨头崛起】🚀2020年,创新引领者周明在北京引领潮流,成立了专注于AI大模型研发的澜舟科技,以深厚的孟子预训练技术为基石,构建了卓越的孟子系列模型及解决方案。作为国内认知智能领域的先驱,他们独树一帜,开启了AI技术的新篇章。🌟🏆至今,澜舟科技已开源近20款创新模型,展示了其在科研领域的开放态度与实力。今年3月,澜舟科技的重量级产品——孟子对话大模型(MChat)横空出世,凭借类ChatGPT的强大功能,引领了人机交互的新风尚。💡🏆无论是技术领先还是开源共享,澜舟科技都以其专业和热情,赢得了业内外的高度认可。他们的每一次突破,都在为推动人工智能的发展注入强大动力。🚀欲了解更多关于澜舟科技的AI探索与成就,敬请关注我们的最新动态,一起见证智能科技的无限可能!🌐
🏆澜舟科技🌟:三轮融资破亿,科技创新引领者!🚀自成立以来,这家科技巨头以其卓越实力,成功吸引了国内外知名投资者的目光,其中包括中关村科学城、斯道资本、创新工场和联想创投等重量级机构。创新工场的慧眼识珠,使其成为初创阶段的重要合作伙伴。在头部企业名单中,澜舟科技与华为、同花顺、华夏基金及中文在线等业界巨头并肩前行,彰显了其广泛的业务覆盖和深厚的技术底蕴。每一笔融资,都是对其技术价值和市场潜力的肯定,也是公司持续创新和发展壮大的强大推动力。SEO优化提示:#澜舟科技# #三轮融资# #科技创新# #华为合作# #斯道资本投资# #头部客户# #华夏基金# #中文在线# #融资总额破亿# #科技引领者
ChatGPT热度还未散去,3月15日,OpenA又发布了更强大的GPT-4,向人们揭示生成式预训练大模型强大的语言理解和生成能力,也宣告AI开始从1.0进入2.0。
“大家都很期待GPT-4,现在需要判断的是它的能力,或者它的覆盖范围,对我们来说有哪些启示。”周明说,“企业要有自己清晰的判断。”
这听起来平平无奇,不平常的是,关注这条赛道以及正在路上的创业者,如何像自己说的那样去行动。
辞职微软创业做AI
问:您在微软工作二十多年来,创业意识有没有改变?
周明:当年我从清华副教授加入微软研究院的时候,开复问了我一个问题,“周老师,您在清华挺好的,为什么要去微软?”
我说我想把我的团队带成世界一流水平,也想把中国的NLP推到世界前沿。开复是很支持我的,他觉得我的想法很好。
但这两个梦想不好实现,十年都没有实现,终于在2020年实现了。现在我们的论文世界第一名,微软很多NLP技术都来自我们的团队,我在国内也培养了很多人才,很多NLP的人才都跟微软研究院有非常大的关系。
两年前,开复问我下一步想做什么?我说看到了大模型的未来,我在微软实现了上面两个梦想后,想去投身大模型的研究和应用,想创业,为企业和创业者提供技术和平台服务。后来我就加入了创新工场。
创业后,一直从事大模型的研发和创新,只不过因为疫情、经济等原因,AI创业一直不温不火。去年年底ChatGPT发布后,给这个行业点亮了一盏明灯,我们也刚好赶上了风口。
问:您在微软的20多年是纯做技术,后来再去做商业化,这个心态您是怎么调整的?
周明:ChatGPT给我们的启发。一个大模型公司,不能只做算法,不能只做工程,也不能只做产品,要有创造力。
我在微软的时候也做过产品,既有人脉也有资源,我就想把我的优势集中起来,做NLP的创新和突破。但很幸运,正好赶上了这样一个大模型时代。
问:目前澜舟科技的产品是什么?
周明:澜舟科技早于行业步伐潜心布局自然语言技术研发,用不到两年时间的研发积淀,验证了第一阶段的孟子轻量化模型能力,围绕这里理念,做出了各种大模型,比如孟子的BERT、孟子GPT、孟子T5、孟子T0大模型。
今天发布的是孟子MChat可控大模型,类ChatGPT的Chat能力,正式宣告迈入AI 2.0。
孟子MChat可控大模型有几个显著特点:陆续推出10B和100B参数级的大模型;具备聊天、问答、翻译、文本生成、信息抽取等多种能力;可融合搜索结果、领域数据和知识图谱;对功能、风格、人类认知等方面具可控性。
问:为什么要选择开源模式?
周明:创业之初,我们走访了一百多个合作伙伴。他们对新技术特别渴望,GPT、BERT(预训练的语言表征模型)等技术满足不了他们的需求,所以当时就想把开源做出来,帮助客户快速建立认知。
我们的开发思路跟ChatGPT相反,ChatGPT原来也做GPT1、2、3,最后通过一个聊天的方式把很多功能集中在体现出来。我们有这方面的能力,只要把ChatGPT对话能力直接加上,就约等于ChatGPT。但我们会考虑到结果可控和功能引擎可控,我们加什么不加什么,根据客户需要。ChatGPT是互联网所有的数据都加进去。
问:有预想到ChatGPT会突然爆火吗?
周明:ChatGPT为AI行业点亮了一盏灯,之前的AI一直不温不火,那个时候我们在想,也不知道要等到什么时候,今天就刚好赶上了风口。
AI开始从1.0进入2.0,AI不仅将具备推理、思维链等涌现能力,也更加灵活可控。ChatGPT是AI 2.0时代的工具端井喷中出现的第一个现象级应用,带动着更多AI 2.0时代的语言大模型能力将持续演进。
GPT-4到来后,中国能否赶上?
问:ChatGPT火了之后,看国内的创业企业雨后春笋冒出一堆,从投资人的视角,你看到的现状是什么?
任博冰:现状是,挺有意思的。我之前没有经历过移动互联网的爆发,从现在的发展情况来看,我们看到各个领域的创业者,或者没有创业经历的技术大牛都在进入这个领域。
问:GPT-4到来后,中国能否赶上?会产生哪些新机会?
周明:GPT-4大家都很期待,唯一可以判断的是它的能力,或者它的覆盖范围,对我们来说有哪些启示。比如说它强大的识图能力、文字输入限制提升到了2.5万字、回答准确性、风格变化等。我们要考虑的是技术迭代的速度和下一步的发展会是什么。
我们的机会在于,把可控和落地做到ChatGPT前面。
任博冰:ChatGPT超出大家的预期,甚至超出它自己的预期,实际上GPT-3和GPT-3.5在落地和实际操作中并没有超出预期,GPT-4大概也不会超出预期。
AI 2.0的发展范式是迭代式的,从“辅助人类”到“全程自动”,所以生产力工具的升级会是一个特别巨大的机会。比如文档工具、绘图软件,都不需要用户动手。这个阶段,所有使用者界面将被重新设计。
问:大模型的能力涌现,是否是随机出现的?如果是,是在一定规模下一定会出现,还是要通过不断训练才会出现?
周明:能力涌现是个未解,大家都是一种猜测,有的能力在60亿参数出现,有的在600亿参数出现。比较明显的一个趋势就是,是在你的模型达到一定规模时,会涌现出一些能力。
比如我们做小模型的时候,多轮对话就出不来,模型10倍大之后,多轮对话能力自然就出来了,我们并没有做任何特定的工作。
这也是ChatGPT让人很惊奇的地方,有些功能没有设计,模型一变大后自己就出来了。对我们的启示是,在能力所见范围之内把模型做大,把数据弄更干净、质量更高,涌现能体现。
问:之前有人估算过大模型训练成本在五百万美元上下,对于一家创业公司大概需要多少成本才够,澜舟科技最高的成本在哪些方面?
周明:创业公司长板是快速迭代,跟用户接力会比较快,落地容易,短板是GPU资源或者人力成本都要考虑进去。所以创业公司不提倡超前追大模式,把钱很快烧了,再烧就烧不动了,还有烧的不好不坏的,更不容易出头。
企业多发挥后半部分优势,多用算法,而不是完全靠算力取胜。一定要重视落地,练出来的模型每一步都要挣钱,自己去造血,这样公司能处于稳健的状态。
问:有一种观点是,中小型创业企业烧不起这个钱,所以在大模型、ChatGPT很难有所建树,两位怎么看?
周明:不光中小企业,中国的大企业、BAT也烧不起这么多钱。算力、算法、数据、场景,这是跑通大模型的四个关键要素。不要跟风,要先达到几百或者千亿的规模。不要总想着超越ChatGPT,要走出自己的特色。也可以滚雪球式的拓展到其他的领域,甚至做更多的AGI技术。
任博冰:ChatGPT只是做了产品封装,过程也是循序渐进的,当然它提供了很好的思路。最主要的是可控性,目前还没有哪个技术可以完全解决这个问题。
美国和中国的节奏
问:先问一下任博冰,你跟周明博士是怎么认识的?
任博冰:我们是在2020年底认识的,接近元旦的时候,我跟周老师是同一天入职创新工场的。但周老师跟李开复老师认识很多年了,他们是同事,后来李开复老师就把周老师邀请过来,所以在那一天认识了周老师,之后开始了孵化合作。
问:据说还有个饭局的故事。
周明:那次是李开复组局。
问:AI1.0到AI2.0,背后的技术模型是重大突破,今天可以多谈谈,为什么大模型在应用和商业化方面会是这么强大的推力?
周明:原来做NLP的人都是一个任务一个模型和一个系统,代价非常很大,碎片化严重,后来有了大模型技术当底座,给具体任务做翻译。刚才李开复也介绍了AI 2.0时代的通用大模型,N多任务在这里都训练过,大规模提升了能力。
AI2.0展示的是在未来To B落地的时候,开发和维护的效率大幅度提升。所以我认为这是目前是最有可能引领To B行业的一些新的技术。
问:可不可以跟我们聊聊美国和中国的节奏,给我们一个大概的评估,中国会是什么样的节奏?
任博冰:ChatGPT火了之后,我们也跟OpenAI联合创始人进行了沟通,他们没说太多细节,但给我们一些指示。ChatGPT出现之前,美国有很多做大模型研究、大模型创业的企业,以及围绕周边方向去做基础层的公司,包括底层的基础设施公司等。
澜舟科技在2020年底开始做这件事情,当时国内类似的创业公司还是比较少的,即使到了2022年年中多模态、原生图出来之后,国内类似的公司依然很少。现在数量在增加了。美国那边速度更快一点,平均每天新增10个初创公司。
但在可控性上,美国那边也没有很好的解决方案,周明老师在创业初就把可控性放到很重要位置上,它是大模型的下一个高峰,这条道路是对的。
周明:ChatGPT火了之后,很多人就觉得这是个新的机会,我要做、要跳出来。但我想说一句,机会还是给那些长期努力有准备的,并且能够掌握未来的人。
第一,ChatGPT有很多细节,是需要花工夫研究的。第二,ChatGPT把模型推向新高度,也带动全球市场英伟达、GPU的大销,这是一个无底洞的军备竞赛,我们要审时度势,拥抱大模型,把模块能做好、做精致。第三要注重落地,尤其注意To B落地,不一定是跟ChatGPT完全一样的方式,走出中国特色的大模型。
中国创业者要有自己的特色
问:你觉得真正能做好的AI2.0类型公司的创业者,应该具备哪些特制跟素质?
任博冰:有创业者会头脑过热,会讲一些自己不一定能实现的故事。有沉淀和冷静思考的创业者,他们的能力体现在尝试和摸索过程中,能够得到更好的结论和路径。这个阶段,真正优秀的项目是非常少的,这个需要试错时间,未来还是会有一些大公司出现的。
我们之前做孵化的时候,写了大几百页的研究,GPT-3不一定能做到。当时我们想,这个领域还是有很多好的方向跟机会的,只不过现在的时间早一点。
问:你更看重哪一点,项目的算法算力、团队,还是商业化?
任博冰:去年年底,很多创业者都是直接用开源模型,去做一些更有意思的场景。现在,大家对ChatGPT能力边界、底层架构的理解更深了,他们甚至开始改一些开源模型。创业者还是要不断地去探索和试错。
问:你们给中国创业者的建议是什么?他们往哪些方向走更有机会展现出国内的特色?
任博冰:国内企业现阶段可以奉行的是“拿来主义”,基于海外的开源大模型,将中小模型打磨至顶尖水平。完全照搬美国创业者利用API去做的一些领域、产品,放到中国并不完全适用。
如果要做一个新的产品,无论是To C还是To B,要小步快跑地去验证和试错,这要有大胆的想象。
现在还没看到有创业者利用AI技术往前推没有人走过的方向,美国也没有,未来几年可能有重新定义新的内容生态、新的工艺形态的出现。
周明:中国的To C和To B市场跟美国有很大差距。所以中国创业者必须把底座做好、了解客户需求,必须有快速迭代的能力。还要有很强的落地能力。
问:新的这一笔融资,钱准备怎么花?怎么考虑特色落地?
周明:去年是整体市场比较惨淡,我们还逆袭完成了融资。这笔钱分成几个方面,第一是用在大模型研发上,一部分花在算力和数据上,还有一部分会花在招聘更多优秀的人才上。
特色落地有两个板块,第一个是金融,另一个是网文。
问:有没有考虑对外输出我们的技术,去做出海?
周明:要看机会,这个机会是合适的合作伙伴,在国内打磨好的成熟技术,因为海外的客户不给试错时间。我们现在在海外已经有一些合作伙伴。
问:哪些国家的机会更多一些?
周明:欧美方向是挑战很大,一是欧美技术相对成熟,另一个是地缘政治风险。日、韩、东南亚等一带一路的国家,机会相对多一些。
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!