AI大牛周明发布MChat:生成可控,参数规模可负担,顺便官宣新融资-量子比特,
大示范课程有融资新动向:
语言大模型玩家澜舟科技刚刚完成Pre-A+回合融资。
此次融资由北京中关村科学城公司获得,“斯道资本”和“创新工场”跟进。这是澜舟科技一年内收获的第二轮融资,两轮累计总额数亿元。
不仅如此。与融资信息一起发表的是澜舟科技推出的语言生成模型、孟子MChat可控的大模型。
具有ChatGPT之类的能力,加上原始的澜舟科技、孟子大模型N个项目功能引擎,最终出现的MChat既具有对话能力,又具有翻译、生成、信息检索等能力。
关于MChat,澜舟科技创业者兼CEO周明如下介绍。
10B和100B参数级的大型号将陆续上市。具备聊天、答疑、翻译、文本生成、信息提取等多种能力,可融合搜索结果、领域数据和知识谱。在功能、风格、人类认知等方面具有可控性。
创新工场董事长兼CEO李开复在3月14日的趋势份额中,AI表示已经来到了从1.0到2.0的转折点。
按照这个思路,MChat可以从澜舟科技平台和基础架构两个层面来尝试对AI2.0时代的具体举措:
首先,发布一个可控制的大模型,将其视为基于,并提供语言预训练模型、多模式预训练模型、垂直区域预训练模型等能力。
其次,在此基础上搭建能力平台,提供知识地图、辅助写作、机器翻译等模块化能力。
因此,孟子扩展了大模型技术体系的特点之一,更加多样化。
具体而言,孟子支持BERT(分析类)、GPT(生成类)、T5(翻译类)等架构,能够覆盖阅读、文本生成、机器翻译、会话等不同的场景。
值得注意的是,具有与ChatGPT相同的对话能力,但两者不同。
ChatGPT尽量将多模数据纳入训练库,数据量越大越好,不分数据好坏
MChat强调“可控性”。
一是功能可控,即可根据具体需要对可调用的具体功能进行加减,二是结果可控,保证输出内容的健康、良性。
“我们希望将来继续探索AI 1.0到2.0到AGI。”。
此时选择进入AI2.0时代,澜舟科技似乎地利不足,放眼大模式创业领域,千帆赛,但优点是存在很多铺垫,孟子轻量化模式的能力得到验证。
MChat背后的孟子大模型是由澜舟科技自我研究技术开发的大规模预训练语言模型,于2021年7月上市。
能够处理多语言、多模式数据,同时支持多个文本理解和文本生成任务,能够快速满足不同领域、不同应用场景的需求。
与追求AGI的构建不同,基于Transformer架构的孟子,其行驶路径轻量化,仅包含10亿个参数。
凭借这10亿个参数,孟子大模型在中文语言理解领域最权威的评价标准CLUE中屡屡位居榜首,分出4、2公里,击败了其他公司的100亿或千亿个模型。
是以NLP大牛周明澜舟科技NLP技术为基础的认知智能公司,是AI大牛周明设立的公司,成立于2021年6月。
周明是目前NLP领域最有成就的华人之一。他不仅是中国第一位中英翻译系统的开发者,2019年还成为AI语言领域最高级峰会ACL(国际计算语言协会)主席。
1991年在NLP重镇哈工大学取得博士学位后,考入周明清华大学。1999年被微软亚洲研究院的创立院长李开复发掘,不久成为NLP研究小组的负责人。
2020年退出MSRA加盟首席科学家时,周明担任MSRA副院长多年。
21.5离开工作了一年的MSRA的原因,周明略带调侃地说明:
“2020年底,我隐约感觉到未来的大模式会崛起,所以我下定决心离开微软成立了澜舟科技,专门研究大模式。”
据介绍,除孟子大型号外,目前澜舟科技已经开放了近20个大型号。
如果真的像李开复一样,AI来到了从1.0到2.0的转折点,这对NLP来说意味着什么?
周明另一方面,AI2.0反映在NLP上,可以看到GPT这样的通用模型,一套模型解决了很多问题,效率大大提高,另一方面提出了两种现象:
第一,AI2.0时代的NLP能力足够强大,在处理新任务时只需用一个提示语代替该能力
第二,当模型大到一定程度时,新的能力就会出现,尤其是从未见过的能力就会爆发。
他对个人出现新能力表现出特别关注。出现的事情仍然是个谜,因为“唯一能启发你的是在能力范围内,尽可能把模型做大”。
ChatGPT中的逻辑和思维能力是GPT系列模型强有力的奇迹出品。那么,澜舟科技是否也被编码为模型参数呢。
周明单刀直入地回答,澜舟不会追随千亿、兆大模型。
关于大牛周明和他对大模式的最新思考,欢迎锁定将于3月29日在量子比特召开的中国AIGC产业峰会,周明博士已经确认出席,带来最新思考。