ChatGPT开源替代品来了?OpenChatKit,打破封闭AI梦!🚀🔥
文章主题:
整理 | 郑丽媛
出品 | CSDN(ID:CSDNnews)
近来 ChatGPT 的爆火,令不少人开始关注其背后的 OpenAI。
🌟【探索OpenAI起源】成立于2015年的创新力量💡,OpenAI曾以高尚愿景起步——作为一家非营利组织🌍,它承诺将专利与科研成果无私分享,旨在为全人类的福祉照亮道路。然而,随着时间的推移,这段旅程中是否始终坚守初衷呢?🤔
🌟2019年,OpenAI转型为营利性企业OpenAI LP,微软注资10亿,这无疑引发了热议。遗憾的是,GPT-3仅以API形式面向公众,而非开放源代码,ChatGPT的开源之路似乎也遥不可及。许多人不禁感慨,似有“ClosedAI”之名在呼唤。🚀
意外的是,ChatGPT 的开源 ” 平替 ” 还是来了。
🎉【创新引领】揭秘首个开源ChatGPT克隆!🚀日期: marzo 12, 2023领域: AI与技术革命消息来源: Orca Security 数据科学专家 Itamar Golan 的推特洞察数据科学家 Itamar Golan 不出所料地揭示了科技界的一股新潮流——开源ChatGPT的强劲竞争对手!🚀 由一群前OpenAI研究精英组成的团队,他们智慧结晶,推出了一个名为”OpenChatKit”的开源模型,旨在为全球开发者提供一个替代ChatGPT的独特选择。💡这个创新项目标志着技术社区对先进人工智能工具的持续探索和贡献,它不仅挑战了现有市场的主导地位,也为未来的开源AI生态系统注入了活力。🌟欲了解更多关于OpenChatKit如何颠覆聊天机器人领域的细节,敬请关注相关科技新闻报道或直接与Orca Security联系获取深入分析。💡#ChatGPT替代品 #OpenChatKit #开源创新
🌟【OpenChatKit揭秘】Together已全公开所有资源!🚀🏆 惊喜来袭!OpenChatKit的开源核心与深度学习模型,以及宝贵的训练数据集,此刻都毫无保留地展现在大家面前,Together诚意满满!🔍💡 作为行业领先的探索者,Together秉持开放精神,让技术进步的力量触手可及。这些关键组件不仅便于研究和学习,也为未来的创新提供了无限可能。📚📝 想要深入理解聊天机器人的秘密吗?这里有最真实的实践材料等你来挖掘!只需轻轻一点,一切尽在掌握。👉别忘了,优化的SEO词汇如”OpenChatKit开源”、”模型权重分享”和”data集公开”将有助于提升你的搜索引擎排名,让知识传播更迅速。🌐记得关注Together,一起见证科技与共享的力量!💪
在问答、提取和分类方面,表现尚佳
🌟【揭秘OpenChatKit背后的超凡力量】🚀💡GPT-NeoXT-Chat-Base-20B,这个神秘的巨轮,正是OpenChatKit构建基石的璀璨明珠!它源于EleutherAI这位技术界的泰斗,其创新的GPT-NeoX-20B模型为其注入了无尽智慧。🌟🔍不像一般的模型,EleutherAI的这款黑科技并非出自平凡之手,而是黑客组织的结晶,这赋予了它独特的魅力和不可估量的价值。💡🛠️OpenChatKit得以屹立不倒,正是得益于这个20B的大规模语言模型,它如同一个超凡的聊天机器人,为我们的互动体验带来了革命性的改变。🤖🌐无论是内容生成、对话理解,还是未来的可能性探索,GPT-NeoXT都以其强大的语言处理能力,引领着AI技术的新潮流。🚀欲了解更多关于这个强大引擎如何驱动OpenChatKit的创新之旅,敬请关注后续更新,我们在这里等你一起探索科技的无限可能!🌐—注意:保留原文的核心信息,同时进行了内容优化和调整,以适应SEO和社交媒体的表达方式。
🌟成立于2020年7月的黑客组织🌟EleutherAI,集结了一群热衷于机器学习的科研者,他们以打破微软与OpenAI在NLP领域的霸权为目标行动。💡受微软与OpenAI协议垄断GPT-3源码事件启发,这个团队决心挑战现状,通过开源技术来塑造未来语言模型的新格局。🌟EleutherAI的核心使命是研发并分享大型语言模型,为全球开发者提供无束创新的平台。🌐他们的存在,不仅是为了反抗不公平,更是为了推动人工智能领域的开放与进步。
EleutherAI 创始人 Connor Leahy 曾说:” 起初这真的只是一个有趣的业余爱好。我们认为自己是几十年前经典黑客文化的后裔,只是在新的领域,出于好奇和对挑战的热爱而对技术进行试验。”
成立不到 3 年,EleutherAI 不断实现其目标:先发布了类 GPT 的 27 亿参数模型 GPT-Neo,又开源了 60 亿参数的 NLP 模型 GPT-J,去年又免费开放了包含 200 亿参数的 GPT-NeoX-20B。
得益于 GPT-NeoX-20B 的开源,Together 用 4300 万条高质量指令的集合对模型的聊天功能进行了微调,主要在多轮对话、问答、分类、提取和摘要等方面重点调优,从而得到了 GPT-NeoXT-Chat-Base-20B。
据介绍,GPT-NeoXT-Chat-Base-20B 开箱即用,为一系列广泛的自然语言任务提供了一个强大基础,它在 HELM 基准测试上的得分高于其基本模型 GPT-NeoX,特别是在涉及问答、提取和分类的任务上。
基于 GPT-NeoXT-Chat-Base-20B 的 OpenChatKit,也就继承了这些优点。
在编码等方面还有欠缺
具体来说,OpenChatKit 一共包含 4 个关键组件:
(1)一个经过指令调整的大型语言模型,该模型基于 EleutherAI 的 GPT-NeoX-20B,经过了 4300 万条指令的微调。
(2)定制配方,对模型进行微调,以实现任务的高精确度。
(3)一个可扩展的检索系统,能够在推理时用来自文件库、API 或其他实时更新的信息源的信息来增强响应。
(4)一个由 GPT-JT-6B 微调的调节模型,以此过滤一些问题的响应。
基于这些组件,现阶段的 OpenChatKit 开箱即用,并且在问答、信息提取和文本分类方面较为擅长:
user:将下面句子的情感分为正面、中性或负面:对于教授斯坦福大学的第一门大型语言模型课程,我感到非常兴奋!在这里查看教学大纲。
bot:正面的。
user:将下面句子的情感分为正面、中性或负面:外面在下雨,我感到很忧郁。
bot:负面的。
同时 Together 也承认,目前刚发布的 OpenChatKit 仍存在不少问题和缺陷,例如编码能力不足、会重复回答等:
基于知识的封闭式问答:聊天机器人可能会产生幻觉并给出不正确的结果,用户务必进行事实核查,并在可能的情况下提供反馈和更正的信息。
编码任务:聊天机器人没有经过足够大的源代码库的训练,所以暂且无法出色地编写代码。
会重复:有时聊天机器人会重复回答,用户可以通过单击刷新按钮开始新的对话。
语境切换:如果在对话中改变话题,聊天机器人可能无法自动进行切换,并将继续提供与先前主题相关的答案。
创意写作和较长的回答:当前的聊天机器人不能生成有创意的长文,例如散文或故事。
为此,Together 呼吁大家一起尝试与 OpenChatKit 对话(https://huggingface.co/spaces/togethercomputer/OpenChatKit),如发现问题可随时反馈,以此加强数据集并提高其准确性:” 这不仅是一个模型的发布,更是一个开源项目的开始,希望能在社区的帮助下不断改进。”
可以用中文问答
或许是拥有着 ” 前 OpenAI 研究团队开发 ” 的前缀,OpenChatKit 仅发布 3 天,就在 GitHub 上收获了 3k+ Star,在 Issues 页面还能看到不少国内开发者的提问:
“ChatGPT 支持多语言问答和推理,尽管在大多数情况下,首先生成英语答案,然后翻译成其他语言。所以我想问一下,OpenChatKit 是否支持直接的中文问答,还是我需要使用中文数据集进行训练,然后才能进行中文问答?”
对此,使用过 OpenChatKit 的开发者回答称直接就可以。至于用中文问答 OpenChatKit 的效果,也有开发者分享了截图:” 中文提示也可以(输出质量取决于你的提示)。”
不过,毕竟与 ChatGPT 在模型参数量上就有 ” 壁 “,OpenChatKit 显然还有很大的差距和不足,需较长时间的成长与迭代。对 OpenChatKit 感兴趣的程序员们可前往项目主页具体查看和尝试:
项目地址:https://github.com/togethercomputer/OpenChatKit
测试链接:https://huggingface.co/spaces/togethercomputer/OpenChatKit
参考链接:
https://www.together.xyz/blog/openchatkit
https://github.com/togethercomputer/OpenChatKit
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!