零码微调大模型,只需5步,低成本150量子位
对大型号进行微调的代码将花费不到20美元(约合人民币144元)
这个过程也很简单,只需要5个步骤。
开源生成模型,如LLaMA,GPT,StableLM等,都可以解决。
这就是Monster API,一个现代的API平台。
一些人认为,开源领域的这一新工作可以重写AI开发的游戏,加快AI应用的速度。
您对连接GPT-3/GPT-4感到兴奋吗?
那么,他们是怎么做到的呢?5步零代码
Monster API的目的是使调整尽可能简单,以提供廉价的GPU资源和内存优化,而不需要开发人员进行一系列手动设置。
具体的过程包括:
第一步是选择要调整的模型。
LLaMA-7B、GPT-J-6B、StableLM-7B等Monster API至少提供了10种基础大型模型。
步骤2:选择或创建一个任务。命令调整、文本分类等,或自定义任务。
步骤3:选择HuggingFace数据集。
Monster API可以无缝集成HuggingFace数据集,并提供广泛的选择。您还可以根据任务类型推荐数据集。
您可以自动设置格式,而无需手动操作。
步骤4:设置超参数。
第五步:确认并提交。
一旦你设置了上面列出的所有步骤,请确保没有错误并提交。
Monster API表明,您可以从WandB的日志中监视任务。
在他的博客文章中,他写道,用DataBricks Dolly15k微调后的LLaMA-7B完成3个epouch,需要不到20美元(约144元)
根据官方网站,注册用户将获得2,500分。会员资格分为三个类别,每月9美元/29美元/39美元。
除了调整之外,Monster API还为生成式AI提供了一系列API接口,其成本比其他解决方案低80%。该公司已经筹集到110万美元。
Monster API背后的公司已经筹集了110万美元的种子前资金。
这家人工智能初创公司的目标是成为“GPU领域的Airbnb”,在全球范围内灵活调度分布式GPU资源,并以较低的价格向开发人员提供服务。
它由两个兄弟Gaurav Vij和Saurabh Vij创建。
Gaurav Vij创立了CV公司。CV公司面临着巨大的云计算资本,这激发了他们创建这样一个平台的灵感。
Saurabh Vij是CERN的粒子物理学家,他也研究分布式计算。
兄弟俩经历了多次技术迭代,针对机器学习任务优化了消费者GPU,并将Whisper AI模型的运行成本与AWS平台相比降低了90%,因此他们想知道为什么他们没有使用这种方法来帮助成千上万的开发人员。
该公司的一位客户通过使用分布式GPU计算资源节省了30万美元。
[1]https://blog.monsterapi.ai/no-code//www.enterpriseai.news/2023/06/09/monster-api-launches-the-airbnb-of-gpus-with-1-1m-pre-seed/