BLOOM 是世界上最大的开放多语言语言模型,标志着人工智能研究的一个重要里程碑。这个强大的通用模型能够根据用户的指令执行各种新的语言任务。然而,学术界、非营利组织和小型公司的研究实验室发现,由于只有少数拥有必要资源和独家权利的工业实验室能够完全访问这些模型,因此创建、研究甚至使用大型语言模型(LLMs)变得异常困难。今天,我们发布了BLOOM,这是第一个在完全透明的情况下训练的多语言LLM,旨在改变这一现状——这是迄今为止涉及单个研究项目的最大规模AI研究人员合作的结果。凭借其1760亿个参数,BLOOM能够生成46种自然语言和13种编程语言的文本。对于几乎所有这些语言,如西班牙语、法语和阿拉伯语,BLOOM将是首个拥有超过1000亿参数的语言模型。这是一年工作的结晶,涉及来自70多个国家和250多个机构的1000多名研究人员,最终在法国巴黎南部的Jean Zay超级计算机上进行了117天(3月11日至7月6日)的训练,这得益于法国研究机构CNRS和GENCI提供的价值约300万欧元的计算资助。研究人员现在可以下载、运行和研究BLOOM,以调查最近开发的大型语言模型的性能和最深层次的内部操作。更广泛地说,任何同意模型负责任AI许可证(在BigScience项目本身开发)条款的个人或机构都可以在本地机器或云提供商上使用和构建模型——由于它嵌入在Hugging Face生态系统中,使用transformers导入并使用accelerate运行它变得非常容易。本着合作和持续改进的精神,我们还首次发布了训练的中间检查点和优化器状态。没有8个A100来玩?我们正在为大规模使用完成一个推理API,即使没有专用硬件或工程。同时,对于快速测试、原型设计和较小规模的使用,您已经可以在HF hub上玩一个早期版本。这仅仅是开始。随着研讨会继续实验和调整模型,BLOOM的能力将继续提高。我们已经开始工作,使其像我们早期的努力T0++一样可指导,并计划添加更多语言,将模型压缩成具有相同性能水平的更可用版本,并将其作为更复杂架构的起点……研究人员和实践者一直想要运行的所有实验,现在都可以从一个1000亿参数模型的力量开始。BLOOM是一个活生生的模型家族的种子,我们打算让它成长,而不仅仅是一个一次性的模型,我们准备支持社区努力扩展它。
BLOOM的最佳替代品

Wordware
Wordware 是构建生产就绪 AI 的终极工具包

techtrust.ai
techtrust.ai 提供多种 AI 相关服务,助力企业发展

Socially Sourced Startup Ideas
Socially Sourced Startup Ideas 助您发现有价值的创业点子

Boba
Boba 是 AI 创意助手,助您探索研究信号与趋势

Wiseone
Wiseone 是 AI 驱动的提升阅读与研究效率的工具

Project Knowledge Exploration
Project Knowledge Exploration 借助自然语言输入实现交互搜索体验

Runway
Runway 是一款以人工智能驱动的创新工具,助力提升创造力

Notably
Notably是一个AI驱动的研究平台,助力用户获取洞察

PaperBrain
PaperBrain 是智能简化科研文献的工具,助您轻松探索

Unriddle
Unriddle是一款AI助力的研究工具,助您快速处理各类文档

Journey AI
Journey AI 是一款将客户研究快速转化为旅程地图的工具,助您做出更好决策

genei
genei 是 AI 驱动的研究工具,助您提高效率

Replio
Replio 是 AI 驱动的平台,助您高效开展调研

Layer
Layer 是一款 AI 驱动的研究助手,可节省研究时间

Iris.ai RSpace™
Iris.ai RSpace™是一款助力科研的智能工具,提供深度知识

Fairgen
Fairgen 是一款利用生成式 AI 为研究提供可靠洞察的平台

Towards Data Science
Towards Data Science 提供多样 AI 相关内容助您成长

NewsDeck
NewsDeck 是一款利用智能新闻阅读器 AI 技术,帮助用户实时访问全球新闻周期的工具。

Locus
Locus是一款AI驱动的智能搜索工具,帮助用户快速找到网页上的相关信息。

Encord
Encord是一个AI数据开发平台,帮助计算机视觉和多模态AI团队管理、搜索和注释非结构化数据,以及评估模型性能。

SEEKER
SEEKER是一个检索增强生成(RAG)AI聊天平台,安全地从大数据集中提取和分析信息,为个人和组织提供可信赖的洞察和优化。