BLOOM:世界最大のオープン多言語言語モデルの紹介

BLOOM

BLOOMは、完全な透明性のもとで訓練された初の多言語大規模言語モデルで、46の自然言語と13のプログラミング言語でテキストを生成できます。

BLOOM:世界最大のオープン多言語言語モデルの紹介

BLOOMは、AI研究に大きな影響を与えてきた大規模言語モデル(LLM)の新たな一歩を表しています。この強力で汎用的なモデルは、ユーザーの指示に基づいて多様な言語タスクを遂行することが可能です。しかし、学界、非営利団体、そして小規模な企業の研究ラボは、必要なリソースと独占的な権利を持つ一部の産業ラボだけが完全にアクセスできるため、LLMの作成、研究、または使用が困難でした。

今日、私たちはこの現状を変えるために、完全な透明性のもとで訓練された初の多言語LLMであるBLOOMをリリースします。これは、単一の研究プロジェクトにこれまで以上に多くのAI研究者が関わった最大のコラボレーションの結果です。1760億のパラメータを持つBLOOMは、46の自然言語と13のプログラミング言語でテキストを生成することができます。スペイン語、フランス語、アラビア語など、ほとんどすべての言語において、BLOOMは100B以上のパラメータを持つ初の言語モデルとなります。

これは、70カ国以上、250以上の機関から1000人以上の研究者が関わり、フランスの研究機関CNRSとGENCIから推定300万ユーロの計算助成金を受けて、フランス南部のJean Zayスーパーコンピュータで117日間(3月11日~7月6日)にわたってBLOOMモデルを訓練した1年間の努力の結晶です。研究者は現在、BLOOMをダウンロード、実行、研究し、最近開発された大規模言語モデルのパフォーマンスと動作をその最深部の内部操作まで調査することができます。

より一般的には、モデルの責任あるAIライセンス(BigScienceプロジェクト自体で開発された)の条件に同意する個人または機関は、ローカルマシンまたはクラウドプロバイダー上でモデルを使用し、構築することができます。Hugging Faceエコシステムに組み込まれているため、transformersでインポートし、accelerateで実行するのと同じくらい簡単です。

このコラボレーションと継続的改善の精神に基づき、私たちは初めて、訓練の中間チェックポイントとオプティマイザの状態も公開します。8つのA100をプレイする必要はありません。大規模な使用のための推論APIを最終化しています。その間、クイックテスト、プロトタイピング、および小規模な使用のためには、HFハブで早期バージョンをすでにプレイすることができます。

これは始まりに過ぎません。BLOOMの能力は、ワークショップがモデルを実験し、いじくり回し続けることで、さらに向上し続けます。私たちは、以前の努力であるT0++と同じくらい指示可能にする作業を開始し、より多くの言語を追加し、同じレベルのパフォーマンスでモデルをより使いやすいバージョンに圧縮し、より複雑なアーキテクチャの出発点として使用する予定です。研究者と実務者が常に実行したかったすべての実験は、1000億以上のパラメータモデルの力で、今や可能です。BLOOMは、私たちが成長させようとしている生きているモデルファミリーの種であり、一度きりのモデルではありません。そして、私たちはそれを拡張するためのコミュニティの努力をサポートする準備ができています。

BLOOMの代替ツール

Convo

Convo

ConvoはAIがモデレートする質的ユーザーリサーチプラットフォームです。

TopicMojo

TopicMojo

TopicMojoは効果的なトピック研究ツールでユーザーを支援

ワードウェア

ワードウェア

ワードウェアは、AIスタックを構築・管理する超便利なAIツールキットだよ!

ヒューマン・オア・AIゲーム

ヒューマン・オア・AIゲーム

ヒューマン・オア・AIゲームは、画像が人間作かAI作かを判定できるよ!

The Full Stack

The Full Stack

The Full StackはAIパワード製品のためのコミュニティとコースを提供

techtrust.ai

techtrust.ai

techtrust.aiはAIテクノロジーを活用したサービスです

regex.ai

regex.ai

regex.aiはAIパワーの正規表現ソルバーで、テキスト入力と操作で正規表現を見つけます

Creators' AI

Creators' AI

Creators' AIはクリエイターと起業家向けのAIインサイトとツールを提供

GOODY

GOODY

GOODY-2は業界をリードする倫理原則に基づいたAIモデルです

Socially Sourced Startup Ideas

Socially Sourced Startup Ideas

「Socially Sourced Startup Ideas」は社会メディアから新規事業アイデアを発掘

screenpipe

screenpipe

screenpipeはデスクトップコンテキストとユーザー活動を取得するAIツール

Melon

Melon

Melonは学習をつなぎ、思考力を高めるAIツールです

Intuition Machines

Intuition Machines

Intuition MachinesはAI/MLを活用し、企業の未来に備える

Calypso

Calypso

CalypsoはAIを活用した株式投資のサポートツールです

GPTs Finder

GPTs Finder

GPTs Finderは最新のGPTsを毎時更新し、ユーザーに提供

BeanBook

BeanBook

BeanBookはAIを活用してコーヒー豆に関することを追跡・学習・質問できるアプリです

Prefind

Prefind

Prefind は GPT-4 & Claude-3 搭載の AI 検索エンジンで、効率的な検索体験を提供

Pl@ntNet

Pl@ntNet

Pl@ntNetは、写真から植物を識別し、植物の多様性に関する市民科学プロジェクトに参加できるアプリです。

Boba

Boba

Bobaはジェネレーティブアイデア生成のAIコパイロットで、様々な質問に答えるのに役立ちます

Wiseone

Wiseone

WiseoneはAIを活用し、検索と読書の生産性を高めるツール

Project Knowledge Exploration

Project Knowledge Exploration

「Project Knowledge Exploration は、自然言語入力でインタラクティブな検索体験を実現」

注目のAIツール

Tensorplex Labs

Tensorplex Labs

Tensorplex Labsは、分散型技術を使用してAI開発とユースケースを強化するアプリケーション、インフラストラクチャ、およびツールを構築しています。

詳細を見る
Pathfinder by Summit

Pathfinder by Summit

Pathfinder by Summitは、目標を達成するためのカスタマイズされたプランを提供するAIツールです。

詳細を見る
GPTionary

GPTionary

GPTionaryは、AIを活用したシソーラスで、単語やフレーズを迅速に検索するのに役立ちます。

詳細を見る
Claude

Claude

Claudeは、安全性を最前線に置いたAI研究と製品を提供するAIモデルです。

詳細を見る
Andesite

Andesite

Andesiteは、アナリストのための革新的な意思決定プラットフォームです。

詳細を見る
Agency

Agency

Agencyは、チームが大規模に信頼性の高いAIエージェントを作成できるように支援する

詳細を見る
Cranium

Cranium

CraniumはAIガバナンスを支援し、未来を形作る

詳細を見る
Sibyl AI

Sibyl AI

Sibyl AI は多言語対応で様々なメリットを提供

詳細を見る