BLOOM:世界最大のオープン多言語言語モデルの紹介

BLOOM

BLOOMは、完全な透明性のもとで訓練された初の多言語大規模言語モデルで、46の自然言語と13のプログラミング言語でテキストを生成できます。

BLOOM:世界最大のオープン多言語言語モデルの紹介

BLOOMは、AI研究に大きな影響を与えてきた大規模言語モデル(LLM)の新たな一歩を表しています。この強力で汎用的なモデルは、ユーザーの指示に基づいて多様な言語タスクを遂行することが可能です。しかし、学界、非営利団体、そして小規模な企業の研究ラボは、必要なリソースと独占的な権利を持つ一部の産業ラボだけが完全にアクセスできるため、LLMの作成、研究、または使用が困難でした。

今日、私たちはこの現状を変えるために、完全な透明性のもとで訓練された初の多言語LLMであるBLOOMをリリースします。これは、単一の研究プロジェクトにこれまで以上に多くのAI研究者が関わった最大のコラボレーションの結果です。1760億のパラメータを持つBLOOMは、46の自然言語と13のプログラミング言語でテキストを生成することができます。スペイン語、フランス語、アラビア語など、ほとんどすべての言語において、BLOOMは100B以上のパラメータを持つ初の言語モデルとなります。

これは、70カ国以上、250以上の機関から1000人以上の研究者が関わり、フランスの研究機関CNRSとGENCIから推定300万ユーロの計算助成金を受けて、フランス南部のJean Zayスーパーコンピュータで117日間(3月11日~7月6日)にわたってBLOOMモデルを訓練した1年間の努力の結晶です。研究者は現在、BLOOMをダウンロード、実行、研究し、最近開発された大規模言語モデルのパフォーマンスと動作をその最深部の内部操作まで調査することができます。

より一般的には、モデルの責任あるAIライセンス(BigScienceプロジェクト自体で開発された)の条件に同意する個人または機関は、ローカルマシンまたはクラウドプロバイダー上でモデルを使用し、構築することができます。Hugging Faceエコシステムに組み込まれているため、transformersでインポートし、accelerateで実行するのと同じくらい簡単です。

このコラボレーションと継続的改善の精神に基づき、私たちは初めて、訓練の中間チェックポイントとオプティマイザの状態も公開します。8つのA100をプレイする必要はありません。大規模な使用のための推論APIを最終化しています。その間、クイックテスト、プロトタイピング、および小規模な使用のためには、HFハブで早期バージョンをすでにプレイすることができます。

これは始まりに過ぎません。BLOOMの能力は、ワークショップがモデルを実験し、いじくり回し続けることで、さらに向上し続けます。私たちは、以前の努力であるT0++と同じくらい指示可能にする作業を開始し、より多くの言語を追加し、同じレベルのパフォーマンスでモデルをより使いやすいバージョンに圧縮し、より複雑なアーキテクチャの出発点として使用する予定です。研究者と実務者が常に実行したかったすべての実験は、1000億以上のパラメータモデルの力で、今や可能です。BLOOMは、私たちが成長させようとしている生きているモデルファミリーの種であり、一度きりのモデルではありません。そして、私たちはそれを拡張するためのコミュニティの努力をサポートする準備ができています。

BLOOMの代替ツール

Convo

Convo

ConvoはAIがモデレートする質的ユーザーリサーチプラットフォームです。

TopicMojo

TopicMojo

TopicMojoは効果的なトピック研究ツールでユーザーを支援

ワードウェア

ワードウェア

ワードウェアは、AIスタックを構築・管理する超便利なAIツールキットだよ!

ヒューマン・オア・AIゲーム

ヒューマン・オア・AIゲーム

ヒューマン・オア・AIゲームは、画像が人間作かAI作かを判定できるよ!

The Full Stack

The Full Stack

The Full StackはAIパワード製品のためのコミュニティとコースを提供

techtrust.ai

techtrust.ai

techtrust.aiはAIテクノロジーを活用したサービスです

regex.ai

regex.ai

regex.aiはAIパワーの正規表現ソルバーで、テキスト入力と操作で正規表現を見つけます

Creators' AI

Creators' AI

Creators' AIはクリエイターと起業家向けのAIインサイトとツールを提供

GOODY

GOODY

GOODY-2は業界をリードする倫理原則に基づいたAIモデルです

Socially Sourced Startup Ideas

Socially Sourced Startup Ideas

「Socially Sourced Startup Ideas」は社会メディアから新規事業アイデアを発掘

screenpipe

screenpipe

screenpipeはデスクトップコンテキストとユーザー活動を取得するAIツール

Melon

Melon

Melonは学習をつなぎ、思考力を高めるAIツールです

Intuition Machines

Intuition Machines

Intuition MachinesはAI/MLを活用し、企業の未来に備える

Calypso

Calypso

CalypsoはAIを活用した株式投資のサポートツールです

GPTs Finder

GPTs Finder

GPTs Finderは最新のGPTsを毎時更新し、ユーザーに提供

BeanBook

BeanBook

BeanBookはAIを活用してコーヒー豆に関することを追跡・学習・質問できるアプリです

Prefind

Prefind

Prefind は GPT-4 & Claude-3 搭載の AI 検索エンジンで、効率的な検索体験を提供

Pl@ntNet

Pl@ntNet

Pl@ntNetは、写真から植物を識別し、植物の多様性に関する市民科学プロジェクトに参加できるアプリです。

Boba

Boba

Bobaはジェネレーティブアイデア生成のAIコパイロットで、様々な質問に答えるのに役立ちます

Wiseone

Wiseone

WiseoneはAIを活用し、検索と読書の生産性を高めるツール

Project Knowledge Exploration

Project Knowledge Exploration

「Project Knowledge Exploration は、自然言語入力でインタラクティブな検索体験を実現」

注目のAIツール

ytRank

ytRank

ytRankは、YouTubeクリエイターがコンテンツ戦略を強化し、チャンネルを成長させるための高度な分析とキーワードリサーチツールを提供します。

詳細を見る
CloudNein

CloudNein

CloudNeinはYouTubeビデオのトランスクリプトからインタラクティブなワードクラウドを生成するAIツールです。

詳細を見る
ApX Machine Learning

ApX Machine Learning

ApX Machine Learningは、100%無料のコースと強力なプラットフォームを提供し、機械学習モデルの作成と展開を支援します。

詳細を見る
YOMO AI

YOMO AI

YOMO AIは、収益を増やし、顧客離反を減らす製品を作るためのプラットフォームで、チームが効率的に協力できます。

詳細を見る
Nex

Nex

Nexは、YouTubeビデオや記事の要点を自動的に抽出し、情報吸収の効率を大幅に向上させるAI知識コパイロットです。

詳細を見る
GLYPH

GLYPH

GLYPHは、会話、通話、会議を数秒で利用可能なデータ、洞察、または要約に変換するAIエンジンを提供します。

詳細を見る
AnswerTime

AnswerTime

AnswerTimeは、ユーザーインタビューをAIに委託し、顧客インサイトを自動的に収集するAI主導のリサーチツールです。

詳細を見る
Epsilla

Epsilla

Epsillaは、プライベートデータとナレッジを活用して垂直LLMエージェントを作成するためのオールインワンプラットフォームです。

詳細を見る