BLOOM: 세계 최대의 오픈 다국어 언어 모델 소개

BLOOM

BLOOM은 완전한 투명성 속에서 훈련된 최초의 다국어 대형 언어 모델로, 46개의 자연어와 13개의 프로그래밍 언어로 텍스트를 생성할 수 있습니다.

BLOOM: 세계 최대의 오픈 다국어 언어 모델 소개

BLOOM은 AI 연구에 있어 큰 파장을 일으키고 있는 대형 언어 모델(LLM)의 새로운 지평을 열었습니다. 이 강력하고 일반적인 모델은 사용자의 지시에 따라 다양한 새로운 언어 작업을 수행할 수 있습니다. 그러나 학계, 비영리 단체 및 소규모 회사의 연구실은 필요한 자원과 독점적 권리를 가진 몇몇 산업 연구실만이 완전히 접근할 수 있는 LLM을 생성, 연구 또는 사용하는 데 어려움을 겪고 있습니다. 오늘, 우리는 이러한 현상을 바꾸기 위해 완전한 투명성 속에서 훈련된 최초의 다국어 LLM인 BLOOM을 공개합니다. 이는 단일 연구 프로젝트에 참여한 AI 연구자들의 가장 큰 협력의 결과물입니다. 1760억 개의 파라미터를 가진 BLOOM은 46개의 자연어와 13개의 프로그래밍 언어로 텍스트를 생성할 수 있습니다. 스페인어, 프랑스어, 아랍어와 같은 거의 모든 언어에 대해 BLOOM은 1000억 개 이상의 파라미터를 가진 최초의 언어 모델이 될 것입니다. 이는 70개 이상의 국가와 250개 이상의 기관에서 온 1000명 이상의 연구자들이 참여한 1년 간의 작업의 정점으로, 프랑스 남부 파리에 위치한 Jean Zay 슈퍼컴퓨터에서 117일간(3월 11일 - 7월 6일) BLOOM 모델을 훈련시킨 결과입니다. 이는 프랑스 연구 기관 CNRS와 GENCI로부터 약 300만 유로 상당의 컴퓨팅 지원을 받아 이루어졌습니다. 이제 연구자들은 BLOOM을 다운로드, 실행 및 연구하여 최근 개발된 대형 언어 모델의 성능과 행동을 가장 깊은 내부 작동까지 조사할 수 있습니다. 더 일반적으로, 모델의 책임 있는 AI 라이선스(빅사이언스 프로젝트 자체에서 개발됨) 조건에 동의하는 모든 개인 또는 기관은 로컬 머신이나 클라우드 제공자에서 모델을 사용하고 구축할 수 있습니다. Hugging Face 생태계에 내장되어 있기 때문에 transformers로 가져오고 accelerate로 실행하는 것만큼 쉽습니다. 협력과 지속적인 개선의 정신으로, 우리는 또한 처음으로 훈련의 중간 체크포인트와 옵티마이저 상태를 공개합니다. 8개의 A100을 가지고 놀 수 없나요? 우리는 전용 하드웨어나 엔지니어링 없이도 대규모 사용을 위한 추론 API를 마무리하고 있습니다. 그동안 빠른 테스트, 프로토타이핑 및 소규모 사용을 위해 HF 허브에서 초기 버전을 이미 사용해 볼 수 있습니다. 이는 시작에 불과합니다. BLOOM의 능력은 워크숍이 모델을 실험하고 개선함에 따라 계속해서 향상될 것입니다. 우리는 이전의 T0++만큼 지시 가능하게 만들기 위해 작업을 시작했으며, 더 많은 언어를 추가하고, 동일한 수준의 성능을 유지하면서 모델을 더 사용하기 쉬운 버전으로 압축하고, 더 복잡한 아키텍처를 위한 출발점으로 사용할 예정입니다. 연구자와 실무자들이 항상 실행하고 싶어했던 모든 실험은 이제 1000억 개 이상의 파라미터를 가진 모델의 힘으로 가능합니다. BLOOM은 우리가 성장시키려는 살아있는 모델 가족의 씨앗이며, 우리는 이를 확장하기 위한 커뮤니티의 노력을 지원할 준비가 되어 있습니다.

BLOOM의 대체 도구

InfraNodus

InfraNodus

InfraNodus는 텍스트를 네트워크로 시각화하여 통찰력을 제공하는 AI 도구입니다.

TopicMojo

TopicMojo

TopicMojo는 효과적인 주제 연구를 돕는 AI 도구입니다

Wordware

Wordware

Wordware는 AI 스택 구축을 위한 강력한 도구입니다.

Human or AI Game

Human or AI Game

Human or AI Game은 인간과 AI 생성물을 구별하는 게임입니다

The Full Stack

The Full Stack

The Full Stack은 AI 제품 구축을 위한 커뮤니티 및 교육 플랫폼입니다.

techtrust.ai

techtrust.ai

techtrust.ai는 알파 잠재력을 가진 초기 단계 AI 기술을 식별합니다.

Regex.ai

Regex.ai

Regex.ai는 입력된 텍스트에서 정규식을 찾아주는 AI 도구입니다.

Creators' AI

Creators' AI

Creators' AI는 창작자와 기업가를 위한 AI 인사이트와 도구 제공

GOODY

GOODY

GOODY-2는 업계 선도적인 윤리 원칙을 준수하는 AI 모델입니다.

screenpipe

screenpipe

screenpipe는 데스크톱 컨텍스트와 사용자 활동을 포착하는 AI 도구입니다.

Melon

Melon

Melon은 사용자의 학습을 연결하고 사고력을 향상시키는 AI입니다.

ApX Machine Learning

ApX Machine Learning

ApX Machine Learning은 무료 강좌와 강력한 플랫폼을 제공합니다

에일리스

에일리스

에일리스는 강력한 AI 기술을 바탕으로 다양한 기능을 제공하는 종합적인 AI 에이전트입니다.

Intuition Machines

Intuition Machines

Intuition Machines는 개인정보 보호 AI/ML 플랫폼으로 기업의 미래를 준비시킵니다.

Calypso

Calypso

Calypso는 AI를 활용한 공개주식 투자자들을 돕는 도구입니다.

GPTs Finder

GPTs Finder

GPTs Finder는 최신 GPT를 제공하며 영감을 주는 서비스입니다

BeanBook

BeanBook

BeanBook는 AI를 활용해 커피콩을 추적, 탐색하고 질문에 답하는 앱입니다.

Prefind

Prefind

Prefind는 GPT-4 & Claude-3로 구동되는 AI 검색 엔진으로 빠르고 무료 검색을 제공합니다.

Boba

Boba

Boba는 생성적 아이디어를 위한 AI 동반자로 질적 연구 질문에 답변을 돕습니다.

Wiseone

Wiseone

Wiseone은 AI로 웹 검색 및 독서 생산성을 향상시키는 도구입니다

Project Knowledge Exploration

Project Knowledge Exploration

Project Knowledge Exploration은 자연어 입력으로 상호작용 검색 경험을 제공합니다.

추천 AI 도구

AskMetric

AskMetric은 AI 기술을 기반으로 한 디지털 커머스 분석 도구로, 상품 전략, 광고 전략, 키워드 검색 등을 지원합니다.

자세히 보기
Unlevered — The AI SEC Platform

Unlevered — The AI SEC Platform

Unlevered은 SEC 파일, 투자자 관계 업데이트 및 수익 성적표를 위한 원활한 읽기와 맞춤형 알림을 제공하는 AI 플랫폼입니다.

자세히 보기
Seamless

Seamless

Seamless는 과학 연구를 위한 AI 문헌 검토 도구로, 관련 논문을 찾고 작업의 발췌문에서 직접 초안을 작성할 수 있게 도와줍니다.

자세히 보기
AI SWOT Analysis Generator

AI SWOT Analysis Generator

AI SWOT Analysis Generator는 회사 설명을 기반으로 SWOT 분석을 생성하는 AI 도구입니다.

자세히 보기
BERT

BERT

BERT는 자연어 처리(NLP) 작업을 위한 혁신적인 사전 훈련 모델입니다.

자세히 보기
Opinionate

Opinionate

AI를 활용한 논쟁 정리 및 의사 결정 지원 플랫폼.

자세히 보기
BenderV/generate

BenderV/generate

BenderV/generate는 LLM을 활용한 데이터 생성 실험 프로젝트입니다.

자세히 보기
Typeform

Typeform

Typeform is an AI-powered form builder that helps users collect valuable customer insights effortlessly.

자세히 보기