Lepton AI Cloudは、高性能なAI推論とトレーニング、そしてクラウドネイティブの効率性を組み合わせたプラットフォームです。このプラットフォームは、99.9%の稼働率を保証する高可用性、スマートスケジューリング、加速されたコンピューティング、そして最適化されたインフラによる5倍のパフォーマンス向上を特徴としています。また、AIに特化したストリームラインドデプロイメント、トレーニング、およびサービングを提供し、1日で構築し、数百万にスケールすることが可能です。
Lepton AI Cloudは、SOC2およびHIPAAに準拠しており、RBAC、クォータ、監査ログなどのエンタープライズ向け機能を備えています。さらに、分散推論による600+ t/sのトークン速度、1クライアントによる23B+の日次トークン処理、そして10msの初回トークンまでの時間を実現する最速でスケーラブルなAIランタイムを提供します。
LeptonのLLMエンジンは、動的バッチ処理、量子化、推測デコードを備えた最速のLLMサービスエンジンで、ほとんどのオープンソースアーキテクチャをサポートしています。また、Photonは、Pythonicな機械学習モデルサービスを構築するための使いやすいオープンソースライブラリです。
Lepton AI Cloudは、高性能な計算ハードウェアとクラウドネイティブソフトウェアを組み合わせ、サーバーレスクラウド、Lepton APIサービス、エンタープライズデプロイメントを提供します。これにより、開発者は迅速にAIアプリケーションを構築し、スケールすることができます。