LastMile AI 是一个专为生成式AI应用开发设计的全栈平台。它提供了一系列工具和服务,帮助开发者从调试到评估,再到改进他们的AI应用。通过LastMile,开发者可以微调自定义评估模型,设置防护栏,并监控应用性能。
平台的核心功能之一是AutoEval,它允许开发者根据特定的评估标准微调快速的评估模型。这个过程包括上传应用数据、通过LLM法官进行标注,以及微调评估模型。AutoEval还内置了针对RAG和多代理AI应用的评估指标,以及一个微调服务,让开发者能够设计自己的评估器。
此外,LastMile AI 引入了alBERTa,一个专为评估任务设计的小型语言模型。alBERTa拥有400M参数,能够在不到300ms的时间内完成推理,并且可以在CPU上高效运行。它的设计使其能够为诸如忠实度等评估任务生成数字评分。
LastMile AI 还提供了实时防护栏功能,这些防护栏本质上是应用运行时中的快速在线评估器。开发者可以使用这些评估器对幻觉、毒性、安全性或自定义标准进行实时检查。
为了确保数据的安全和隐私,LastMile AI 平台可以部署在开发者的VPC内,让开发者完全控制自己的数据平面。
LastMile AI 致力于使生成式AI开发更加科学化,而不仅仅是艺术。通过提供专门的工具和服务,LastMile AI 帮助开发者更有效地构建、评估和改进他们的AI应用。