2023-07-01 19:45:33
LMForge是一个开源的端到端LLMOps平台,专为多模型AI Agent开发设计,通过模块化架构和全链路工具链,帮助开发者解决从模型集成到生产部署的核心痛点,实现商业级AI应用的快速落地。

后端:Flask(API服务) + Celery(异步任务) + VectorDB(Weaviate/Pinecone存储向量)
前端:Vue3(交互界面) + TailwindCSS(样式) + Vue-Flow(可视化编排)
AI框架:LangChain/LangGraph(工作流引擎)
部署:Docker Compose一键部署,支持PostgreSQL(数据库)、Redis(缓存)、JWT(认证)
YAML配置驱动:通过抽象基类(Abstract Base Class)统一接口,开发者仅需修改YAML文件即可切换模型(如从OpenAI切换到DeepSeek)。
动态导入机制:支持远程API(如文心一言、通义千问)和本地开源模型(如Llama via Hugging Face)。
全流程自动化:支持文档上传、关键词提取、向量化(Embedding)、混合检索(ReRank/CRAG)。
异步处理:使用Celery处理耗时任务(如大规模文档向量化),避免阻塞主流程。
向量数据库集成:支持Weaviate/Pinecone,优化语义检索效率。
拖拽式界面:基于Vue-Flow + dagre实现自适应排版,支持单/多Agent转换。
插件集成:内置常用API(如天气查询、数据库操作),支持自定义插件扩展。
YAML配置同步:工作流可导出为YAML,便于版本控制与协作。
内容审核:关键词过滤 + OpenAI Moderation API,支持流式响应中断。
认证与限流:JWT/OAuth认证,Rate Limiting(Token Bucket算法)防止滥用。
预警系统:实时监控Token用量突增,触发预警通知。
云原生部署:Docker Compose一键部署,Gunicorn多进程 + Nginx限流提升并发能力。
异步任务:Celery优化长任务处理(如批量推理)。
统计面板:ECharts可视化Token用量、费用计算,支持预警阈值设置。
复制.env.example为.env,填写数据库、Redis、API Key等参数。
Web UI:
API文档:
立即行动:访问