
|
工具/服务 |
作用 |
成本特点 |
|
Ollama |
本地运行轻量化生成模型 |
完全免费,支持消费级硬件 |
|
vLLM |
高效模型推理与部署 |
开源,可部署于低配GPU |
|
LangChain / Dify |
快速搭建AI应用工作流 |
社区版免费,支持自托管 |
|
开源向量数据库 |
存储知识库嵌入 |
Chroma、Qdrant免费使用 |