Featured image of post 技术热点追踪

技术热点追踪

持续追踪 Agent 与文档结构化领域的技术热点与开源项目

技术领域持续追踪记录,持续更新…

Agent 框架

LangChain

  • GitHub: langchain-ai/langchain
  • Stars: 138k
  • 简介: Agent 工程平台,提供模块化组件和第三方集成,简化 AI 应用开发。支持 LangGraph 用于构建可控的 Agent 工作流。
  • 特点: 丰富的集成生态、灵活的抽象层、生产级特性

MetaGPT

  • GitHub: FoundationAgents/MetaGPT
  • Stars: 68.5k
  • 简介: 多 Agent 框架,模拟软件公司角色协作。输入一行需求,输出完整的需求文档、数据结构、API 设计等。
  • 特点: SOP 流程化、角色扮演(产品经理/架构师/工程师)、Data Interpreter 数据分析能力

CrewAI

  • GitHub: crewAIInc/crewAI
  • Stars: 52.7k
  • 简介: 完全独立于 LangChain 的多 Agent 编排框架,提供 Crews(自主协作)和 Flows(事件驱动工作流)两种模式。
  • 特点: 高性能、灵活定制、无外部依赖、YAML 配置化

AutoGen (Microsoft)


LLM 推理

Ollama

  • GitHub: ollama/ollama
  • Stars: 173k
  • 简介: 本地大模型运行工具,支持 Kimi、GLM、DeepSeek、Qwen、Gemma 等模型。一键运行,本地部署。
  • 特点:
    • 丰富的模型库
    • REST API 支持
    • 多平台支持(macOS/Windows/Linux)
    • Docker 部署
    • 与 Claude Code、Copilot 等集成

llama.cpp

  • GitHub: ggml-org/llama.cpp
  • Stars: 114k
  • 简介: C/C++ 实现的 LLM 推理引擎,高性能、本地化运行。
  • 特点:
    • 纯 C/C++ 实现,无依赖
    • Apple Silicon 原生优化(Metal)
    • CUDA/ROCm/ Vulkan 多后端
    • 支持 1.5-8bit 量化
    • 多语言 Binding(Python/Go/JS/Rust/C# 等)

RAG 检索增强生成

RAGFlow

  • GitHub: infiniflow/ragflow
  • Stars: 34.2k
  • 简介: 基于深度文档理解的 RAG 引擎,提供端到端 RAG 工作流。
  • 特点:
    • 深度文档理解
    • 模板化分块
    • 可溯源的引用
    • 支持 GraphRAG
    • 多种数据源兼容

其他 RAG 工具

工具Stars特点
MaxKB15.2k开箱即用的 RAG 聊天机器人
R2R-开源 RAG 引擎

文档结构化

MinerU

  • GitHub: opendatalab/MinerU
  • Stars: 66.2k
  • 简介: 高精度文档解析引擎,将 PDF、DOCX、PPTX、XLSX、图片、网页转换为 Markdown/JSON。
  • 特点:
    • VLM + OCR 双引擎,支持 109 种语言
    • 原生 DOCX/PPTX/XLSX 解析
    • 公式→LaTeX、表格→HTML
    • 表结构重建、跨页表格合并
    • MCP Server 原生集成 LangChain/Dify/FastGPT

Marker

  • GitHub: datalab-to/marker
  • Stars: 35.7k
  • 简介: 将 PDF、图片、PPTX、DOCX、XLSX、HTML、EPUB 快速转换为 Markdown/JSON/HTML。
  • 特点:
    • 表格、公式、代码块、链接提取
    • 支持 LLM 提升准确率(Gemini/Ollama/Claude/OpenAI)
    • 支持结构化提取(Schema 定义)
    • GPU/CPU/MPS 多平台支持

Data Agent 数据智能体

Data Interpreter (MetaGPT)

  • GitHub: DataInterpreter/DataInterpreter
  • Stars: 9.8k
  • 简介: MetaGPT 开源的数据分析智能体,将自然语言查询转换为可执行的数据分析代码。
  • 特点:
    • 动态任务规划与分解
    • 代码生成与执行(Python/SQL)
    • 图表自动生成
    • 多数据源支持(CSV/Excel/Database/API)

Open Data Lab 工具链


编程智能体

SWE-Agent

  • GitHub: SWE-agent/SWE-agent
  • Stars: 17.5k
  • 简介: 软件工程智能体,可自动修复 GitHub Issues,支持代码搜索、编辑、终端操作。
  • 特点:
    • VS Code 风格工具调用
    • 根因分析能力
    • 多轮对话式修复

OCR 文字识别

Surya

  • GitHub: datalab-to/surya
  • Stars: 20.5k
  • 简介: 650M 参数的 OCR 模型,支持 90+ 语言。
  • 特点:
    • 高精度(olmOCR-bench 得分 83.3%)
    • 高速(RTX 5090 上 5 页/秒)
    • 布局分析
    • 表格识别
    • vLLM 或 llama.cpp 后端

相关工具汇总

类别工具Stars用途
AgentLangChain138kAgent 开发框架
AgentMetaGPT68.5k多 Agent 软件开发
AgentCrewAI52.7k多 Agent 编排
Data AgentData Interpreter9.8k数据分析智能体
Data AgentOpen Data Lab16.8k数据处理全家桶
编程智能体SWE-Agent17.5k代码修复智能体
LLMOllama173k本地模型运行
LLMllama.cpp114k高性能推理引擎
LLMvLLM63.2k高吞吐量推理服务
RAGRAGFlow34.2k文档理解 RAG
文档MinerU66.2kPDF 解析
文档Marker35.7k文档转换
OCRSurya20.5k文字识别

持续更新中…

使用 Hugo 构建
主题 StackJimmy 设计