什么是 MinerU?

MinerU 是一个强大的文档解析工具,可以把复杂的 PDF、Word 文档转换成 AI 能够理解的格式

想象一下,你有一份包含图表、表格、公式的复杂 PDF 文档,传统的工具只能提取文字,但图片内容就丢失了。MinerU 就是为了解决这个问题而生的!

它可以:

  • 📄 智能识别文档结构:准确分离标题、段落、表格、图片
  • 🖼️ 保留图片信息:将文档中的图片单独提取并保存
  • 📝 转换为标准格式:输出清晰的 Markdown 格式,方便 AI 处理
  • 🌐 支持多种文档:PDF、网页、电子书等都能处理

为什么需要 MinerU?

传统方式的问题

只能提取纯文字,图表、图片等重要信息会丢失,影响 AI 回答质量

MinerU 的优势

完整保留文档中的所有信息,包括图片,让 AI 回答更准确、更全面

应用场景

实际效果展示

下图展示了 MinerU 处理复杂文档后的效果:

通过 MinerU 处理后,文档中的图片会被单独保存,文字内容会被结构化提取,最终在 RAG 系统中能够同时展示文字和图片内容

如何在 PIG AI 中启用 MinerU?

1

获取 API Key

访问 MinerU 官网 申请免费的 API Key

MinerU 目前提供免费服务,同时也支持私有化部署

2

配置系统参数

在系统配置文件中添加以下配置:

pig:
  ai:
    mineru:
      enabled: true
      api-key: your-mineru-api-key  # 在这里填入你申请的 API Key
3

重启服务

保存配置后重启 PIG AI 服务,即可开始使用 MinerU 增强的文档处理功能

使用效果对比

  • ❌ 只能提取纯文字内容
  • ❌ 图片、图表信息丢失
  • ❌ AI 回答不够全面

启用 MinerU 后,文档处理时间可能会稍有增加,但获得的信息完整性和准确性将大幅提升

总结

MinerU 为 PIG AI 的文档处理能力带来了质的飞跃,特别是在处理包含图片、图表的复杂文档时。通过简单的配置,就能让您的 AI 助手”看懂”文档中的所有内容,提供更智能、更准确的服务。