Без опису

ryuiso b00e0e7400 上传文件至 '' 5 днів тому
README.md b00e0e7400 上传文件至 '' 5 днів тому
jk_min_rag_dome.py 1ce4eb3f84 ik文档提取工具 1 місяць тому
requirements.txt b00e0e7400 上传文件至 '' 5 днів тому

README.md

合同信息提取系统

基于大语言模型的智能合同信息提取系统,自动从工程项目文档中提取结构化信息。

快速开始

1. 环境要求

  • Python 3.8+(需自行安装)
  • pip 包管理器

2. 安装依赖

pip install -r requirements.txt

3. 配置

编辑 jk_min_rag_dome.py,配置 LLM API 密钥和数据文件路径:

self.api_key = "your-api-key"
self.base_url = "https://api.deepseek.com"
self.model = "deepseek-chat"

4. 运行

python jk_min_rag_dome.py

5. 使用

  1. 将项目文件夹放入 input_dir/ 目录
  2. 系统自动处理并输出结果到 output_dir/

目录结构

jk-ik/
├── input_dir/           # 输入目录(放置待处理项目)
│   └── 示例项目/
│       └── 示例项目/
│           └── 合同文档.txt
├── output_dir/          # 输出目录(处理结果)
├── data/                # 模拟数据目录
├── docs/                # 文档目录
│   └── README.md        # 详细使用文档
├── jk_min_rag_dome.py   # 主程序
├── requirements.txt     # 依赖列表
└── README.md            # 本文件

核心功能

  • 🤖 AI 驱动的信息提取
  • 📁 批量处理项目文件夹
  • 🔍 项目名称模糊匹配
  • 📊 结构化 JSON 输出
  • 🔄 自动目录监控
  • 📦 支持 ZIP/7Z/RAR 解压

支持的文件格式

格式 扩展名 说明
Word .docx 原生支持
Word .doc 需要 antiword
Excel .xlsx, .xls 原生支持
文本 .txt 原生支持
压缩 .zip, .7z, .rar 自动解压

详细文档

查看 docs/README.md 获取完整的使用说明。

许可证

MIT License