|
|
@@ -0,0 +1,84 @@
|
|
|
+# 合同信息提取系统
|
|
|
+
|
|
|
+[](https://www.python.org/downloads/)
|
|
|
+[](https://opensource.org/licenses/MIT)
|
|
|
+
|
|
|
+基于大语言模型的智能合同信息提取系统,自动从工程项目文档中提取结构化信息。
|
|
|
+
|
|
|
+## 快速开始
|
|
|
+
|
|
|
+### 1. 环境要求
|
|
|
+
|
|
|
+- **Python 3.8+**(需自行安装)
|
|
|
+- pip 包管理器
|
|
|
+
|
|
|
+### 2. 安装依赖
|
|
|
+
|
|
|
+```bash
|
|
|
+pip install -r requirements.txt
|
|
|
+```
|
|
|
+
|
|
|
+### 3. 配置
|
|
|
+
|
|
|
+编辑 `jk_min_rag_dome.py`,配置 LLM API 密钥和数据文件路径:
|
|
|
+
|
|
|
+```python
|
|
|
+self.api_key = "your-api-key"
|
|
|
+self.base_url = "https://api.deepseek.com"
|
|
|
+self.model = "deepseek-chat"
|
|
|
+```
|
|
|
+
|
|
|
+### 4. 运行
|
|
|
+
|
|
|
+```bash
|
|
|
+python jk_min_rag_dome.py
|
|
|
+```
|
|
|
+
|
|
|
+### 5. 使用
|
|
|
+
|
|
|
+1. 将项目文件夹放入 `input_dir/` 目录
|
|
|
+2. 系统自动处理并输出结果到 `output_dir/`
|
|
|
+
|
|
|
+## 目录结构
|
|
|
+
|
|
|
+```
|
|
|
+jk-ik/
|
|
|
+├── input_dir/ # 输入目录(放置待处理项目)
|
|
|
+│ └── 示例项目/
|
|
|
+│ └── 示例项目/
|
|
|
+│ └── 合同文档.txt
|
|
|
+├── output_dir/ # 输出目录(处理结果)
|
|
|
+├── data/ # 模拟数据目录
|
|
|
+├── docs/ # 文档目录
|
|
|
+│ └── README.md # 详细使用文档
|
|
|
+├── jk_min_rag_dome.py # 主程序
|
|
|
+├── requirements.txt # 依赖列表
|
|
|
+└── README.md # 本文件
|
|
|
+```
|
|
|
+
|
|
|
+## 核心功能
|
|
|
+
|
|
|
+- 🤖 AI 驱动的信息提取
|
|
|
+- 📁 批量处理项目文件夹
|
|
|
+- 🔍 项目名称模糊匹配
|
|
|
+- 📊 结构化 JSON 输出
|
|
|
+- 🔄 自动目录监控
|
|
|
+- 📦 支持 ZIP/7Z/RAR 解压
|
|
|
+
|
|
|
+## 支持的文件格式
|
|
|
+
|
|
|
+| 格式 | 扩展名 | 说明 |
|
|
|
+|------|--------|------|
|
|
|
+| Word | .docx | 原生支持 |
|
|
|
+| Word | .doc | 需要 antiword |
|
|
|
+| Excel | .xlsx, .xls | 原生支持 |
|
|
|
+| 文本 | .txt | 原生支持 |
|
|
|
+| 压缩 | .zip, .7z, .rar | 自动解压 |
|
|
|
+
|
|
|
+## 详细文档
|
|
|
+
|
|
|
+查看 [docs/README.md](docs/README.md) 获取完整的使用说明。
|
|
|
+
|
|
|
+## 许可证
|
|
|
+
|
|
|
+MIT License
|