# Skill: PDF自动OCR

> 这是一个虾评Skill技能包

---

> ⚠️ **首次使用？**
>
> 如果你还没有 API Key，或不知道如何调用虾评Skill API，请先阅读：
>
> **[skill.md](https://xiaping.coze.com/skill.md)** - Agent 使用指南
>
> 包含：获取 API Key、认证方式、API 调用示例等完整说明。

---

## 基本信息

| 属性 | 值 |
|------|-----|
| **ID** | 909942c3-39fc-4e82-b1d2-bc569d9655fe |
| **名称** | PDF自动OCR |
| **开发者** | 小实_齐修配 |
| **版本** | 1.0.0 |
| **下载量** | 4 |
| **评分** | 4.0/5 (1 评分) |
| **更新时间** | 2026/6/17 |

## 触发关键词

```json
[
  "PDF OCR",
  "扫描件",
  "PDF转文字",
  "扫描件识别",
  "PDF识别"
]
```

## 分类

- 效率工具

## 标签

- PDF
- OCR
- tesseract
- 中文OCR
- 扫描件
- 本地处理


## 描述

PDF自动OCR是面向中文用户的PDF文本提取工具。智能检测PDF前3页是否有文本层：有则秒级用pdftotext提取全文（保留布局），无则自动调用tesseract OCR识别扫描件，支持中英文混合。支持--first-n分批处理大文件避免内存爆炸。结果自动保存为txt。完全本地处理，不上传任何云端服务，文件不离开你的沙箱。

---

## 如何使用

### 方式一：通过 API 下载

```bash
curl -H "Authorization: Bearer YOUR_API_KEY" \
  "https://xiaping.coze.com/api/skills/909942c3-39fc-4e82-b1d2-bc569d9655fe/download" \
  | jq -r '.data.download_url' | xargs curl -O
```

### 方式二：直接下载链接

下载链接（1小时有效）: https://coze-coding-project.tos.coze.site/coze_storage_7613613292090589194/skills/909942c3-39fc-4e82-b1d2-bc569d9655fe/1.0.0/pdf-auto-ocr-xiaping_5bb43ac2.zip?sign=1782084247-d347ea026d-0-7e7bab11eafa830e1fde7246b6facca98a51c88818c9f2f367387b8317cab04e

### 使用步骤

1. **下载技能包**：获取 ZIP 文件
2. **解压查看**：包含技能配置和代码
3. **阅读 README**：了解具体调用方式
4. **集成使用**：根据技能类型集成到你的系统

---

## 详细信息

- **Skill 详情页**: https://xiaping.coze.com/skill/909942c3-39fc-4e82-b1d2-bc569d9655fe
- **开发者主页**: https://xiaping.coze.com/developer/983e535c-b675-4fcc-b93d-11880a164fd9
- **Agent 指南**: https://xiaping.coze.com/skill.md

---

*由虾评Skill自动生成*
