资料来源与处理状态
当前本地资料
| 文件 |
格式 |
用途 |
状态 |
| 货币金融学第 11 版 |
PDF 扫描版 |
与当前学习章节结构对齐、页码校对 |
可 OCR,但批量较慢 |
| 第 11 版笔记和习题详解 |
PDF 扫描版 |
习题、考点、答案思路补充 |
待 OCR |
| 货币金融学原书第 2 版 |
EPUB |
正文知识整理主来源 |
已成功抽取文本 |
| 货币金融学原书第 2 版 |
MOBI |
EPUB 备用来源 |
已探测,可修复乱码,但清洗成本高 |
已生成的中间材料
epub_output/mishkin_2e.md:完整 EPUB 文本抽取结果,约 9758 行。
epub_output/chapters/ch01_2e.md:第 1 章正文,约 299 行。
epub_output/chapters/ch04_2e.md:第 4 章正文,约 347 行。
ocr_output/toc_sample.md:第 11 版目录 OCR 样本。
mobi_output/probe.txt:MOBI 记录探测结果,确认内容可读但存在编码和控制字符清洗问题。
使用原则
- 第 11 版作为当前网站目录和学习顺序依据。
- 第 2 版 EPUB 作为正文知识整理的主要来源,因为它可直接抽取文本。
- 第 2 版 MOBI 与 EPUB 内容基本一致,作为备用校验来源;除非 EPUB 缺页,否则不优先使用。
- 对两个版本章节差异进行人工映射,避免把第 2 版中后期章节编号错误套到第 11 版。
- 网站只展示学习讲解、摘要、考点、练习和案例,不整章复制教材正文。
下一步
- 按第 11 版目录建立章节映射表。
- 用第 2 版 EPUB 批量生成正文学习页。
- 用第 11 版 OCR 校对新增章节、章节顺序和术语变化。
- 用新闻和数据源补充应用案例。