跳转至

资料来源与处理状态

当前本地资料

文件 格式 用途 状态
货币金融学第 11 版 PDF 扫描版 与当前学习章节结构对齐、页码校对 可 OCR,但批量较慢
第 11 版笔记和习题详解 PDF 扫描版 习题、考点、答案思路补充 待 OCR
货币金融学原书第 2 版 EPUB 正文知识整理主来源 已成功抽取文本
货币金融学原书第 2 版 MOBI EPUB 备用来源 已探测,可修复乱码,但清洗成本高

已生成的中间材料

  • epub_output/mishkin_2e.md:完整 EPUB 文本抽取结果,约 9758 行。
  • epub_output/chapters/ch01_2e.md:第 1 章正文,约 299 行。
  • epub_output/chapters/ch04_2e.md:第 4 章正文,约 347 行。
  • ocr_output/toc_sample.md:第 11 版目录 OCR 样本。
  • mobi_output/probe.txt:MOBI 记录探测结果,确认内容可读但存在编码和控制字符清洗问题。

使用原则

  • 第 11 版作为当前网站目录和学习顺序依据。
  • 第 2 版 EPUB 作为正文知识整理的主要来源,因为它可直接抽取文本。
  • 第 2 版 MOBI 与 EPUB 内容基本一致,作为备用校验来源;除非 EPUB 缺页,否则不优先使用。
  • 对两个版本章节差异进行人工映射,避免把第 2 版中后期章节编号错误套到第 11 版。
  • 网站只展示学习讲解、摘要、考点、练习和案例,不整章复制教材正文。

下一步

  1. 按第 11 版目录建立章节映射表。
  2. 用第 2 版 EPUB 批量生成正文学习页。
  3. 用第 11 版 OCR 校对新增章节、章节顺序和术语变化。
  4. 用新闻和数据源补充应用案例。