语雀文档采集小方法

找了很多方法,游览器插件、油猴脚本、采集软件等等,一顿操作下来,并没有好用的,甚至要收费。在 github 找到一个 yuque-dl 项目,测试了下,发现非常好用,可以将语雀文档包括图片全部能下载下来,文档保存的是 markdown 格式。
以下是具体操作步骤(看上去很复杂,实际上很简单):

1. 安装 Node.js

Node.js 是一个开源的、跨平台的 JavaScript 运行环境,用于在服务器端运行 JavaScript 代码。以下是安装步骤:

步骤 1:下载 Node.js

  1. 访问 Node.js 官方网站
  2. 在首页上,你会看到两个版本:LTS(长期支持版)Current(最新版)。对于大多数用户,建议安装 LTS 版本 ,因为它更稳定。
  3. 点击下载按钮,选择适合 Windows 的安装包(通常是 .msi 文件)。

步骤 2:安装 Node.js

  1. 下载完成后,双击 .msi 文件开始安装。
  2. 在安装向导中,接受许可协议,然后选择安装路径(建议使用默认路径)。
  3. 勾选“Add to PATH”选项,这样可以在命令行中直接使用 Node.js。
  4. 点击“Next”并完成安装。

步骤 3:验证安装

安装完成后,打开命令提示符(CMD)或 PowerShell,输入以下命令:

node -v
npm -v

如果安装成功,你会看到 Node.js 和 npm(Node.js 的包管理器)的版本号。

2. 安装 yuque-dl 工具

yuque-dl 是一个基于 Node.js 的工具,用于下载语雀知识库的内容。以下是安装和使用步骤:

步骤 1:安装 yuque-dl

在命令提示符或 PowerShell 中,运行以下命令:

npm install -g yuque-dl
  • -g 表示全局安装,这样可以在任何目录下使用 yuque-dl 命令。

这一步我遇到一些问题,镜像切换到华为云就行了,每个人的情况可能不同,如果有问题,可以问 AI,deepseek、kimi 都很好用。如果 deepseek 速度慢或者无响应,推荐使用硅基流动 (→ 硅基流动官网),这里同样可以免费使用 deepseek,当然也可以选其他多种 AI 模型。
接下来,你大概率会看到版本低的问题,不用管,不影响后面运行。

步骤 2:检查安装

安装完成后,运行以下命令检查是否安装成功:

yuque-dl --help

如果安装成功,你会看到 yuque-dl 的帮助信息。

3. 使用 yuque-dl 下载语雀知识库

以下是使用 yuque-dl 的基本步骤:

步骤 1:获取语雀知识库的 URL

你需要一个语雀知识库的 URL,例如:

https://www.yuque.com/yuque/thyzgp

步骤 2:运行 yuque-dl

在命令提示符或 PowerShell 中,运行以下命令:

yuque-dl "https://www.yuque.com/yuque/thyzgp"
  • 如果是私有知识库,需要提供 token:
    yuque-dl "https://www.yuque.com/yuque/thyzgp" -t "your_token_value"
  • 如果是企业私有服务,还需要指定 token 的 key:
    yuque-dl "https://www.yuque.com/yuque/thyzgp" -k "your_token_key" -t "your_token_value"

步骤 3:查看下载结果

默认情况下,下载的内容会保存在当前目录下的 download 文件夹中。你可以指定其他目录:

yuque-dl "https://www.yuque.com/yuque/thyzgp" -d "C:\MyDownloads\Yuque"

4. 启动内置 Web 服务预览下载内容

yuque-dl 提供了一个内置的 Web 服务,用于快速预览下载的内容。运行以下命令:

yuque-dl server ./download/ 知识库 /
  • 打开浏览器,访问 http://localhost:5173/,即可查看下载的知识库内容。

注意事项

  1. Node.js 版本要求 :根据 yuque-dl 的文档,需要 Node.js 18.4 或更高版本。如果安装的版本较低,可能会出现兼容性问题。
  2. Token 获取 :如果需要访问私有知识库或企业服务,需要从浏览器的开发者工具中获取 cookie 的值。
  3. 网络问题 :如果下载过程中出现网络问题,可以重新运行命令,已下载的内容会继续下载,不会重复下载。

通过以上步骤,你可以在 Windows 11 上成功安装 Node.js 并使用 yuque-dl 工具下载语雀知识库的内容。

本文多数文字通过 AI 生成。

正文完
 0
队长
版权声明:本站原创文章,由 队长 于2025-02-10发表,共计1805字。
转载说明:欢迎分享本站内容!请遵守CC BY 4.0协议要求,转载时保留作者署名并附上原文链接。
评论(没有评论)