Press This:数据导出指南

 内容管家 2026年2月22日 2 0

欢迎收听 Press This 这是来自 WMR 的 WordPress 社区播客。每一期节目都会邀请来自社区各界的嘉宾,讨论 WordPress 开发者面临的最大议题。以下是原始录音的文字转录。 — 您正在收听 Press This,…

欢迎收听 Press This

这是来自 WMR 的 WordPress 社区播客。每一期节目都会邀请来自社区各界的嘉宾,讨论 WordPress 开发者面临的最大议题。以下是原始录音的文字转录。

您正在收听 Press This,这是一个来自 WMR 的 WordPress 社区播客。每周我们都会 spotlight WordPress 社区的成员。

我是你们的主持人 Doc Pop。我通过在 [某公司] 的职位以及在 [某网站] 上的贡献来支持 WordPress 社区。您可以在 [某平台] 订阅 Press This,或者使用您喜欢的播客应用。您也可以直接从 [某网址] 下载每一期节目。

现在,必须告诉你们,我对今天的主题感到非常兴奋:数据可移植性。我从 2004 年左右就开始写博客了。当时,如果想把内容从 MSN Spaces 迁移到 Blogger,几乎只能手动复制粘贴每一篇文章、每一个标题,以及每一张配图,只能这样做。

幸运的是,当时我只有大约十二篇文章,所以没花多长时间。但在 2006 年,当我将网站从 Blogger 迁移到 WordPress 时,我对事情变得如此简便感到震惊。Blogger 有一个导出功能,而当时我使用的 WordPress 主机 LaughingSquid 有一个“从 Blogger 导入”的功能。

迁移过程非常轻松、顺畅,我确实认为这是理所当然的。我只是想:“事情就是这样了。我应该能够把东西从一个地方搬到另一个地方。”然而显然,情况并非如此。

随着岁月流逝,从内容中导出并迁移到其他地方变得越来越困难。例如,你根本不会想到把帖子从 Facebook 迁移到埃隆·马斯克的 X,反之亦然。但如今,从一个 CMS 迁移到另一个 CMS 也可能遇到一些麻烦。这就是数据解放项目(Data Liberation project),由马特·穆伦维格在 2023 年的 WordPress 年度回顾(State of the Word)上宣布。

这个开源项目旨在打破内容迁移的障碍,让您能够更轻松、更顺畅地将宝贵的内容从一个平台迁移到另一个平台。今天加入我们的是 Jordan Gillman,他是 [某公司] 的 Happiness Engineer,也是这个开创性项目的负责人。

Jordan,你今天怎么样?

我很好。Doc,你怎么样?

我也非常好。就在节目开始前,我问过你这个问题,我只是想——我想炫耀一下:这是你第一次接受关于数据解放项目的采访,对吧?

是的。我做过一次书面采访,但这绝对是我的第一次播客采访,希望以后会有更多关于数据解放项目的采访,我对此非常兴奋。

我也很兴奋。这是目前有很多令人着迷的技术的事情之一。很有趣的是,在 2023 年的 WordPress 年度回顾上,这是最让我兴奋的事情。我对此最为兴奋。那么你不妨给我们讲讲数据解放项目,你的目标是什么,还有这个项目的历史?

好的,当然。你说得对。Matt 是在去年年底的 WordPress 年度回顾上宣布了这个项目。数据解放项目本质上是一个由社区发起、为社区服务、为开放网络服务的社区项目。设想一个可以一键迁移内容的时代,将内容导入 WordPress 或从 WordPress 导出。

最终,我们的使命是让出版民主化,真正就内容而言,这意味着拥有将内容从任何地方自由迁移到 WordPress 的力量。自由地将 WordPress 网站迁移到另一个主机,且麻烦最少,但也能够以任何您想要使用的格式将内容从 WordPress 导出。

我对其在将人们的内容从封闭花园中解放出来的潜力感到兴奋。

正如你提到的,这不仅仅是关于从一个平台导入 WordPress。这不仅仅是关于 Squarespace 到 WordPress 的导入器。这甚至是试图解锁从 WordPress 的迁移。我们不是在试图把人锁定在任何东西里,对吧?

我认为完全是这样。我的意思是,虽然我们想让所有人使用 WordPress——这显然是该项目的一个巨大目标——但我们不想以糟糕的方式做到这一点。我们不想把人锁定进来。我们不想把他们从某个地方解放出来,却让他们感觉被我们锁定了。

所以我认为这是这次对话的重要部分,也是这个项目的重要部分,即讨论从 WordPress 导出的内容自由是什么样的。

如果我们访问 wordpress.org,在 wordpress.org/data-liberation 上,我们会找到很多指南。

而这感觉就像是数据解放项目目前的现状。可能是——我可能说得不对——但看起来不是说“这里是工具”,而更像是“嘿,这里有一些指南。如果你想从 RSS 迁移到 WordPress,或者从 Wix 迁移到 WordPress,或者从 Drupal 迁移到 WordPress,或者从 WordPress 迁移到 WordPress,这里有一些写得很好的指南。”这是否是项目目前的现状?

这是目前面向用户的部分,确实如此。其中很多发生在 WordPress 年度回顾前后,当时很多人在考虑“让我们看看我们有什么现有资源”,所以很多指南来自 wordpress.org 的支持文档,还有很多工具在另一个部分,是人们链接到的现有工具。所以在那个阶段,确实是让我们整合我们拥有的信息资源作为起点。

我希望这些指南将继续非常有用,即使我们看到更多工具被引入。因为目前迁移到 WordPress 的本质是:即使我们有导入器,而且有一系列可用的核心导入器。其中许多仍然需要用户做一些工作。

比如,我们有从 Squarespace 导出内容的指南,它会给你一个 WordPress 导入文件。或者我们有用 RSS 的指南。有些网站会给你一个 RSS 记录,你可以下载,然后用 RSS 导入器导入它。

目前有一些解决方案,部分是手动工作,然后一部分是工具来完成工作,这些指南正是为此目的的。我们希望进一步扩展它们,但最终,在项目结束时,我希望看到这些指南以某种方式集成到工具中,如果用户需要任何手动步骤,我们会实时引导他们完成。

核心要点

这就是我想了解的。从长远来看,数据解放项目的目标是创建一个工具,还是创建某种每个人都遵循的标准化数据结构?

或者……我不知道,就像目前一样,一切都太不同了,你只是在分享工具和资源,而这只是一个学习如何做到这一点的不错的中心。

长期目标是什么?对于这个项目来说。

这是一个非常好的问题,最终我希望整个社区能够帮助推动它最终会是什么样子。

已经有一些想法被提出。我们有一个 GitHub 仓库,目前工作和讨论正在那里进行。

其中一个提案围绕一个插件的想法展开,比如一个通用的导入插件,你可以安装在你的网站上。你会给出源 URL,它会检测你现有网站的类型、平台,然后引导你完成可能需要的步骤。

所以它可能会向你展示指南,然后引导你安装你需要使用的插件,以便使用你能够导出的任何内容。我想,这是一个符合现有 WordPress 插件和导入范例的想法。我们只是在给它一个整洁的界面来整理它。

还有另一个提案更进了一步,想象在 WordPress.org 本身上有一个托管服务,迁移将在后台无缝发生,你会提供你现有网站的 URL。它会检测你使用的是什么平台,然后无论需要什么方式来获取内容,它都会为你获取内容,并在几分钟内为你创建一个新的 playground 网站,这样理想情况下只需一次点击,你就可以在 WordPress 安装中获得一个包含你内容的 playground 网站。一旦进入 playground,我们就有选项来决定你可能希望以什么格式导出或迁移 WordPress 内容,以便你随意使用。

这两个提案都非常有趣。它们可能是同一类想法的不同阶段。但我想回答你问题的第二部分:最终目标是什么?我真的不认为这是我的职责来决定。这就是为什么我认为自己是这个项目的负责人。

我们目前所处的阶段真的只是促进社区之间的讨论。我们希望看到头脑风暴,我们希望看到想法,然后我们希望看到人们挑战这些想法,共同提出实际的工作可能是什么样子,以及我们的实际最终目标可能是什么。

而且我认为这部分不仅仅是创建资源和创建工具。我想这部分还有一些政治因素,我们在试图指出那些不允许导出的服务。我觉得 Squarespace 确实有导出选项。所以如果你在 Squarespace,作为消费者你没有被锁定,你可以导出到 WordPress。

另一方面,Wix 没有导出功能,我觉得其中部分原因可能是试图让人们加入这个项目。当你获得那些数据后,你就能更容易地说:“Wix,其他人都这样做。你们为什么不允许消费者从你们的平台迁移出去?”

是的,我的意思是,这不是当前的目标,使其成为政治或社会声明什么的。这真的是关于赋予 WordPress 用户权力作为第一步。然而,我不能否认,我可以想象,WordPress 内部的一个成功的数据解放项目确实开始提出这些问题。

是的,如果我们的——再次强调——如果我们的使命是让网络民主化,那么也许这些是很好的对话。但我应该说,这不是该项目的目标,不是开始那些更大、更广泛的对话,也不是游说和施压其他组织必须参与其中。

不过很有趣的是,当你看到 RSS 如何在这么多项目中拯救一天,这是件很棒的事情。如果它们目前不支持任何迁移、数据可移植性,还有 RSS 提要,这是每个人仍在使用的开源东西,感谢上帝。

所以,最坏的情况是——在这些项目中看起来最坏的情况是,“嘿,至少你还有你的 RSS,你可能仍然需要构建一个前端,但我至少会有所有元数据、博客文章、标题和图片,以及图片中的 alt 文本。”

所有这些内容应该有望被 RSS 抓取,而且迁移起来非常容易——这是一种非常容易从一个地方迁移到另一个地方的格式,对吧?

确实如此。实际上,我脑海里正在构建的——作为我角色的一部分——是列出目前各种平台的迁移状态,以及我们将其集成到 WordPress 的潜力,我们会看到一些平台有——我们有了 API 访问。所以通过适当的开发,我们实际上可能能够进行 API 调用,并以非常相似的格式获取内容。

或者我们可能有像 Squarespace 目前这样的服务,允许你导出内容。然后我们会导入那个 XML 文件,你会得到内容,但你会失去一些保真度。

然后我们有 RSS,当然你仍然可以获取你的内容,但你不会拉取布局。你可能会遇到一些媒体可能无法传输的问题。所以我认为会有不同程度的保真度或显示对等,我们可能能够迁移这些东西。

对我个人来说,这是我一直在思考数据解放项目的原因之一,这就是内容可移植性。所以,在 Squarespace 上,我的网站的完整迁移看起来是这样的。在 WordPress 上,我的网站看起来是这样的,这是一个值得尊敬的目标,但这是一个很大的目标。

我认为我们绝对可以做到的是——这也是开放网络方面的——我们绝对可以说,“好吧,你创建了这个内容,你应该拥有它,带它去哪里,它可能看起来不完全一样,但它们是你的文字,你的图片。是你的视频,你的音频,你可以带走它。”

我们稍作休息,回来后将继续与 Jordan Gillman 讨论数据可移植性。请锁定收听,广告后更精彩。

欢迎回到 Press This。今天,我们与 Jordan Gillman 讨论数据可移植性,他是 Automattic 的 Happiness Engineer,也是数据解放项目的负责人。

Jordan,在休息之前,你谈到我们可以迁移的不同地方,以及我们目前有一个资源中心来学习如何从一个地方迁移到另一个地方。

其中一部分——数据解放的一部分——不仅仅是让导入 WordPress 更容易,甚至是让 WordPress 更容易迁移到其他平台,包括一个有点令人惊讶的事情:WordPress 到 WordPress。有些人在从 WordPress 迁移时遇到挑战——从一个 WordPress 主机迁移到另一个。

你能谈谈这个吗?也许你们到目前为止对这个过程有什么想法?

是的,当然,我很乐意。这在我的脑海里非常新鲜。我有幸在一周前参加了 WordCamp Asia,我在赞助商区域花了很多时间与那里的主机商讨论他们面临的迁移挑战,因为对于现在的许多网络主机来说,他们为网站提供免费迁移,这是他们为用户入职的重要组成部分。

其中最大的问题是,在很多方面,WordPress 原生使用的 WXR 支持格式的缺点。它为我们服务得非常好。它做得非常好。但不可否认的是,在全站迁移方面它存在不足。

过滤方面存在挑战

声明:1、本站大部分资源均为网络采集所得,仅供用来学习研究,请于下载后的24h内自行删除,正式商用请购买正版。2、所有汉化类文件和个别标注了“原创”的产品均为本站原创发布,任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。3、如若本站内容侵犯了原著者的合法权益,请携带相关版权文件联系我们进行下架或删除。4、虚拟下载类资源具有可复制性,一经下载后本站有权拒绝退款或更换其他商品!

 标签:WordPress

内容管家

基于 AI 自动化工作流的发文助手~ 由 Actions Bridge 插件驱动

文章 评论 浏览 点赞

作者主页

留下第一个评论