独立开博,在Hostmonster上用Wordpress上搭建完自个的空间,第一件事就是把以前发布在Windows Live Space上的博客导进来。其中,下载WindowsLiveSpace的全部文章和评论所用的Python脚本,来自Broom,剩下的一些优化工作,比如删除垃圾评论,用了一些简单的SQL脚本。从WindowsLiveSpace搬家,向来最为麻烦,以下把刚做的功课记下来,鼓励大伙及时退出WindowsLiveSpace。我06年开博,至今在WindowsLiveSpace上积攒下近六百篇博文,所谓积重难返路径依赖,这次全部顺畅导出,兀的不高兴死我也么哥。

对不熟悉Python的朋友来说,以下的内容也一样没有没有障碍:只需要按着相应的步骤,复制粘贴再回车即可。这是我的生活博客,里面所有涉及所谓技术的内容,也是中文系高材生Li也能看懂的。

1.准备工作

1.1. 设置Windows Live Space和Wordpress的日期格式

重要的是让WindowsLiveSpace和Wordpress的日期格式一致,这里我两个设置的是2009/03/30。在WindowsLiveSpace中,我的时间格式是10:24:05,设置的路径是“选项”->“常规”->“日期和时间格式”:

space_date

另外,在“选项”->“日志”->“显示日志日期”选项中,勾选“在页首出显示日志发布日期”。在Wordpress中,相应的路径是“设置”->“常规”->”日期格式”。

1.2.下载安装Python 2.5.2

Broom测试了两种组合,Python 2.5.2+Beautiful Soup 3.0.6和Python 2.5.1+Beautiful Soup 3.0.4。但后面的低版本组合需要打些补丁,我们就不必麻烦了,我是直接用的高版本。Python 2.5.2的官方下载地址在:

http://www.python.org/download/releases/2.5.2/

我用的是Windows平台,选择的是X86 processors python-2.5.2.msi。下载完毕,一路安装过去就是,不妨依着它默认的安装路径c:Python25。接下来看看Python好不好使:

开始->运行->在冒出来的框里输入 cmd 回车->在冒出来的命令行输入 python 再回车

顺利的话,你将看到类似的回应:

cmd

如果提示说python不可识别,就需要为Python设置环境变量,如果不明白什么是“环境变量”,依着下面的操作就是。

“我的电脑”->右键“属性”->“高级”->“环境变量”->“系统变量”->点中一个叫Path的系统变量->“编辑”->在Path的变量值框的末尾,加上一个分号;(英文状态下),然后跟着是填上Python的安装目录,比如c:Python25。一路确定后,再回刚才的命令行试试python这个命令。

path

1.3.下载Beautiful Soup 3.0.6

Beautiful Soup 3.0.6是一个解析HTML页面的类库,接下来那个下载博客文章的脚本需要用它。下载地址:

http://www.crummy.com/software/BeautifulSoup/download/3.x/BeautifulSoup-3.0.6.tar.gz

解压到一个文件夹,比如D:downloadBeautifulSoup-3.0.6。你将看到BeautifulSoup.py等几个脚本。

1.4.下载脚本Live-space-mover

Live-space-mover这个脚本,能够把WindowsLiveSpace中的所有文章和评论等,生成一个Wordpress能够识别的XML文件,以实现博客搬家的目的。下载地址:

http://code.google.com/p/live-space-mover/downloads/list

现在的最新版本是live-space-mover.1.7.5.zip。解压到D:downloadBeautifulSoup-3.0.6。在D:downloadBeautifulSoup-3.0.6目录下,你应该看到脚本live-space-mover.py。

2.运行脚本,下载博客,生成XML文件

在刚才提到过的cmd命令行,转到D:downloadBeautifulSoup-3.0.6文件夹(先敲入d: 回车,然后敲入 cd D:downloadBeautifulSoup-3.0.6 回车),敲入下面的一行语句并回车:

python live-space-mover.py -s http://yourSpaceName.spaces.live.com/ -t “%m/%d/%Y %I:%M:%S %p”

其中,yourSpaceName是你Windows Live Space的名字。

Space-mover

这个运行时间视你博客文章的多少而定,如果在屏幕上看到博客标题显示为乱码,不必在意。成功之后,在D:downloadBeautifulSoup-3.0.6文件夹,将生成一个类似export_03292009-2238.xml的文件,这就是你整个Space的文章、评论以及类别之类的了。

又,如果在准备工作1.1中,你Windows Live Space的时间格式是10:24而不是10:24:05,那么,以上命令就将更简洁些:

python live-space-mover.py -s http://yourSpaceName.spaces.live.com/

3.把XML文件导入到Wordpress

这个就相对简单了。Wordpress后台->“工具”->“导入”->选择WordPress,上传那个export_03292009-2238.xml文件,再指定一个作者就行。这个速度就快多了。

一个问题是,系统只允许导入最大为2MB的文件,对超过2MB的文件(像我这次导入的近六百篇博文),只好手动分割文件或想其他办法了。如果一次导入不漂亮,可以把所有的文章及评论先删除了再试试,两个简单的SQL语句可以参考:

DELETE from wp_posts WHERE post_author=1;

DELETE from wp_comments WHERE comment_ID>1;

作者ID(post_author)和评论ID(comment_ID)你可以在phpMyAdmin中找到。

python_space_over

待看到“导入完毕。好好享受吧!”,心情当真是无比舒畅,按着赖哥哥宁的说法,是比大热天吃了冰水还舒服。

4.一些优化工作

对全盘导入的博文,难免泥沙俱下,以前大量垃圾评论也跟着过来了。垃圾评论的一个特点是姓名为空(“没有名称”或者No name),下面的SQL语句就可以把它们清除:

DELETE FROM wp_comments WHERE CONVERT(`wp_comments`.`comment_author` USING utf8) = ‘(没有名称)nwrote:’ ;
DELETE FROM `wp_comments` WHERE CONVERT(`wp_comments`.`comment_author` USING utf8) = ‘No name’ ;

—-by Jiang<at>li-and-jiang.com——-

  • 暂无相关日志

Tags: , , , ,

35 Responses to “博客搬家:从Windows Live Space到Wordpress(图解)”

  1. 蓝水 说:

    搬家成功。但是space上面的评论却没有成功转移,请问您有办法么?谢谢先~~

  2. Lin 说:

    站长,谢谢你。

    今天是2010年7月7日,我使用的版本是Python 2.5.2+Beautiful Soup 3.0.6+live-space-mover.1.7.6
    并且,参考 http://b2.broom9.com/?page_id=519,设置Windows Live Spaces使用英文语言,日期时间格式同Broom的设置。

  3. 名扬 说:

    原来是这样啊,谢谢分享。

  4. [...]      本来,博客搬家这想法很早就有过,本着狡兔三窟的原则,  从最早也是最持久的Windows Live Spaces在到新浪,百度hi上开博,由于本人懒惰成性,加上平时瞎忙,偷个空还想玩,于是“院子开了不少,果子结的不多”。 这次搬家完了,费了不少神,要对得起这院子了(感谢这篇http://li-and-jiang.com/blog/2009/03/30/windows-live-space-move-wordpress/)。 [...]

  5. [...] 放狗搜了一把,找到了google code上的一个相关项目叫 live-space-mover ,看名字就知道是干啥的啦,简介写道“Move blog entries from live space to WordPress”,是一个Python的脚本,说明在这里。总之很简单。这儿还有一个中文的说明,值得注意的是,作者提到的BeautifulSoup的版本,建议使用作者推荐的,而不是最新版 ^_^。 [...]

  6. 离乐 说:

    谢谢了!转换很成功!

  7. [...] space里面的导入Wordpress。第一个方法是参照这里的:博客搬家:从Windows Live Space到Wordpress(图解) [...]

  8. [...] space的部分是按照这个地址的,很详细而且可以傻瓜式的进行:http://li-and-jiang.com/blog/2009/03/30/windows-live-space-move-wordpress/ [...]

  9. HoH 说:

    很详细,很有用。拜谢

  10. [...] 所以搬家的程式只找到一支,而且匯出的只能是XML檔,這下搬去FC2的念頭就挫折了。 [...]

  11. 姐姐大人 说:

    还是这个教程最详尽!非常管用。谢谢

  12. [...] 感谢这篇详细的教程:http://li-and-jiang.com/blog/2009/03/30/windows-live-space-move-wordpress/ 标签: blog搬家, live space, msn space [...]

  13. [...] 11/08/2009 update:突然想起来我在Windows Live Space上还有个Blog,搜索了一下转换的方法,一并导进来了。至此可以说是圆满了,原来所有的日志都整合到现在这个Blog了。 [...]

  14. jiang 说:

    to 大余,

    这个倒没有研究过。

  15. 大余 说:

    这个方法拯救了我被墙了的Live Spaces,现在已经落户WordPress一段时间了。有个问题想请教,上面的方法未能备份出原Live Spaces的留言本,不知有没有别的脚本可以实现这个功能?

  16. banana 说:

    如果按照上面把时间改成12:34的格式的话,是可以成功导出的。
    但如果是12:34:56的形式就报错。。。

  17. banana 说:

    我这报错:
    ValueError: time data did not match format: data=7/5/2008 1:28:11 PM fmt=“%m/%d/%Y

    msn空间的格式是按上面的说明设置的。

  18. [...] 第四,将xml文件导入博客大巴 具体细节需要参照博客搬家:从Windows Live Space到Wordpress(图解) 在观看上面的教程时需要注意以下几点: 1、你的Live [...]

  19. [...] 参考文献:http://li-and-jiang.com/blog/2009/03/30/windows-live-space-move-wordpress/ [...]

  20. [...] 继之前的从 Blogspot/Google Blogger 搬家到 WordPress全攻略 BlogHost再次推出从Windows Live Space搬家到Wordpress图文教程,这是我从网上找到最详实有效的从MSN space搬家到Wordpress的教程,原文可以点此查看。 [...]

  21. [...] 博客搬家:从Windows Live Space到WordPress(图解) 这是对于原创者的中文详解,挺好的,只是提醒大家能读懂英文最好依照原创者的介绍为好。 我之前有个错误就是Livespace的theme设置不对,要按照Broom的示例博客调整页面布局 my experiment space [...]

  22. gome 说:

    谢谢站长!……可是为什么当我运行python的时候输入“d:”,它提示的是”invalid syntax”呢?
    电脑小白一只,问题多多,非常感谢……

  23. gome 说:

    想问一下如果这么做的话,SPACE上的原有日志会不会丢失?如果我只是想把所有日志复制到wordpress上呢?

  24. [...] Space Mover 从-msn-spaces-搬到-wordpress Mac上转移Live Space的日志到Wordpress 博客搬家从Windows Live Space到Wordpress 用Blog_backup导出Live [...]

  25. [...] Space Mover 从-msn-spaces-搬到-wordpress Mac上转移Live Space的日志到Wordpress 博客搬家从Windows Live Space到Wordpress 用Blog_backup导出Live [...]

  26. 西小西 说:

    感激站长的辛苦工作,这个教程写的很清楚很实用~~谢谢~~

  27. [...] 博客搬家:从Windows Live Space到Wordpress(图解) [...]

  28. forcode 说:

    恭喜搬家成功!其实有更加傻瓜的博客搬家工具。建议将blog永久链接设置成与发表日期有关的格式,万一将来hostmonster倒闭了,博客搬到其他服务器里,所有被搜索引擎收录的链接都不会失效,这一点我有过教训。

  29. 陈小齐 说:

    乔迁之喜!BUT这搬家过程看得我脑袋都大了。。

  30. helene 说:

    你们俩开夫妻店啦

  31. ke 说:

    to li at li-jiang,
    介个。。。也太赤果果地show-off了吧!
    哈哈~好幸福呀~

  32. jiang 说:

    空间自个用是有余了。1G,这忒小了点,:)。

  33. 谢益辉 说:

    Python很强大……

    空间多大呀?不会买了1G吧? :)

Leave a Reply

You can use these tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>