独立开博,在Hostmonster上用Wordpress上搭建完自个的空间,第一件事就是把以前发布在Windows Live Space上的博客导进来。其中,下载WindowsLiveSpace的全部文章和评论所用的Python脚本,来自Broom,剩下的一些优化工作,比如删除垃圾评论,用了一些简单的SQL脚本。从WindowsLiveSpace搬家,向来最为麻烦,以下把刚做的功课记下来,鼓励大伙及时退出WindowsLiveSpace。我06年开博,至今在WindowsLiveSpace上积攒下近六百篇博文,所谓积重难返路径依赖,这次全部顺畅导出,兀的不高兴死我也么哥。
对不熟悉Python的朋友来说,以下的内容也一样没有没有障碍:只需要按着相应的步骤,复制粘贴再回车即可。这是我的生活博客,里面所有涉及所谓技术的内容,也是中文系高材生Li也能看懂的。
1.准备工作
1.1. 设置Windows Live Space和Wordpress的日期格式
重要的是让WindowsLiveSpace和Wordpress的日期格式一致,这里我两个设置的是2009/03/30。在WindowsLiveSpace中,我的时间格式是10:24:05,设置的路径是“选项”->“常规”->“日期和时间格式”:
另外,在“选项”->“日志”->“显示日志日期”选项中,勾选“在页首出显示日志发布日期”。在Wordpress中,相应的路径是“设置”->“常规”->”日期格式”。
1.2.下载安装Python 2.5.2
Broom测试了两种组合,Python 2.5.2+Beautiful Soup 3.0.6和Python 2.5.1+Beautiful Soup 3.0.4。但后面的低版本组合需要打些补丁,我们就不必麻烦了,我是直接用的高版本。Python 2.5.2的官方下载地址在:
http://www.python.org/download/releases/2.5.2/
我用的是Windows平台,选择的是X86 processors python-2.5.2.msi。下载完毕,一路安装过去就是,不妨依着它默认的安装路径c:Python25。接下来看看Python好不好使:
开始->运行->在冒出来的框里输入 cmd 回车->在冒出来的命令行输入 python 再回车
顺利的话,你将看到类似的回应:
如果提示说python不可识别,就需要为Python设置环境变量,如果不明白什么是“环境变量”,依着下面的操作就是。
“我的电脑”->右键“属性”->“高级”->“环境变量”->“系统变量”->点中一个叫Path的系统变量->“编辑”->在Path的变量值框的末尾,加上一个分号;(英文状态下),然后跟着是填上Python的安装目录,比如c:Python25。一路确定后,再回刚才的命令行试试python这个命令。
1.3.下载Beautiful Soup 3.0.6
Beautiful Soup 3.0.6是一个解析HTML页面的类库,接下来那个下载博客文章的脚本需要用它。下载地址:
http://www.crummy.com/software/BeautifulSoup/download/3.x/BeautifulSoup-3.0.6.tar.gz
解压到一个文件夹,比如D:downloadBeautifulSoup-3.0.6。你将看到BeautifulSoup.py等几个脚本。
1.4.下载脚本Live-space-mover
Live-space-mover这个脚本,能够把WindowsLiveSpace中的所有文章和评论等,生成一个Wordpress能够识别的XML文件,以实现博客搬家的目的。下载地址:
http://code.google.com/p/live-space-mover/downloads/list
现在的最新版本是live-space-mover.1.7.5.zip。解压到D:downloadBeautifulSoup-3.0.6。在D:downloadBeautifulSoup-3.0.6目录下,你应该看到脚本live-space-mover.py。
2.运行脚本,下载博客,生成XML文件
在刚才提到过的cmd命令行,转到D:downloadBeautifulSoup-3.0.6文件夹(先敲入d: 回车,然后敲入 cd D:downloadBeautifulSoup-3.0.6 回车),敲入下面的一行语句并回车:
python live-space-mover.py -s http://yourSpaceName.spaces.live.com/ -t “%m/%d/%Y %I:%M:%S %p”
其中,yourSpaceName是你Windows Live Space的名字。
这个运行时间视你博客文章的多少而定,如果在屏幕上看到博客标题显示为乱码,不必在意。成功之后,在D:downloadBeautifulSoup-3.0.6文件夹,将生成一个类似export_03292009-2238.xml的文件,这就是你整个Space的文章、评论以及类别之类的了。
又,如果在准备工作1.1中,你Windows Live Space的时间格式是10:24而不是10:24:05,那么,以上命令就将更简洁些:
python live-space-mover.py -s http://yourSpaceName.spaces.live.com/
3.把XML文件导入到Wordpress
这个就相对简单了。Wordpress后台->“工具”->“导入”->选择WordPress,上传那个export_03292009-2238.xml文件,再指定一个作者就行。这个速度就快多了。
一个问题是,系统只允许导入最大为2MB的文件,对超过2MB的文件(像我这次导入的近六百篇博文),只好手动分割文件或想其他办法了。如果一次导入不漂亮,可以把所有的文章及评论先删除了再试试,两个简单的SQL语句可以参考:
DELETE from wp_posts WHERE post_author=1;
DELETE from wp_comments WHERE comment_ID>1;
作者ID(post_author)和评论ID(comment_ID)你可以在phpMyAdmin中找到。
待看到“导入完毕。好好享受吧!”,心情当真是无比舒畅,按着赖哥哥宁的说法,是比大热天吃了冰水还舒服。
4.一些优化工作
对全盘导入的博文,难免泥沙俱下,以前大量垃圾评论也跟着过来了。垃圾评论的一个特点是姓名为空(“没有名称”或者No name),下面的SQL语句就可以把它们清除:
DELETE FROM wp_comments WHERE CONVERT(`wp_comments`.`comment_author` USING utf8) = ‘(没有名称)nwrote:’ ;
DELETE FROM `wp_comments` WHERE CONVERT(`wp_comments`.`comment_author` USING utf8) = ‘No name’ ;
—-by Jiang<at>li-and-jiang.com——-
Tags: Python, SQL, Windows Live Space, Wordpress, 博客搬家
搬家成功。但是space上面的评论却没有成功转移,请问您有办法么?谢谢先~~
同问。没有留言。。。
站长,谢谢你。
今天是2010年7月7日,我使用的版本是Python 2.5.2+Beautiful Soup 3.0.6+live-space-mover.1.7.6
并且,参考 http://b2.broom9.com/?page_id=519,设置Windows Live Spaces使用英文语言,日期时间格式同Broom的设置。
原来是这样啊,谢谢分享。
[...] 本来,博客搬家这想法很早就有过,本着狡兔三窟的原则, 从最早也是最持久的Windows Live Spaces在到新浪,百度hi上开博,由于本人懒惰成性,加上平时瞎忙,偷个空还想玩,于是“院子开了不少,果子结的不多”。 这次搬家完了,费了不少神,要对得起这院子了(感谢这篇http://li-and-jiang.com/blog/2009/03/30/windows-live-space-move-wordpress/)。 [...]
[...] 放狗搜了一把,找到了google code上的一个相关项目叫 live-space-mover ,看名字就知道是干啥的啦,简介写道“Move blog entries from live space to WordPress”,是一个Python的脚本,说明在这里。总之很简单。这儿还有一个中文的说明,值得注意的是,作者提到的BeautifulSoup的版本,建议使用作者推荐的,而不是最新版 ^_^。 [...]
谢谢了!转换很成功!
[...] space里面的导入Wordpress。第一个方法是参照这里的:博客搬家:从Windows Live Space到Wordpress(图解) [...]
[...] space的部分是按照这个地址的,很详细而且可以傻瓜式的进行:http://li-and-jiang.com/blog/2009/03/30/windows-live-space-move-wordpress/ [...]
很详细,很有用。拜谢
[...] 所以搬家的程式只找到一支,而且匯出的只能是XML檔,這下搬去FC2的念頭就挫折了。 [...]
还是这个教程最详尽!非常管用。谢谢
[...] 感谢这篇详细的教程:http://li-and-jiang.com/blog/2009/03/30/windows-live-space-move-wordpress/ 标签: blog搬家, live space, msn space [...]
[...] 11/08/2009 update:突然想起来我在Windows Live Space上还有个Blog,搜索了一下转换的方法,一并导进来了。至此可以说是圆满了,原来所有的日志都整合到现在这个Blog了。 [...]
to 大余,
这个倒没有研究过。
这个方法拯救了我被墙了的Live Spaces,现在已经落户WordPress一段时间了。有个问题想请教,上面的方法未能备份出原Live Spaces的留言本,不知有没有别的脚本可以实现这个功能?
如果按照上面把时间改成12:34的格式的话,是可以成功导出的。
但如果是12:34:56的形式就报错。。。
我这报错:
ValueError: time data did not match format: data=7/5/2008 1:28:11 PM fmt=“%m/%d/%Y
msn空间的格式是按上面的说明设置的。
[...] 第四,将xml文件导入博客大巴 具体细节需要参照博客搬家:从Windows Live Space到Wordpress(图解) 在观看上面的教程时需要注意以下几点: 1、你的Live [...]
[...] 参考文献:http://li-and-jiang.com/blog/2009/03/30/windows-live-space-move-wordpress/ [...]
[...] 继之前的从 Blogspot/Google Blogger 搬家到 WordPress全攻略 BlogHost再次推出从Windows Live Space搬家到Wordpress图文教程,这是我从网上找到最详实有效的从MSN space搬家到Wordpress的教程,原文可以点此查看。 [...]
[...] 博客搬家:从Windows Live Space到WordPress(图解) 这是对于原创者的中文详解,挺好的,只是提醒大家能读懂英文最好依照原创者的介绍为好。 我之前有个错误就是Livespace的theme设置不对,要按照Broom的示例博客调整页面布局 my experiment space [...]
谢谢站长!……可是为什么当我运行python的时候输入“d:”,它提示的是”invalid syntax”呢?
电脑小白一只,问题多多,非常感谢……
想问一下如果这么做的话,SPACE上的原有日志会不会丢失?如果我只是想把所有日志复制到wordpress上呢?
to gome,
SPACE上的原有日志,不会丢失。
[...] Space Mover 从-msn-spaces-搬到-wordpress Mac上转移Live Space的日志到Wordpress 博客搬家从Windows Live Space到Wordpress 用Blog_backup导出Live [...]
[...] Space Mover 从-msn-spaces-搬到-wordpress Mac上转移Live Space的日志到Wordpress 博客搬家从Windows Live Space到Wordpress 用Blog_backup导出Live [...]
感激站长的辛苦工作,这个教程写的很清楚很实用~~谢谢~~
[...] 博客搬家:从Windows Live Space到Wordpress(图解) [...]
恭喜搬家成功!其实有更加傻瓜的博客搬家工具。建议将blog永久链接设置成与发表日期有关的格式,万一将来hostmonster倒闭了,博客搬到其他服务器里,所有被搜索引擎收录的链接都不会失效,这一点我有过教训。
乔迁之喜!BUT这搬家过程看得我脑袋都大了。。
你们俩开夫妻店啦
to li at li-jiang,
介个。。。也太赤果果地show-off了吧!
哈哈~好幸福呀~
空间自个用是有余了。1G,这忒小了点,:)。
Python很强大……
空间多大呀?不会买了1G吧?