『川中重司、ほのぼのIT税理士!(^^)のブログ』のバックアップブログです。09)ブログの引っ越し2.取得したデータの加工(引っ越し先で取り込める形式に加工)(ブログへの引っ越し・力業編)

2.取得したデータの加工(引っ越し先で取り込める形式に加工)(ブログへの引っ越し・力業編)

2.取得したデータの加工(引っ越し先で取り込める形式に加工)(ブログへの引っ越し・力業編)

この記事は、『ブログへの引っ越し・力業編』のシリーズ、
今回は、手順2.『2.取得したデータの加工(引っ越し先で取り込める形式に加工)』です。


手順1.『引っ越し元からのデータの取得はHP保存ソフトを使用する(ブログへの引っ越し・力業編)』では、
データエクスポート機能が無いブログ・HPのデータを、HP保存ソフトを使って取得しました。

もちろんこのままでは、ブログへのインポートができないので、インポートできる形式に加工します。
それも、一つ一つの加工ではなく、一気に加工します。

その時に使用するのが、下記の3つです。
・『Repl-Ace on .NET』:テキストファイルの変換ソフト
・若干の『正規表現』の知識
・『KanjiTranslator』:文字コード(改行コード)変換ソフト

・『Repl-Ace on .NET』:テキストファイルの変換ソフト
このブログでも何度か紹介したことがあります、
複数のテキストファイルのなかの複数の文字列を、一気に変換してくれる、神業的ソフト。
詳しくはこのブログの記事『(その3)gooブログからの移行・「Repl-Ace on .NET」は必須ツール』をご覧下さい。


・若干の『正規表現』の知識
単なる文字列の置き換えでは出来ないこことが、若干の正規表現の知識が有れば、可能になります。
例えば、
これ:■ 2008,09,13, Saturday を、
これ:DATE: 09/13/2008 00:00:00 に、変換できたりします。
(日付の並べ替えをしているんですが、お分かりいただけますか?)


・『KanjiTranslator』:文字コード(改行コード)変換ソフト
実は今回、『Repl-Ace on .NET』で文字列の置き換えをした際、文字化けに悩まされました。
アルファベットの置き換えでは問題ないのですが、日本語(全角文字)の置き換えをすると、とたんに文字化けします。

HP保存ソフトで保存したデータファイルが、『UTF-8』という文字コードで保存されていたので、
『Shift-JIS』という文字コードに一括変換したところ、文字化けが無くなりました。


これらのツールを使って、
HD保存ツールで取得したHPのデータを、
ブログにインポートできる形式(Movable Type形式)へと加工して行くわけです。


移行元の記事数が20本くらいなら手作業でも良いでしょうが、1000を超える記事数の際には、これらの方法でないと、とってもやってられません。


『3.引っ越し先へのインポート(ブログへの引っ越し・力業編)』へ続く。


 起業・開業を応援する鯖江の税理士法人川中経営
  税理士・ITコーディネータ 川中重司



川中は、ツイッターで時々つぶやいています。よろしければご覧下さい。
川中は、ツイッターで時々つぶやいています。よろしければご覧下さい。



このブログ記事について

このページは、鯖江の税理士が2009年8月 6日 00:00に書いたブログ記事です。

ひとつ前のブログ記事は「離婚と所得税の関係の二種盛り(研修メモ)」です。

次のブログ記事は「旧型の無線LAN器機はセキュリティの危険が大きいためWPA2への移行を-WPAも破られることに-」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。