• 静的なHTMLファイル1200ページあるWebサイト(レンタルサーバー)のデータをクラウドサーバーでリニューアルするWebサイトのDBに移行する方法があるかどうか分かる方はいますか?

    現在のWebサイトの各ページに掲載しているコンテンツ部分のみを再利用します。
    新Webサイトは、phpを使用します。
    Wordpressは使用しませんが独自CMSです。

    何か方法があるかどうか教えていただければと思います。
    どうぞよろしくお願いします。
返信の受付は終了いたしました。
  • 無理なんじゃないかな。DBに移行するためにはテーブルが必要で、静的HTMLってフォーマットは決まってないんでしょ?

    あらかじめ「名前|メールアドレス|内容」みたいな項目が決まっているtableタグがあれば、スクレイピングみたいにHTMLを分解してSQLでDBに保存することもできるけど。
  • その静的HTMLで書かれたページがちゃんと構造化されてるならプログラムで抜き出せるけど、そうでないならもはや手動でやるしかない。スクレイピングで「テキストだけ」は抜き出せるだろうけど、それをどう組むかはもう手作業だろうな。がんばれや・・・
  • スクレイピングすればできるでしょ
    1200ページが手動で作成されたとは考えにくいから、なにかフォーマットがあるはず。どっちにしても、抜きたいデータの内容次第だし、逆にhtmlをそのまま抜いてDBに入れるだけなら、簡単だよ?