ホームページリニューアル

ホームページをリニューアルします。ホームページ容量の増大に伴い、更新にかなり時間がかかるようになってきました。現在の問題は以下のような物があります。
 1.ホームページビルダーを起動するのに35秒もかかる
 2.写真枚数の更新が面倒
 3.作成開始日と完成日がメニューと各ページの先頭双方にあり時々それが一致していない
 4.作成を開始時に各カテゴリーメニュー(機械、電器、...等)と表紙双方に同じ内容を書き込むのが面倒
また、このページを見る人にとっては以下のような見づらさがあります
 A.更新されたページがどれなのか探すのが面倒
   しかも前回見たのが何日だったのかを記憶しておかなければならないのだ
 B.最新の変更はページの一番下に追記されるのでページが長くなるとスクロールするのが大変
   半分以上が「前回までのあらすじ」のドラマがあったら誰もがうんざりする
 C.同じページに追記する形式で更新されるためRSSリーダーと相性が悪い
   記事が更新されても、既に見たページだと既読記事と判断されてしまう。
   設定変更で対応できるRSSリーダーもあるが、記事の更新日を判断できないRSSリーダーもある。

更新頻度は2~3日に1回程度、作成作品のページに写真を数枚と数行の文章を書き足すだけです。まさにBLOGそのものなのですが、BLOGは情報を残しておくための手段としては不適当です。

BLOGのここが気に入らない
 イ.複数ページを開かないと1つの作品が完成する姿を見ることは出来ない
   前回説明したとおり...で始まる記事の「前回」を参照できる記事は殆ど存在しない
 ロ.CADの図面や動画などを保存できない(YouTube等を使えば出来るが更新の手間が増えてしまうし、一括バックアップしたいときに困る)
 ハ.記事の一括ダウンロード機能が無いBLOGサイトも多く、記事が著者の物ではなくBLOGサイトの所有物のようになっている
 ニ.そのためバックアップも出来ない
 ホ.メニューのデザインの自由度が少ない

そこで、現在のホームページのデザインも残しつつ、BLOGっぽい見方も出来るようなページに作り替えます。

-----以下は他のPCに移植する場合の自分用メモ-------------------------------------
jdk以外は解凍して適当なフォルダーに置き環境変数を設定するだけ
jdkはインストーラーでインストールするタイプのソフト
以下はダウンロードした時のことを想定しているがCOPY移植で問題ない

jdkをインストールする
  Windows10は64ビット版
  ダウンロードファイルはexeファイル
  saxonはランタイム(jre)だけで良いがantにjdkが必要
  jdkはjreを含むのでjreはいらない

saxon-HEをインストールする
  Java版を使う.net版ではない
  解凍して適当な所に置いて
  Javaコマンドの引数に絶対パスで渡す
  pathを指定すると環境変数の設定が面倒なのでプログラム開発無しに移行するだけなら絶対パスのほうが楽
  環境変数クラスパスでsaxonのありかを指定
  CLASSPATH=C:\Program Files\Saxonica\SaxonHE9.3N\bin\saxon9he.jar
  現時点では併用されている

antをインストールする
  tar.gz など圧縮方式の違うものがいろいろあるがzip版を選ぶ
  システム環境変数にantのbinフォルダーを指定してant.cmdが実行できるようにする
  環境変数は コントロールパネル-システムとセキュリティ-システム-システムの詳細設定 にある
  antコマンドをコマンドプロンプト画面で実行して tools.jar が無いと表示されたら  環境変数JAVA_HOME に Jdkのパス 環境変数path に%JAVA_HOME%binを指定

ftpライブラリーをインストールする
  標準状態ではantでftpするモジュールは入っていないので commons-net-xxxxx.jar をantのlibにインストール


2008-01-10

現在のホームページは、ホームページビルダーを使用して書いている。この記事を書くまで知らなかったのだがホームページビルダーは入門者向けのソフトでWeb制作を本業としている人はAdbeのDreamweber等のもっと高級品を使用するらしい。ただし高級品はHTMLを意識した記述が必要になるようだ。Webの制作者とオーナーが別々の場合はHTMLを意識させる高級品を使用するのは理にかなっているが、オーナー兼制作者である個人ページの場合はHTMLを意識しながら書くのは無理(面倒くさすぎる)なので安物のホームページビルダーを使うということになるらしい。

PICT6192.jpg

1回分の更新をひとかたまりのデータとして保持し、それをプログラムで1つのページにしてあげるようにします。しかしHTMLはプログラムで加工するための元ネタデータとしては不適です。HTMLにはフォントサイズなどのページの見え方が含まれていて、プログラムでいじるためには複雑すぎるのです。そこで、ページのデータはXML形式で保持することにします。XMLを採用するとホームページビルダーは使用できなくなります。代わりに「XML Notepad」を使います。これはMicrosoftのWEBサイトから無料でダウンロードできます。大まかな処理の流れは以下の通りです。

1.XML Notepadでページを作る
     ▼
2.作ったページからXSL(=XMLファイル加工専用のプログラム言語)を使って以下の物を生成する
   ・各作品のHTMLファイル
   ・更新1回分だけのHTMLファイル
   ・表紙と各カテゴリーのメニュー
   ・RSSフィード
     ▼
3.ホームページビルダーのスケジュールアップロード機能で更新されたファイルをYahooジオシティーズに送信する

ホームページビルダーのようにワープロ感覚でページを編集するのではなく、自分のホームページのデータを組み立てるという感覚でページを書くことになります。

PICT6190.jpg

このページそのものを書いているところ

PICT6197.jpg

XML Notepad により生成されたXMLファイル

XMLファイルの書式をXSDファイルで定義しておくと、XML Notepad の入力支援機能が使用できるようになります。入力候補をXSDファイルで列挙しておけば選択方式で入力できたり最大文字数チェックなどをしてくれます。新ページは写真の下に説明が表示されるようにしました。以前のページは「右の写真は...」といった説明が必要だったのですが、この方式なら写真の位置を説明する文章は不要です。

PICT6193.jpg

XMLファイルの書式を定義したXSDファイル

PICT6199.jpg

入力支援機能

2008-01-12

XMLファイルをXSLプログラムで加工してHTMLファイルを生成します。HTMLの新規格であるXHTMLを生成するようにしました。HTMLとXHTMLには殆ど違いはありませんがXHTMLの方がプログラムで加工するのに適しています。ファイルの生成はMicrosoftの msxsl.exe を使用します。これもMicrosoftのホームページから無料でダウンロードできます。

PICT6205.jpg

XSLプログラム。このプログラムはXML形式で記述するのでプログラムではなくデータのように見える。

PICT6202.jpg

XMLファイルからXSLプログラムによって生成されたHTMLファイル。背景の色やフォントの体裁などが含まれていないシンプルなページを生成している。

フォントサイズは背景の色などはスタイルシートに定義します。スタイルシートを適用した後のページの写真は掲載しません。なぜならこのページそのものだからです。背景が灰色になっていたり写真の下の説明が背景色よりちょっと濃くなっていたりするのは、スタイルシートにそれを定義しているからです。

PICT6201.jpg

機械工作でもソフトウェア開発でもこんなスケッチを良く描きます。こんなのを書きながらイメージをふくらませるのです。

PICT6204.jpg

スタイルシート

2008-01-18

XML、XSL、XSD、XHTML これら全てが何なのかを知らない状態からスタートしているので入門書も読みます。本職はIT系です、だからといって難しい物を読むわけではありません。こういう物の方が頭を使わなくて済むので助かるのです。ちょっと前まではインターネット関連の情報といえども書店で書籍を探す必要があったのですが最近ではインターネット上の情報が充実してきたので本を買わなくても済むようになってきています。

PICT6206.jpg

XMLの入門書 入門書は「...とは何ぞや」の概略を知りどんなことが出来そうなのかをイメージするための物。それ以上を求めてはいけない。

生成したXHTMLファイルの見栄えをCSSファイルで定義していきます。上の方から少しずつやっつけていきます。

PICT6207.jpg

XMLから生成されたXHTMLファイルをブラウザーに表示させた物。見栄えに関わる情報が抜けているのでとてもシンプル

PICT6212.jpg

CSSで見栄えを良くしているところ

カテゴリメニューをページの上の方に横並びにレイアウトしてみました。ブラウザーの横幅を変更すると、重さを感じます。同じレイアウトのアマゾンも同じく重い感じがするので、記述方法の間違いではなさそうです。

PICT6214.jpg

だいたい表紙のレイアウトが確定した

PICT6216.jpg

各カテゴリメニューページは「サブカテゴリ」単位に分けてみた

置き換える前に記念に旧デザインのイメージをここに残しておきます。

oldpage.jpg

2008-01-20

表紙の一番下のNEWS欄は記事の有効期限(expiredate)を過ぎると表示されないようにした。記事の登録時に有効期限を入力しなければならないのが面倒だが、この機能がないと時々記事の内容を読んで削除すべきかを判断しなければならない。「記事を時々読んで...」のほうが更新日付を入力するよりもずっと面倒なのでこの機能をつけた。

PICT6218.jpg

RSSリーダーで記事を読んだときの画面。RSSフィードをATOMというのにしたのだが、インターネットエクスプローラーでは何だかまるっきりダメ。RSS BANDITというリーダーだとOK。インターネットエクスプローラーはATOMに対応していないのかもしれない。ATOMの規格のバージョンは0.3と1.0があって、今回採用したのは1.0。

PICT6219.jpg

インターネットエクスプローラーの画面

PICT6220.jpg

RSS BANDITの画面

これでリニューアルはひとまず終了だが、半年くらいは細かな修正を加えつつ改良していくことになりそうだ。現時点で未対応の物は...
 1.部品表などをXMLファイルから生成する機能
 2.添付されている写真枚数の表示機能(RSSリーダーで記事が読めるので必要性は薄い)
 3.各記事の一番上に HOME > カテゴリ名 > 作品名 というのを表示させる機能
 4.RSS対応(ATOMではなくRDFのもの)
 5.BLOG風ページ(作品とは関係なく、追加された記事を時系列で表示する物、同時並行で制作しているので複数の作品が混ざったページになる)
こんな所だ。必要になったときに少しずつ追加していく予定。

主要なファイル。今後も修正され続けていくのでこれで完成というわけではない。
ファイル ファイルタイプ 添付ファイルの解説
homepage.xml TEXT 表紙および各カテゴリのメニューを作るための元ネタファイル。このファイルはインクルードしているファイルがサーバー上に無いのでブラウザーで直接開こうとするとエラーになります。
homepage.xsd TEXT 元ネタファイルの書式を定義したファイル。
homepage.xsl TEXT 元ネタファイルを加工してXHTMLファイルを生成するプログラム
140_renewal.xml TEXT このページそのものの元ネタファイル
article.xsl TEXT このページを元ネタとしてXHTMLファイルを生成するプログラム

2008-01-21

最新の企画を採用すると古いソフトが対応していなくて、いろいろ問題にぶち当たります。新規格は仕様が確定してから2~3年程度待たないとダメみたいです。ATOM1.0を採用しているサイトは少ないみたいなので使われることなく消えてしまう可能性もあります。

PICT6221.jpg

自動生成されたXHTMLをホームページビルダーで見ると文字が化けます。小細工(METAタグを入れる)すると読めるようになりますが、XHTMLには本来不要な要素です。

PICT6222.jpg

インターネットエクスプローラーでATOMフィードが読めないのでバリデータに通してみました。エラーが全部無くなってもインターネットエクスプローラーでは正しく表示されません。やはり、IEはATOM1.0には正式対応していないようで、本来正しい表現である type="application/xhtml+html"という記述をATOMフィードから取り去ったら正しく表示されるようになりました。

2008-01-22

XMLからXHTMLを生成するプログラムはマイクロソフトのmsxsl.exeを使用したが、これはXSLT言語規格のバージョン1.0を採用している。XSLTの最新規格は既に2.0になっていてバージョン1.0だとトリッキーなことをやらないと出来ないことが、バージョン2.0だと素直に書ける。今回作った物も現在の日付を取得したり、改行を<BR/>に変換したりする部分がかなりトリッキーだ。V2.0に対応したプログラムはSAXONというのが有名らしく、近々これに変更しようと思う。今のところXSLTのV2.0は日本語書籍が存在しないことなど関心は低いみたいだが、上位互換の規格なので2.0に置き換わっていくのは時間の問題だろう。

PICT6227.jpg

プログラムは完成したばかりだが、XSLTについて検索したらSAXONというプログラムを見つけた。

PICT6225.jpg

ブックマークの登録人数は、そのサイトにどれだけ関心を持っている人がいるのかを見るための目安になる。XSLT1.0は11人でXSLT2.0は1人

2008-01-24

ホームページビルダーのスケジュール転送機能はHTMLに添付されている画像が送信されません。原因不明。バグかな?

PICT6232.jpg

インターネットエクスプローラーのバージョンによって見え方が違います。スタイルシートの解釈の仕方が両者で違っています。IEに限らず他のブラウザーでもスタイルシートの解釈が違っていて微妙に見え方が異なることがあるみたいです。こういう問題に対応しているときりがないので、たぶん最新版のIE7の方が正しいスタイルシートの表示であるとして修正はしないことにします。

PICT6244.jpg

こちらがIE6

PICT6245.jpg

こっちがIE7

2008-01-25

XSLTプロセッサーをSAXONに切り替えた。XSLTプロセッサーはデータとしてXMLファイルを、プログラムソースとしてXSLファイルを入力にしてXMLファイルやHTMLファイルを出力してくれる。

PICT6246.jpg

XSLT1.0->XSLT2.0へは上位互換なので、基本的に version="1.0" となっている部分を version="2.0" と書き換えるだけでよい。

PICT6247.jpg

動かしてみた。100%上位互換だと思ったが、ちょっと問題が出た。このページそのものを生成し直してみたのだが一部表示されない箇所がある。

改行を含むテキストの改行部分を<br/>に置き換える処理はXSLT1.0だと再帰を使ったプログラムになるがXSLT2.0だと tokenize を使ったシンプルな記述に出来る。言語はやはり高機能な方が良い。但し、MSXSL.EXEに比べるとSAXONは5~6倍処理が遅い。

PICT6248.jpg

XSLT2.0 だと8行

PICT6249.jpg

XSLT1.0 だと16行

2008-01-30

ページの先頭に「ホーム」と「カテゴリメニュー」へのリンクを表示するようにした。この機能はYahooやGoogleなどの検索エンジンを使って直接このページを開いた人のためのもの。

PICT6323.jpg

2008-02-04

ホームページビルダーのファイル転送機能が正しく動作しないので、ファイル転送の機能を自作した。ゼロから作るのではなくANTというプログラム開発用のユーティリティーを使用した。ANTはファイル同士の相関関係を記述した定義ファイル(ビルドファイルと呼ぶ)を与えてあげると、ファイルの更新時刻を比較してファイルの更新コマンドを実行してくれる。
例えば、以下の2つのルールをビルドファイルに記述しておくと
 1.TEST.EXE は TEST.BAS から作られる
 2.TEST.EXE は compile test.bas コマンドによって作られる
TEST.BAS が TEST.EXE より新しい場合にのみcompileコマンドを実行してくれる。この仕組みを応用して、更新されていないファイルはアップロードしないようにしている。また、リンクされていない画像や添付ファイルもアップロードしないので、転送元のフォルダーにアップロード不要な物(バックアップファイルなど)を置いていても、無視してくれる。このホームページは多くのファイルから出来ているので、ビルドファイルも巨大になる。これを手作業で作っていたのでは、大変なのでビルドファイルそのものもHTMLファイル同様にXMLファイルから自動生成している。

PICT6325.jpg

ANTのマニュアルページ。

2008-02-18

atomフィードに問題があったので修正したが、IE7で正常に見えるようになったもののRSS-BANDITでエラーになる。原因不明。バリデータで問題が発見できないのでRSS-BANDITのバグの可能性もある。

PICT6364.jpg

IE7では正常に表示されるようになったが...

PICT6365.jpg

RSS-BANDITで受け付けなくなってしまった

PICT6363.jpg

Feedバリデータに通してみてもエラーにならない

2008-02-20

FTPの送信エラーが時たま起こるので、今までファイルを1個ずつ送信していたが、まとめて送信するように変更した。プログラムの造りを大幅に変更することになったが、機能の勉強用題材として役に立った。

PICT6366.jpg

送信直前の画面。コマンドプロンプト画面なのであまり見やすくないが、機能的にはこれで十分。