latex2html on Ubuntu 8.04

D論を英文校正に出すために、texファイルからdocファイルに変更しようとして、まずlatex2htmlでhtmlファイルにしてからWordで読み込むことにした。実はこの前にtexファイルから生成したpdfファイルをAcrobatを使って直接docに変更しようとしたんだけど、エラーで失敗してたんだ。latex2htmlの実行環境としては、普段使っているMacBookでなく、Ubuntu 8.04がインストールしてあるマシンにした。文字コードの問題やら、改行コードの問題ではまったのでそのメモ。

  • platex on Ubuntuのデフォルト日本語文字コードEUC-JP。それ以外の文字コードを使っている場合は、texファイルのコーディングを変えるなり、オプションでファイルの文字コードを指定する。
  • あらかじめplatexでauxファイルを作っておかないと、latex2htmlで章番号、図表番号を参照できない。
  • 参考文献についてもそう。あらかじめbibtexコマンドでbblファイルを作っておかないとlatex2htmlで参照できない。
  • pdf画像はlatex2htmlでは画像ファイル(png)に変換できない。そのため、pdfからepsへの変換 on Linuxでまとめた方法で一度epsにフォーマット変更する必要がある。
  • latex2htmlは改行コードにLFが入っていないと動作しない。Windowsの改行コードはCRLFだから問題ないが、Macの改行コードはCRなため、改行コードを変換する必要がある。

実は今までLinux上でtexコンパイルをしたことがなかったんだ。1つ目の文字コード問題ではまったのはそのせい。
ちなみに、なぜMacPortsでパッケージ提供されているlatex2htmlMac上で実行しなかったかというと、それはtexliveに依存しており、texliveはpTexパッケージとコンフリクトするから。
最終的に使用したlatex2htmlのオプションはこちら。120ページの長い論文を1枚のhtmlファイルにして、章番号を振る設定。オプションの数が多すぎて、目当ての設定にするのにも苦労した。

$ latex2html -show_section_numbers -split 0 main