0から始めるwikipediaのローカル用変換:数式対応
ほぼすべてこちらに書いてある通りなのですが,
個人の日記は突如消えることもありますので分散ということでメモを作成。
自分がPerlを知らずに無理やりやってるので基本を無視しまくりだとは思いますのでご了承を。
WikipediaをEPWING形式に変換する
http://bamboo-hill.air-nifty.com/diary/2010/01/wikipediaepwing.html
まぁそもそも自作しなくても,公開してくださってる方はおられるんですけどね。
boreder.jp/saba http://www.border.jp/saba/main/
Ceena::BitTorrentTracker http://www.ceena.net/
Boookends http://sites.google.com/site/boookends/title
現在は図版対応への動きがちょっとあるようですが,まだ一般公開はされていません。
Wikipediaが図版を配っているわけでもありませんし,今後に期待しつつも今回は数式のみ対応で。
自分の環境:Windows Vista x86,HDD空き容量は30GB以上を推奨
◆手順
0:Wikipedia日本語版の最新版を落としてくる
1:cygwinというソフトをインストールしてPerlを使えるようにする
2:Wikipediaのデータファイルとそれを変換するプログラムを集める
3:cygwin上で変換処理
4:EBZip形式へ圧縮あるいはそのまま使用
無料の英英辞書
WordNetは少々趣旨が違うので辞書として使うのはあれだったのですが
完全フリー(パブリックドメイン)なのを見つけました。
Webster's 1913 (EPWING)
http://www.vector.co.jp/soft/data/writing/se334004.html
ちょっと古いですが基本語なら問題なさそうですね。
例えば「compatible」を引いてみると以下のように出てきます
Com_pat"i・ble
(_), a.[F., fr. LL. compatibilis, fr. L. compati. See _Compassion_.]
Capable of existing in harmony; congruous; suitable; not repugnant; -- usually followed by with.
Our poets have joined together such qualities as are by nature the most compatible. Broome.
Syn. -- Consistent; suitable; agreeable; accordant.C
あとWikipediaも実は全ページアーカイブとかいうのが手に入るんですね。
ローカルで突如アニメやゲームについて調べたくなったときには便利ではないでしょうか。
20100213追記:
パブリックドメイン辞書をまとめているページをいくつか発見したのでぺたぺた
辞書だらけ
http://www.motorwarp.com/koizumi/dictionalies.html
Maximilk
http://maximilky.hp.infoseek.co.jp/index.html
■
EACで作ったCUEシートをfoobarで読み込むとエラーが出た件についてですが
CUEシートの解釈が異なっているようですねぇ、めんどくさい・・・
ちゃんとした仕様書が検索してもなかなか出てこないもんだから嫌な予感はしていましたが。
参考:
Cue Sheet 基礎知識
http://pipico.hp.infoseek.co.jp/etc/cdr/cuesheet.html
CUEシートが違う!
http://homepage2.nifty.com/yss/cue.htm
今回の件はまさにこのURLにある例の通りでして、EACのCueシートはBlindreadのようになっていました。
ただしなっているのは一部だけ・・・なぜこんなことに。
MediaMonkeyは修正前後も特に変わらずに再生してくれましたが、foobar2000は若干そのあたりが厳格なようですね。
とりあえず適当に手作業で削除することで問題なく認識されるようです。
あとXrecodeIIだとmp3にタグが上手く入っていないようですがfoobar2000だとちゃんと入ります。
最終的にはSuperTagEditor改 Plugin Version (Nightmare) でチェックした後に転送、ということにしてみます。
ともかく、解決策が見つかったのでfoobar2000を使うべき、という結論になるでしょうか。
検索用エラーメッセージ
Error parsing cuesheet: invalid index list
FlacからMP3へフォルダ指定しつつ変換
100202追記
えーとどうもXrecodeで作ったMP3のタグ関連に不具合があるようです、よくわかりませんけども。
ちょっとfoobar2000との比較やらその他についてまとめようと思いますので
奇特にも参考にしようとか思ってた方おられましたら危ないですよ、というメモ。
原因の推察 → http://d.hatena.ne.jp/Paseo/20100203
えーさてさて前回でEACを使ってCDをFlacとして取り込むメモを作りました。
今回はそのFlacから持ち運び用にMP3を一気に作ってしまう手段のメモになります。
結構条件をつけて探したのですが期待通りのソフトがとりあえず2種類ほど見つかりました。
foobar2000 http://www.foobar2000.org/
XrecodeII http://xrecode.com/
foobar2000はカスタム性で音楽プレイヤーとして有名なソフト、
XrecodeIIはエンコード専用ソフトです。多分マニアックです。
自分のやりたいことはこんな感じです
・整理フォルダを維持しつつ大本のフォルダは変更したい
D:\音楽-Flac\(分類)\〜.flac でフォルダ分けされているFlac+Cueをすべて登録して
D:\音楽-MP3\(分類)\〜.mp3 の形に、フォルダの階層構造を再現しつつ、MP3を出力
できたらMP3はさらにアルバムフォルダを作ってその中に入れたい。
・Lameの設定を有る程度細かくいじれることと日本語が読み込めること
・Cueを読み込んで、Flac内のトラックごとに分割されたMP3を出力できること
・Cueの内容からTagを勝手に埋め込んでくれること
以下にfoobar2000とXrecodeIIについてのメモ
EACでFlacを作ってMediaMonkeyで再生
CDプレイヤーのCD入れ替えが面倒なのでこれまでもMP3でやってきましたが
考えるのが面倒になってきたのでFlacにしました。
圧縮後はCDによりますが250〜530MB、ってえらいぶれるなぁ。
クラシックは圧縮率が高い傾向にありますね。
Flacというのは素WAVに圧縮かけただけーみたいな可逆フォーマットです。
CUEファイルを作成しておくことで曲目なども保存でき、
CD1枚につき「.flac」と「.cue」の2つで管理できます。
さらにアルバムアートの「.jpg」が欲しければ適当にAmazonとかで。
これらをまとめて1つの「.flac」にすることも可能ですが対応はプレイヤーソフト次第?
バッチ処理で一気にmp3を作成できたりもするらしいですがそのうち調べます。
さて設定などについての覚書をてけてけ
取込:Exact Audio Copy
再生:MediaMonkey