ランダムハウス英和辞典の音声ファイル(ra)106677個をwaveに変換
検索ソフトをDDWinからEBWinにしようかと思ったのですが
ランダムハウス英和辞典を使うためにはEPWING形式に変換しなければなりません。
ここで最大のメリットである音声10万語を諦めるわけにはいきませんね。
しかしながら10万個あるraファイルをWAVEに変換する必要があり,
raの変換で検索すると,多分これ関連だろうなぁ,という質問ログなどが見つかります。
しかし「real」系のファイルはいくつも内部バージョンがあって互換性があやしく,
誰かが成功したソフトであってもバージョンが違えばあやしい,ということがある模様。
自分もこちらを参考にしようかと思ったらエラーでまったく変換できないという状況。
EBStudioでランダムハウスをEPWINGにしてみた(また長いよ): おくまの部屋(本館)
http://okuma-room.cocolog-nifty.com/okuma/2009/10/ebstudioepwin-2.html
さてそれでどうしたのかというと結局本家realplayerをインストールして
それに含まれているRealplayer Converterを利用することにしました。無難に。
【1】ランダムハウス英語辞典Toolkit 開発中バージョン を使ってファイルを展開
【2】Realplayer Converterで ra を mp3 に変換
【3】foobar2000で mp3 を wav に変換
【4】EBStudioでEPWING形式に変換
【4-2】EBShrinkでebzip形式に圧縮
CPUはcore2duo E6550,メモリは3GBです。かかった時間は以下の通り。
【1】5分 【2】1セット8分ぐらいの作業を107回
【3】1時間 【4】25分 【4-2】5分
必要HDD空き容量20GB〜
【1】ランダムハウス英語辞典Toolkit 開発中バージョン を使ってファイルを展開
ダウンロードはこちら。
ランダムハウス英語辞典Toolkit 開発中バージョン
http://hp.vector.co.jp/authors/VA000022/srdtk/srdtk.html
中に書いてあるread me通りに。これでファイルが1000個入ったフォルダが106個出来ます。
一応設定箇所を書くと,ランダムハウスのデータアドレス,SOUND = 1,GENSOUND = 1 です。
「srd2html.exe」を実行して約5分。
【2】Realplayer Converterで ra を mp3 に変換
realplayerの変換機能付きのほうをインストールします。
RealPlayer|動画を検索・保存できるマルチメディアプレーヤー
http://jp.real.com/?mode=basic
んで内部にあるconverterを起動します。場所は多分ここ。
C:\Program Files\Real\RealPlayer\converter\RealConverter.exe
変換設定はPCまたはMAC用で,詳細から「オーディオのみ」「MP3 320kbps」にします。
多分320kbpsもいらないんですがどうせWAVに戻すのでせっかくだから。
・コンバータを起動してフォルダ1つをD&D:数分
・「スタート」を押してMP3に変換する:5分ぐらい
・コンバータを終了する:大抵終了できずにフリーズしますが,強制終了でOKです。
・raを削除しておきます(mp3に問題がないことをしっかりと確認してください)
という手順になります。何個ずつまで同時にできるのかは恐らく環境次第だと思います。
自分の環境では「コンバータを毎回終了」すれば1フォルダ(1000個)ずつの作業が安定して出来ました。
テストで1つmp3を作って再生して,大丈夫かどうかチェックしておきましょう。
コンバータは「すべてクリア」ではダメで,毎回終了しないとフリーズしやすいです。
何かを開始してから20分以上待って何も変化しなければ恐らくフリーズでしょう。
「すべてクリア」だと300ずつやっていても数回目でアウトになりました。
すべてMP3に変換すると1フォルダあたり120MB弱,合計で12GB近くになります。
調子がよければフォルダ1つあたり7分ぐらいです。1週間ぐらいかけて気長にやりましょう。
さらに注意点があります。
この操作は大量の小さなファイルを生成するため,HDDに細かいファイルが分散しがちです。
残り容量にGB単位の余裕があっても,もうHDDが空いてない,とエラーを吐くことがあります。
そのような際にはとりあえず(不要なものをすべて消した後に)最適化をかけねばなりません。
★ \053\0b31beca.ra
何故かこれだけ変換できなかったのですがXrecode IIでMP3に出来ました。
xrecode II
http://xrecode.com/
他のraファイルはコーデックがsiprですがこれだけac3,サンプリングレートも違うようです。
いきなりWAVにも出来ますがfoobar2000でWAVにしたほうがいいのでMP3にします。
とりあえず使った設定は以下の通り
固定ビットレート,320kbps,ステレオ,ソースと同じ場所に出力
【3】foobar2000で mp3 を wav に変換
xrecodeとかEfficient Converterとかも試しましたがfoobar2000以外はダメでした。
10万ファイルの登録・変換速度,変換の質・正確さなどもfoobar2000が最良でした。
foobar2000
http://www.foobar2000.org/
non existent - foobar2000 localization patch:日本語化パッチ
http://tnetsixenon.xrea.jp/rnote/localization/foobar2000.html
プレイヤーとしての機能は別に使わないので適当にインストールします。
カスタム幅の広いプレイヤーとしても人気はあるので使ってみたい人は頑張ってください。
起動後,File → Add Folderで「\snd」を指定して10分ほど待ちます。
読み込まれたファイルをCtrl+Aですべて選択後,右クリックから Convert → ... を選びます。
・Output
出力形式:WAV,ソースと同じフォルダ,既に存在するなら上書き
各トラックを個別に変換:名前形式は「%filename%」
・Processing
DSPにチェックを入れて,右側から「Downmix channels to mono」と「Resampler (PPHS)」
を選んで左側に写し,Resamplerの設定でターゲットサンプルレートを11025Hzにします。
レートを下げるとファイルは軽くなりますが再生時に11025扱いされるので早口になります。
一応8000なら聞き取れますがディズニーみたいな声になります。
ウルトラモードはよくわかりませんがとりあえずチェックしておきました。
・Otherの出力ビット深度をどちらも8-bitにします。
OKを押して待ちます。core2duo E6550で40分ぐらい。
【4】EBStudioでEPWING形式に変換
EBStudio 今回は1.70
http://www31.ocn.ne.jp/~h_ishida/EBStudio.html
C:\srdtmp\srd.ebs を開いて実行,約25分。
前方一致かな検索にもチェックを入れると約40分。
その後Toolkitの「srdfix.exe」を実行して約1秒。早すぎてよくわからない。
途中の情報を見たい場合はコマンドプロンプトから指定して実行したら見えます。
あるいはsrd2html.logを開くと書いてあります。
なおWAVファイルが大きすぎるときはここで失敗するようです。
【4-2】EBzip形式に圧縮
このままでも一応利用は出来るのですが,EBwin付属のEBshrinkを使って圧縮します。
圧縮レベル5でオリジナルファイルは残さない設定にして約5分。かな有無で変化無し。
圧縮前:1.62 GB(8000Hzの場合1.23 GB)
圧縮後:718 MB(8000Hzの場合548 MB)
参考:EPWING化前 676 MB
よっしゃーお疲れ様でしたぁぁー。
実は前回の2/16日記からずっとこれ試行錯誤してたから3週間ぐらいかかった。
しかしEBWinの仕様の一部がちょっと気になる。
作者さんが元気なうちに要望でも出してみるべきだろうか。
・連続表示時のスクロールがページの切り替わりで大きくジャンプする
・辞書名の文字数が半角と全角を同じ数え方をしていて不揃い
例えば3文字にするとWebsterはWebで切れる。DDWinならWebsteになる。