Juliusを利用できるようにするまで(というか,「パッケージ管理システム最高!」って話)
故あってJuliusを試してみようと思いました。公式サイトで提供されているバイナリはLinuxとWindows用のみで,当方のメイン環境はMacintosh...。というわけで,あれこれとホゲることになりました。
ちなみに当方の環境はMacBook Air 11-inch (Late 2010)で,
が載ってます。
まずはGoogle先生にご相談。なるべく最近のドキュメントを探しました。
- MacにJuliusをインストールする方法 - Webベンチャーでバイトする大学生のブログ
- 音声認識ソフト Julius導入メモ - 観照げぇむ
- MacでJulius | おもむくがままに
- Julius on Mac OS X 10.6 - 僕の部屋の真ん中らへん
で,多くの記載に従って
- Port Audio (pa_stable_v19_20110326.tgz)
- JuliusのSource (tarball) (julius-4.2.tar.gz)
- Juliusディクテーション実行キット (dictation-kit-v4.1.tar.gz)
をダウンロードしてきました。
この順にコンパイル && インストールすれば,のはずだったのですが,ここからがはまり道だったので。
まずPortAudioのコンパイルが通りませんでした。公式サイトをチェックしたらRequirementsとしてMac 10.4 SDKとあります。上に書いた通り,Xcode 3とXcode 4をインストールしてある手元の環境で /Developer/SDKs/ の下にあるのは
のみ。この時点でとりあえず詰みですね...orz。
(Snow LeopardからLionにアップデートしたMBA 13inch (2nd gen) でも確認したのですが,10.4系のSDKは入ってませんでした)
で,結局のところMacPortsを利用してインストールしたという結末です。MacPortsは導入済みだったので,
> sudo port selfupdate
> sudo port install julius
で一発。
Julius-4.2のMacPortsで日本語音声認識 - 自然言語処理 on Mac
助かりました。
改めて
告知です。音声分析データをRにそのまま流し込むための環境作りについてまとめました。
Praat w/ R http://bit.ly/oN2CWM
からアクセスできます。
ただし今のところはほんとに環境構築までがメインなのですが。んー,続く?
仲良くしましょう
音声分析プログラムPraatと統計解析向けプログラミング言語Rとのインターフェイスとして使えそうなEmu。
Phonetic Analysis of Speech Corpora
- 作者: Jonathan Harrington
- 出版社/メーカー: Wiley-Blackwell
- 発売日: 2010/04/12
- メディア: リング製本
- クリック: 3回
- この商品を含むブログ (1件) を見る
というわけで,備忘録として昨日今日の作業履歴をまとめておきましょう。
1. Emuのインストール
公式サイトからMac OS X用ファイルをダウンロード。ダブルクリックして,出てきた指示に従う。
落とし穴1: インストールが済んだら,ターミナルを開いて以下の行を入力。
chmod a+rx /Library/Emu
このおまじないを忘れるとインストールしたDatabaseが見えなくて悩むことになる。
( SourceForge.net: The Emu Speech Database System: Detail: 3023844 - Emu DB list empty : wrong permission settings )
2. Rのインストール
ここはばっさりスキップ。#ってか,PraatとRはインストールしてる人じゃないと,こんなプログラムに興味ないよね。
ただし,Rのインストール後,Rの公式サイト のtoolsのsubdirectoryから
tcltk-8.5.5-x11.dmg
をダウンロードしてインストールしておく。
3. Emu-Rのインストール
(1) Rを立ち上げて,プロンプトから
install.packages ("emu")
と入力。
(2) library (emu)と入力して,パッケージの読み込み。
(3) emulink ()と入力。
落とし穴2: これがうまく機能しない場合には
emulink("/Applications/Emu.app/Contents/lib")
で置き換え。
落とし穴3: この部分,Rでは通るんだけど,R64やRStudioだと通んないんだよな(泣)。
今日の備忘録
1. Rのインストール
まずはRのインストール。
The R Project for Statistical Computing
から[download R]をクリックして,ネットワーク的に近そうな
Hyogo University of Teacher Education
を指定。
[Download and Install R]から[MacOS X]を指定して,latest versionである
R-2.13.0.pkgをダウンロードしたものの,TwitteRがまだ対応していないみたい(でも結局TwitteRは使わなかった)なので,改めて
[old] Previously released R versions for Mac OS X
からR-2.12.2.pkg をダウンロード。
2. IDEのインストール
つづいて最近お気に入りのIDEであるRStudioをダウンロード。こちらは.dmgをダブルクリックしてマウントしたらApplicationsフォルダにドラッグしてインストール。
3. 今回のメイン処理
今回は
Text Data Mining with Twitter and R « Heuristic Andrew
こちらのページを参考にして,とあるハッシュタグを手がかりに英語tweetsの語彙についてまとめてみようという目論見。ページにまとめられているスクリプトをテキストとして保存して,ちょこちょこと条件に合わせて修整したものを保存しておく。
次に必要なXMLとtmという二つのライブラリをインストールする。
右下のボックスの[Install Package]
をクリックして,それぞれのライブラリをインストール。
ここまで済んだら,インストールした二つのライブラリにチェックを入れる。次に[File]-[Open files...]と進んで,さっき編集・保存したスクリプトを読み込んで,コンソールに張り付け。
右下のボックスの[Plots]
をクリックするとそれっぽいグラフが手に入る。
YAPM
Twitterの情報をほげほげしたかったら,おいらの近場でいちばんポピュラなのは多分Rを使う方法。実際にはTwitteRやらのパッケージをかましてなんだけど。
一方でこの間たまたま見つけたYet Another Processing MethodがPython。そもそも
- 作者: Steven Bird,Ewan Klein,Edward Loper,萩原正人,中山敬広,水野貴明
- 出版社/メーカー: オライリージャパン
- 発売日: 2010/11/11
- メディア: 大型本
- 購入: 20人 クリック: 639回
- この商品を含むブログ (44件) を見る
でメインに使っていたのもPythonだったと思うのだけれど,昨日届いた
- 作者: Matthew A. Russell
- 出版社/メーカー: Oreilly & Associates Inc
- 発売日: 2011/02
- メディア: ペーパーバック
- 購入: 1人 クリック: 200回
- この商品を含むブログ (3件) を見る
でもメインツールはPython。Macには標準で入ってるし(バージョンがちょっと古いけど),去年からちょこちょことほげってる
- 作者: Jennifer Campbell,Paul Gries,Jason Montojo,Greg Wilson,長尾高弘
- 出版社/メーカー: オライリージャパン
- 発売日: 2010/07/23
- メディア: 大型本
- 購入: 4人 クリック: 376回
- この商品を含むブログ (20件) を見る
に紹介されてる無料のIDE ( Wing IDE 101 v. 4.0.2-1 Installers - Wingware Python IDE http://bit.ly/jkU88D )をセットアップもしてるし,で改めて手すさび。*ちなみにこのIDE有料から無料まで機能に応じて3種類提供されているのでお好きなものを。
さらにさらにとして,OS Xの場合,10.5以降のXの評判があまりよろしくない。というわけで
このへん
( Wing IDE for OS X - Wingware Python IDE http://bit.ly/kKu0TE )
を参考にちょっとだけほげった方が幸せになれるかもしれない。
[2011/05/19補足]そうそう,Pythonのもう一つの魅力はGoogleの公式言語の一つってこともある。
- 作者: Dan Sanderson,玉川竜司
- 出版社/メーカー: オライリージャパン
- 発売日: 2011/01/24
- メディア: 大型本
- 購入: 5人 クリック: 414回
- この商品を含むブログ (27件) を見る