Juliusを利用できるようにするまで(というか,「パッケージ管理システム最高!」って話)

故あってJuliusを試してみようと思いました。公式サイトで提供されているバイナリはLinuxとWindows用のみで,当方のメイン環境はMacintosh...。というわけで,あれこれとホゲることになりました。

ちなみに当方の環境はMacBook Air 11-inch (Late 2010)で,

  • Mac OS X (v10.6.8)
  • ターミナル (v2.1.2)
  • Xcode (v4.0.2) (v3.2.4)

が載ってます。

まずはGoogle先生にご相談。なるべく最近のドキュメントを探しました。

で,多くの記載に従って

をダウンロードしてきました。

この順にコンパイル && インストールすれば,のはずだったのですが,ここからがはまり道だったので。

まずPortAudioのコンパイルが通りませんでした。公式サイトをチェックしたらRequirementsとしてMac 10.4 SDKとあります。上に書いた通り,Xcode 3とXcode 4をインストールしてある手元の環境で /Developer/SDKs/ の下にあるのは

  • 3.2系用にMacOSX10.5.sdk と MacOSX10.6.sdk
  • 4.0系用にMacOSX10.6.sdk

のみ。この時点でとりあえず詰みですね...orz。
(Snow LeopardからLionにアップデートしたMBA 13inch (2nd gen) でも確認したのですが,10.4系のSDKは入ってませんでした)

で,結局のところMacPortsを利用してインストールしたという結末です。MacPortsは導入済みだったので,
> sudo port selfupdate
> sudo port install julius
で一発。
Julius-4.2のMacPortsで日本語音声認識 - 自然言語処理 on Mac
助かりました。

仲良くしましょう

音声分析プログラムPraatと統計解析向けプログラミング言語Rとのインターフェイスとして使えそうなEmu。

Phonetic Analysis of Speech Corpora

Phonetic Analysis of Speech Corpora

公式サイトの手順通りにインストールすれば使えるんですが,Mac OSX (Snow Leopard) 上で使うにはちょこちょこと落とし穴が...。

というわけで,備忘録として昨日今日の作業履歴をまとめておきましょう。

1. Emuのインストール
公式サイトからMac OS X用ファイルをダウンロード。ダブルクリックして,出てきた指示に従う。
落とし穴1: インストールが済んだら,ターミナルを開いて以下の行を入力。
chmod a+rx /Library/Emu
このおまじないを忘れるとインストールしたDatabaseが見えなくて悩むことになる。
( SourceForge.net: The Emu Speech Database System: Detail: 3023844 - Emu DB list empty : wrong permission settings )

2. Rのインストール
ここはばっさりスキップ。#ってか,PraatとRはインストールしてる人じゃないと,こんなプログラムに興味ないよね。
ただし,Rのインストール後,Rの公式サイト のtoolsのsubdirectoryから
tcltk-8.5.5-x11.dmg
をダウンロードしてインストールしておく。

3. Emu-Rのインストール
(1) Rを立ち上げて,プロンプトから
install.packages ("emu")
と入力。
(2) library (emu)と入力して,パッケージの読み込み。
(3) emulink ()と入力。
落とし穴2: これがうまく機能しない場合には
emulink("/Applications/Emu.app/Contents/lib")
で置き換え。
落とし穴3: この部分,Rでは通るんだけど,R64やRStudioだと通んないんだよな(泣)。

今日の備忘録

1. Rのインストール
まずはRのインストール。
The R Project for Statistical Computing
から[download R]をクリックして,ネットワーク的に近そうな
Hyogo University of Teacher Education
を指定。

[Download and Install R]から[MacOS X]を指定して,latest versionである
R-2.13.0.pkgをダウンロードしたものの,TwitteRがまだ対応していないみたい(でも結局TwitteRは使わなかった)なので,改めて
[old] Previously released R versions for Mac OS X
からR-2.12.2.pkg をダウンロード。

2. IDEのインストール
つづいて最近お気に入りのIDEであるRStudioをダウンロード。こちらは.dmgをダブルクリックしてマウントしたらApplicationsフォルダにドラッグしてインストール。

3. 今回のメイン処理
今回は
Text Data Mining with Twitter and R « Heuristic Andrew
こちらのページを参考にして,とあるハッシュタグを手がかりに英語tweetsの語彙についてまとめてみようという目論見。ページにまとめられているスクリプトをテキストとして保存して,ちょこちょこと条件に合わせて修整したものを保存しておく。

次に必要なXMLとtmという二つのライブラリをインストールする。
右下のボックスの[Install Package]

をクリックして,それぞれのライブラリをインストール。

ここまで済んだら,インストールした二つのライブラリにチェックを入れる。次に[File]-[Open files...]と進んで,さっき編集・保存したスクリプトを読み込んで,コンソールに張り付け。
右下のボックスの[Plots]

をクリックするとそれっぽいグラフが手に入る。

YAPM

Twitterの情報をほげほげしたかったら,おいらの近場でいちばんポピュラなのは多分Rを使う方法。実際にはTwitteRやらのパッケージをかましてなんだけど。

一方でこの間たまたま見つけたYet Another Processing MethodがPython。そもそも

入門 自然言語処理

入門 自然言語処理


でメインに使っていたのもPythonだったと思うのだけれど,昨日届いた
Mining the Social Web

Mining the Social Web


でもメインツールはPython。Macには標準で入ってるし(バージョンがちょっと古いけど),去年からちょこちょことほげってる
初めてのコンピュータサイエンス

初めてのコンピュータサイエンス


に紹介されてる無料のIDE ( Wing IDE 101 v. 4.0.2-1 Installers - Wingware Python IDE http://bit.ly/jkU88D )をセットアップもしてるし,で改めて手すさび。*ちなみにこのIDE有料から無料まで機能に応じて3種類提供されているのでお好きなものを。

さらにさらにとして,OS Xの場合,10.5以降のXの評判があまりよろしくない。というわけで
このへん
( Wing IDE for OS X - Wingware Python IDE http://bit.ly/kKu0TE )
を参考にちょっとだけほげった方が幸せになれるかもしれない。

[2011/05/19補足]そうそう,Pythonのもう一つの魅力はGoogleの公式言語の一つってこともある。

プログラミング Google App Engine

プログラミング Google App Engine