酢ろぐ!

カレーが嫌いなスマートフォンアプリプログラマのブログ。

音声認識あれこれ:Google音声検索からJuliusまで

Googleの音声検索アプリが話題に上がっていたので、Windows Mobile版のを探したのですが見つける事が出来ませんでした。無ければ自分で作ってみようと音声検索のWebAPIを探したのですがこちらも見つけられませんでした。辞書と解析はサーバーサイドにあると思ったのですが………

その事をTwitterでボヤいていたら、@gorn さんにオープンソースの音声認識ライブラリに"Julius"というのがあるのを教えて頂きました。

これはすごそう……

Julius は,音声認識システムの開発・研究のためのオープンソースの高性能な汎用大語彙連続音声認識エンジンです.数万語彙の連続音声認識を一般のPC上でほぼ実時間で実行できます.また,高い汎用性を持ち,発音辞書や言語モデル・音響モデルなどの音声認識の各モジュールを組み替えることで,様々な幅広い用途に応用できます. Juliusはオープンソースソフトウェアで,ソースコードを含めてどなたでもフリーで入手することができます.

GitHub - julius-speech/julius: Open-Source Large Vocabulary Continuous Speech Recognition Engine

Windows phone系としては、名古屋大学の板倉研(?)で開発していたWindows CE向けの「Pocket Julius」がありますが、ソースコードがなく残念でした。そのまま流用しようというのは甘い考えでしたか……

このパッケージは大語彙音声認識デコーダ Julius を Microsoft Pocket PC 2002 環境で動くようにした Pocket Julius のデモパッケージです.

http://www.sp.m.is.nagoya-u.ac.jp/~hara/soft/pj/index.html

C#で扱いやすくするラッパーライブラリを開発されている方もいました。

「ハイカラ音声認識」をC#で利用できるようにラップしたもの。
C#やVisual Basicなどの.Netのプログラミング言語からフリーの音声認識エンジン「ハイカラ音声認識」を制御するためのライブラリです。ハイカラ音声認識は内部で「Julius」を利用している。

http://www.saturn.dti.ne.jp/~npaka/robot/julius/index.html

今リリースされているWindowsのコードをWindows Mobile用ライブラリとしてビルド出来るかなぁ……