酢ろぐ!

カレーが嫌いなスマートフォンアプリプログラマのブログ。

音声認識あれこれ Google音声検索からJuliusまで

Googleの音声検索アプリが話題に上がっていたので、Windows Mobile版のを探したのですが見つける事が出来ませんでした。無ければ自分で作ってみようと音声検索のWebAPIを探したのですがこちらも見つけられませんでした。辞書と解析はサーバーサイドにあると思ったのですが………

その事をTwitterでボヤいていたら、@gorn さんにオープンソース音声認識ライブラリに"Julius"というのがあるのを教えて頂きました。

@ch3cooh オープンソース音声認識"Julius"をWindows CEにポートした実装 //bit.ly/7CQVBI が完全クライアントサイドの認識をやっていますが昔のものに加えて辞書のチューンが十分でないのか精度は散々です。

Twitter / gorn: @ch3cooh オープンソースの音声認識"Juli ...

これはすごそう……

Julius は,音声認識システムの開発・研究のためのオープンソースの高性能な汎用大語彙連続音声認識エンジンです.数万語彙の連続音声認識を一般のPC上でほぼ実時間で実行できます.また,高い汎用性を持ち,発音辞書や言語モデル・音響モデルなどの音声認識の各モジュールを組み替えることで,様々な幅広い用途に応用できます. Juliusはオープンソースソフトウェアで,ソースコードを含めてどなたでもフリーで入手することができます.

大語彙連続音声認識エンジン Julius

Windows phone系としては、名古屋大学の板倉研(?)で開発していたWindows CE向けの「Pocket Julius」がありますが、ソースコードがなく残念でした。そのまま流用しようというのは甘い考えでしたか……

このパッケージは大語彙音声認識デコーダ Julius を Microsoft Pocket PC 2002 環境で動くようにした Pocket Julius のデモパッケージです.

Pocket Julius

http://www.sp.m.is.nagoya-u.ac.jp/~hara/soft/pj/demo.html

C#で扱いやすくするラッパーライブラリを開発されている方もいました。

「ハイカラ音声認識」をC#で利用できるようにラップしたもの。
C#Visual Basicなどの.Netのプログラミング言語からフリーの音声認識エンジン「ハイカラ音声認識」を制御するためのライブラリです。ハイカラ音声認識は内部で「Julius」を利用している。

Juliusメモ

今リリースされているWindowsのコードをWindows Mobile用ライブラリとしてビルド出来るかなぁ……