すらねく!-GUI,音声認識部分

どうも、RSです。
今回は先輩方が先に投稿されていてご存知であろうコンフェス2016(ComputerFestival in 大島)に関する記事になります。
先輩方の流れに乗って記事を書いておこうと思いますのでよろしくお願いします。

さて、今回私はコンフェスのソフトウェア部門に黒雨と連名で「すらねく! -Slide will be Next-」を提出する予定です。
ここで、RSの書いた記事を読み返すとなぜか「すらねく!」が既に出ています。
何故なのか…
そう、使い回しです。
とは言いましても、一応の改良を加えて提出する予定ですので安心して下さい。

概要

では、具体的に何を改良するかと言いますと画像認識と音声認識です。
そこで、私は音声認識の改良を担当することになりました。担当が決まったのが12月の事です。
この段階で画像認識はある程度できており改良するという作業が正しいです。
しかし、音声認識はこの段階で一切行われておらず、音声を録音する機能しかない段階でした。
その上、私はもともとGUIの担当だった為、音声認識は最初から作るということで改良と言うより機能追加が正しいのです。

進捗

まあ、そんな愚痴をこぼしつつJuliusを使用して音声認識を開発しています。
現状の進捗は60%ほどで、後は音声から単語を分類して本ソフトに送るという段階です。

解説

では、「すらねく!」と音声認識について少し解説します。
「すらねく!」はプレゼンテーション支援ソフトで、プレゼン練習を撮影、録音して両面からサポートを行うというものです。
具体的には撮影によってプレゼン発表者が正面を向いて発表できているか、録音によってプレゼンの読み上げに感嘆詞「えー、あー、etc.」が入ってしまっていないかをチェックしてフィードバッグを得るというものです。
その中で、音声認識ではJuliusを用いて感嘆詞を入力した際にそれを検出し、本処理に感嘆詞を検出した回数を送るという処理を行っています。

まとめ

現状、Githubでのオープンソース公開は行っておりませんが、コンフェス会場でソフトを見てもらうことが早いと思います。
よろしくお願いします。


コメントを残す

メールアドレスが公開されることはありません。

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください