outline_iptalk9t67.html

171231


IPtalk9t67の変更点の概要

戻る


2018年1月1日版

sfx_iptalk9t67VR.exe (33,244KB)
(VR: Voice Recognition、音声認識)
(音声認識関係ほかのDLLや説明書と例題などの同梱版)
(ViaSkypeや、httpサーバーなど、全てのDLLを同梱)

・パソコン要約筆記用
sfx_iptalk9t67.exe (1,355kB)
(IPtalk本体のみ)
(説明書やDLLなどなし)

上の2つは、IPtalk本体は両方とも共通です。
同梱されているファィルのみの差です。

・IPtalk9t67説明書PDF (23,585kB)
sfx_iptalk9t67VRに同梱している説明書PDFと同じです。
(必要な例題などはsfx_iptalk9t67VRに同梱しています)

180101
・Julius音声認識キットが使えるようになりました。
Juliusは京都大学、名古屋工業大学などが研究・開発している音声認識エンジンで、C言語で書かれているオープンソースソフトウェアで、商用利用への制限もないオープンライセンスのため、Juliusの研究成果は、多くの音声認識システムで利用されています。
研究用であるため、従来は、私たちのようなパソコン要約筆記者・PCテイカーが利用するのは難しかったのですが、今回、「話し言葉音声認識キット」と「講演音声認識キット」が公開され、さらに辞書登録ツールが開発公開されるなど、使い勝手が一気に良くなり、情報保障への適用も期待できるようになりました。
IPtalkから利用する場合は、マニュアル通りに操作すれば、すぐに使うこともできますが、元々が研究用のシステムであるため、そのようなアプローチの方が、よりJulius本来の良さが出るとは思います。

・2017年4月に公開したGoogle音声認識を情報保障に適用するトライの中間まとめを書きました。
トライのために多くの機能を追加しました。追加した機能の中で、従来のIPtalkの考え方(人が操作する)と異なるのは「ロール2自動訂正」機能です。「ロール2」に「訂正ルール」を読み込ませておくとIPtalkが自動的に訂正します。

・音声合成ソフトSofTalkで練習問題を読み上げることができるようにしました。
入力練習や、音声認識の訂正作業の練習を、より実践的に繰り返し練習することができます。元々は、訂正係りの訂正速度を再現性よく計測するために作りました。

・Google音声認識とJulius音声認識を「1人の訂正係りで訂正できる場合の話す速度」という基準で評価した結果を説明書に書きました。
「例題1」の音声データを使った場合のみの限られた条件で、評価基準も私案で行った結果ですが、参考にしてください。
説明書のP234「4.1.2.6) Juliusの連続音声認識の性能」に記載しました。

・同梱した説明書は、IPtalk9t66VRで同梱したチュートリアルも新しい機能で全面的に書き換えています。
前に読んだことがある人も、もう一度、軽く目を通していただけるとありがたいです。



入力関係 (音声認識)


Julius音声認識

【概要】
・Julius音声認識キットの音声認識文をIPtalkに表示することができます。

・Julius音声認識キットは京都大学、名古屋工業大学などが研究開発している無料で利用できる音声認識です。

・パソコン内で動作するためインターネットに接続する必要がありません。

・Julius用辞書登録ツール「dictool.exe」が公開されたので、一気に使い勝手が良くなり、高い認識率が期待できます。

【説明書】 以下を参照してください。
P161「4.1.2) Julius (京都大学などが研究開発した音声認識)」

入力関係 (音声認識)
Google音声認識

「FSG」ウィンドの「DLL-2」ページの
「Google Chromeの音声認識」枠

@「他のIPtalkの確認修正パレットへも送信」チェック

A「認識文を入力部カーソル位置に挿入」チェック
【概要】
@「他のIPtalkの確認修正パレットへも送信」チェックを入れると、「音声認識パソコン」で「訂正係り」をしつつ、他の「訂正係り」のパソコンに認識文を送信するこができます。

【説明書】 以下を参照してください。
P231「4.1.2.5.4) 2人の「訂正係り」で、パソコンを「音声認識用・訂正用」と「訂正用」「表示用」の3台の時」

A「認識文を入力部カーソル位置に挿入」チェック入れると、Google音声認識した文をメインウインドの「入力部」のカーソル位置に挿入します。
音声認識とキーボード入力のハイブリット入力ができます。

【説明書】 以下を参照してください。
P70「4.1.1.2) 音声認識で字幕を出してみる」

訂正関係 (音声認識)

「テンプレート前ロール」ウィンドの

「ロール2自動修正機能」
【概要】
・ロール2に訂正ルールを読み込むと、ルールに従って認識文などを自動訂正する機能です。
・Googleの音声認識の欠点の @単語登録ができない。A句読点「。」「、」が入らない。を補完するために機能を追加しました。

・Juliusの音声認識文やIP音声の認識文や、「テンプレート前ロール」でF1キーで流した文や、入力部の入力文なども自動修正の対象に指定できます。
【説明書】 以下を参照してください。
P367「4.2.3)ロール2自動訂正」
訂正関係 (音声認識)

「テンプレート前ロール」ウィンドの
「ロール1 F4訂正」機能
【概要】
・「読み原稿」がある場合に「訂正ルール」を簡単に登録できる「ロール1F4訂正」機能を追加しました。

【説明書】 以下を参照してください。
P303「4.2.2)ロール1F4訂正機能 」


訂正関係

「テンプレート前ロール」ウィンドの

「ロール3で表示訂正送信」機能の改良
【概要】
・F6キー、Shift+F6キーで訂正送信する時、訂正部分の範囲指定ができるようにしました。
・Ctrl+F6キーで「暫定表示後確定送信」機能が使えるようにしました。

【説明書】 以下を参照してください。
P334「4.2.4)ロール3F6表示修正とF5ルビ送信」

練習機能

練習リモコン

「SofTalkで読み上げる」チェック
【概要】
・音声合成ソフトSoftalkで練習文を読み上げながら、練習リモンコで入力練習ができます。

【説明書】 以下を参照してください。
P366「4.3.1) 「練習リモコン」で音声合成を使う」

練習機能

「原稿前ロール」の
「前ロールA自動流し」枠の

「SoftTalkでBを同期して読み上げ」チェック
【概要】
・音声合成ソフトSoftalkで練習文を読み上げながら、訂正の練習ができます。
・読み上げる練習文と「ロール1」に入る文に時間差をつけることで、「聞き溜め」をしながらの実践的な「ロール1」訂正の練習ができます

【説明書】 以下を参照してください。
P382「4.3.2.2) 「原稿前ロール」の練習機能で音声合成を使う」


入力補助機能

「サブ入力ウィンドウ」の
「ルビ送信」ページの

「読みを( )で囲って表示」チェック
【概要】
・チェックを入れると、「ルビ送信」ボタンを押した時に、「元文(ルビ)」というようにカッコで囲ってルビを付けることができます。

【説明書】 以下を参照してください。
P351「4.2.4.2.1) 「読みを( )で囲って表示」する方法」

入力補助機能

「入力2」ページの
「「。」「?(全角のみ)」で空行を流す」枠の

「テンプレート前ロールでも流す」チェック
【概要】
・チェックを入れると、テンプレート前ロールで「F1キー」で表示に流した時に、「。」で空行を流します。「全角「?」も」チェックを入れると、「?」でも空行を流します。

【使い方】
音声認識文に「。」を訂正ルールで追加する場合、「ロール1」でF1で流す時に、空行を入れる操作が不要になります。
【説明書】 以下を参照してください。
P17「1.1.5)「入力2」ページの「「。」「?(全角のみ)」で空行を流す」枠に追加された「テンプレート前ロールでも流す」チェック」

参考文献のリンク
・Juliusの実用例に関する文献

・「聴覚障害者のための講演・講義の音声認識による字幕付与」
http://sap.ist.i.kyoto-u.ac.jp/members/kawahara/paper/KAW-ASJ18.pdf

・「音声認識を用いた自動字幕作成システム」
http://caption.ist.i.kyoto-u.ac.jp/





【古いバージョンの概要】
IPtalk9t66の概要
IPtalk9t65の概要
IPtalk9t64の概要
IPtalk9t63の概要