Sensory Japan
お問合せ サイトマップ     英語サイト
Home Whats New 技術 製品 企画・開発 Others 会社概要 代理店 募集
FAQ

 

FAQ (よくある質問)
  よくある質問とこれに対する回答です。参考にしてください。    (2010/3/1)

  ・技術に関して
   Q.不特定話者と特定話者音声認識の違いは?
   Q.パスワード認証とはどのような技術ですか?
   Q.音声認識の認識率は?
   Q.特殊な音(鳴き声、効果音)を認識できますか?
   Q.音声合成とテキスト音声合成の違いは?
   Q.音声合成の原音を録音すファイルフォーマットは
   Q.どのようなマイクロフォンを選べば良いでしょうか? 
 
  ・製品に関して
   Q.NLP-5xとRSC-4xとの違いは?
   Q.RSC464とRSC4128との違いは?
   Q.RSC4xの最低発注数量は?
   Q.RSC4xで音声認識機能を簡単に開発するには何が必要ですか?
   Q.RSC4xを他のCPUで制御する方法は?
   Q.RSC4xにはどのようなインターフェースに対応していますか?
   Q.RSC4xは電池駆動できますか?
   Q.音声認識を使ったシステムを数台作りたいのですがどのようにすれば良いですか?
   Q.FluentSoftの開発手順を押してください。
   Q.BlueGenieの開発手順を教えてください
    その他のご質問は support@sensory.co.jp までご連絡ください。
◆ 技術に関して
Q. 不特定話者と特定話者音声認識の違いは?
A. 不特定話者音声認識はデータベース化された辞書から商品にしようされる認識辞書を事前に作成し商品に組み込むものです。
 これに対して特定話者音声認識は商品の利用者が商品購入後、個人の声で言葉を登録し使用する際にこれと比較させ認識する
 ものです。
Q. パスワード認証とはどのような技術ですか?
A. RSC4xシリーズなどのマイコンICにて対応している技術です。登録された個人の音声パスワードを比較して認証するものです。
 パスワード認証はまず音声パスワードを登録しデータ化します。認証する際はこのパスワードデータと一対一で照合を行い一致率
 を確認するものです。声紋認証とは異なり複数語の特徴登録などを必要としませんので時間がかかりませんが声紋認証ほど精度
 は高くはありません。
Q. 音声認識の認識率は?
A. 音声認識の認識率はいくつかの条件によって変わります。@認識単語、A認識単語数、B認識環境などが主な条件となります。
 RSC4xなどの製品では認識単語は比較的異なるシラブルパターンを持つ単語、認識単語数を10語、室内環境にて評価した場合、
 認識平均値は不特定話者認識で96%〜97%、特定話者認識で97%〜98%です。
 認識率とは認識するべき言葉を認識させ認識一致した場合の割合となります。そのほか認識すべきでない言葉を間違えて認識して
 しまう「誤認識率」、認識すべき言葉を含め何も認識できない「非認識率」などがありますが それぞれの条件にて率が変わります。
Q. 特殊な音(鳴き声、効果音)を認識できますか?
A. 条件によってはできます。特定話者音声認識技術を利用します。登録したものと同じような音パターンであれば認識することがで
 きます。但し、RSC4xの制限で音声帯域から外れるものや音の長さが長いものは認識できない場合があります。
Q. 音声合成とテキスト音声合成(TTS)の違いは?
A. 「テキスト音声合成(TTS)」は発音データベースと発音のための音素データを準備しテキストデータを解析して発音データを作成し
 再生するものです。多くの言葉に対応するには大規模辞書データベースが必要となり大規模なメモリーを必要とします。RSC4xなど
 で使用されている「音声合成」は録音データの圧縮伸張再生です。予めPCなどでデジタル録音された音声データ(または効果音)を
 専用ソフトにて圧縮しデータ化します。これを専用ライブラリーを利用して伸張し再生するものです。そのためテキスト音声合成と
 比べ高音質で低メモリーサイズで開発できます。
Q. 音声合成の原音を録音するファイルフォーマットは?
A. RSCシリーズで使用しているQuickSynthesis4ソフトウェア(音声合成加工ソフト)に読み込めるファイルフォーマットは22KHz、16
 ビット、モノラルのWAVファイルとなります。これ以外のフォーマットは読み込めませんので事前に対応ファイルフォーマットに変換し
 てください。
Q. どのようなマイクロフォンを選べば良いですか?
A. RSCシリーズに使用できるマイクロフォンは汎用のコンデンサマイクロフォンです。感度(Sensitivity)は使用用途および環境により
 異なりますが一般には-40dB〜-44dBとなります。詳細はSelecting Microphone資料をご覧ください。
◆ 製品に関して
Q. NLP-5xとRSC-4xとの違いは?
A. NLP-5xとRSC-4xの違いを列挙します。
 NLP-5xは16bitDSPをコアとする音声処理専用プロセッサ、RSC-4xは8bitマイコンをコアとした音声認識合成プロセッサです。
 RSC-4xで対応していた音声処理以外に新たにコンプレックスグラマー、テキスト音声合成、サイレントソニックネットなどに対応しています。
 NLP-5xはRSC-4xの約5倍処理能力を持ったプロセッサです。
 ハードウェア面でもNLP-5xはRSC-4xと比較しより多くのメモリー空間、I/O本数、インターフェース、ステレオ出力などに対応しています。
Q. RSC464とRSC4128との違いは?
A. RSC464とRSC4128の違いを列挙します。
 RSC464は内部マスクROM専用で外部メモリーバスはありません。内部マスクROM領域は64Kバイトです。I/Oは16本です。
 RSC4128は内部マスクROM領域が128Kバイトですが外部メモリー設定にて8Mバイトを接続することができます。I/Oは24本です。
Q. RSC4xの最低発注数量は?
A. RSC464とRSC4128をマスク生産するため最低発注数量は8000個となります。RSC464はマスク専用のため8000個の発注が必要
 です。RSC4128を外部メモリー使用で利用する場合の購入数量はトレイ単位となります。
Q. RSC4xで音声認識機能を簡単に開発するには何が必要ですか?
A. 簡単に開発をするには「VRStampツールキット」が準備されています。本キットには開発に必要な基板一式、開発ソフトウェア一式
 が含まれています。基板は認識動作を確認できるVRStampモジュールとプログラマーボードがまた開発ソフトウェアにはRSC4x用
 コンパイラー(簡易版)とQuickT2SI簡易版が含まれていますのでRSC4xのほぼ全ての機能を確認することができます。実際の開発
 には@基板(VRStampやRSC4xデモボード等)、ARSC4x開発キット、BQuickT2SIツールキット(不特定話者を機能を開発する場合)
 が必要です。
Q. RSC4xを他のCPUで制御する方法は?
A.可能です。ただし、標準では制御用の通信ポートがありませんのでアプリケーションプログラムを作成する必要があります。
Q. RSC4xにはどのようなインターフェースに対応していますか?
A. RSC4xには標準インターフェースが準備されていません。ライブラリーとして準備されているものはRS232準拠のシリアル通信ライブ
 ラリーのみです。ポートはI/O端子にアサインされます。独立ポートではないため音声処理中の通信はできません。パラレルインター
 フェースなどは個々にアプリケーションプログラムで作成する必要があります。
Q. RSC4xは電池駆動できますか?
A. 可能です。RSC4xマイコンICの動作電圧は3Vです。通常動作時は5〜10mA消費します。またマイク素子も数mA消費しますので連続
 動作をすると長い時間は持ちませんのでその場合は外部DC入力などが必要となります。
Q. 音声認識を使ったシステムを数台作りたいのですがどのようにすれば良いでしょうか?
A. 「VRStampツールキット」を利用することをお奨めします。RSC4xマイコンICはQFPパッケージなので実装する基板の作成が必要です。
 またマイク入力基板設計等にも注意が必要ですがVRStampモジュールであれば電源、マイク素子、スピーカーを接続すれば簡単に
 音声認識機能を利用できます。追加でVRStampモジュールを購入できます。もしソフトウェア開発が不安というお客様はサンプルソフト
 作成のサポートも行っておりますのでご相談ください。
Q. FluentSoftの開発手順を教えてください。
A. FluentSoftにはSDK製品が準備されていますのでSDK製品をご購入ください。SDKを開発環境に組み込み準備されたAPIを利用して
 認識処理を行います。尚、SDK製品は対応OS毎にシリーズがありますので購入前にご確認ください。尚、標準付属される不特定話者認識
 言語はUS英語となります。
Q. BlueGenieの開発手順を教えてください。
A. BlueGenieは専用開発サポートの必要な製品です。そのためまず機密保持を締結していただきサンプルを評価していただきます。
 実際の開発をご希望の方は開発契約書を締結していただき提供されるBlueGenieソフトウェアをCSR社の開発ツールの指定ディレクトリに
 組み込んでいただくことで開発できます。ヘッドフォンなど音声認識に関する音響調整の必要な開発品はセンサリ社からのサポートを受け
 ることができます。
その他のご質問は support@sensory.co.jp までご連絡ください。



Home | What's New | 技術 | 製品 | 企画・開発 | Others | 会社概要 | 代理店 | 募集 | お問合せ | FAQ | サイトマップ

Contents Copyright Sensory Japan 2002-2012 All Rights Reserved.
PDFファイルを閲覧するためには、 Adobe Acrobat Readerを予めインストールしておく必要があります。